Generative Künstliche Intelligenz entwickelt sich rasant – und wer hat neben dem Tagesgeschäft schon die Zeit, alles im Blick zu behalten? Für uns gehört es zum Job, Entwicklungen zu verfolgen, zu filtern und einzuordnen, damit wir Sie fundiert beraten können.
Wir dachten uns: Vielleicht ist es für Sie spannend, direkt von unseren Recherchen zu profitieren. Hier finden Sie unsere Highlights der letzten zwei Wochen – handverlesen, kompakt und mit Links für alle, die tiefer einsteigen möchten. Dieses Format ist neu, und wir freuen uns über Ihr Feedback, damit wir es optimal für Sie weiterentwickeln können. Viel Spaß beim Lesen!
Business-Highlights
Das Big Picture
Die letzten Wochen im KI-Business waren geprägt von Donald Trumps Besuch in Großbritannien mit großen Investitionsankündigungen in Hardware und Rechenzentren [1], von Debatten über die Sicherheit von ChatGPT beim Jugendschutz [2], einer vorläufigen Einigung zwischen Microsoft und OpenAI, die den Weg für eine Umstrukturierung von OpenAI in eine gewinnorientierte Gesellschaft ebnen soll [3], sowie einem für viele überraschenden Deal zwischen Intel und Nvidia [4].
OpenAI for Germany
SAP bringt gemeinsam mit OpenAI eine speziell auf Deutschland zugeschnittene Plattform für Unternehmen und öffentliche Verwaltung an den Start. Sie ermöglicht den Zugriff auf OpenAI-Modelle unter europäischer Cloud-Infrastruktur [5]. Kritiker merken jedoch an, dass eine Lösung, die auf OpenAI-Technologie und Microsoft Azure setzt, nicht unbedingt zu echter digitaler Souveränität beiträgt [6].
Kalifornien verschärft die KI-Regulierung
Gouverneur Gavin Newsom hat mit SB 53 ein umstrittenes KI-Gesetz unterzeichnet. Es verpflichtet große KI-Unternehmen zu Risikoberichten, Transparenzpflichten und einer Meldung sicherheitsrelevanter Vorfälle. Das Gesetz gilt als Signal, dass der regulatorische Druck auf die großen KI-Anbieter zunimmt [7]. Die Tech-Konzerne wehren sich allerdings: Meta etwa hat ein politisches Aktionskomitee ins Leben gerufen, um die künftige KI-Regulierung in den USA aktiv mitzugestalten [8].
Beschwerde gegen Googles KI-Zusammenfassungen
Laut Heise haben eine Allianz deutscher Medienhäuser und mehrere NGOs bei der Bundesnetzagentur Beschwerde gegen Googles KI-Zusammenfassungen („AI Overviews“) eingereicht. Sie kritisieren Reichweitenverluste, mangelnde Transparenz und eine Gefährdung der Medienvielfalt durch KI-generierte Suchergebnisse und fordern ein EU-Verfahren nach dem Digital Services Act (DSA) gegen Google [9].
Neue Geschäftsmodelle für Trainingsdaten und Verlage
Passend zur vorherigen Meldung geht es hier gleich mehrfach um die Frage, ob und wie die Tech-Konzerne auf die begehrten Daten der Medienhäuser zugreifen dürfen. So verhandelt Microsoft laut Axios mit US-Verlagen über einen KI-Marktplatz („Publisher Content Marketplace“), auf dem Inhalte für Produkte wie Copilot lizenziert und vergütet werden könnten [8].
Perplexity geht mit Comet Plus – einem kostenpflichtigen Premium-Angebot seines Browsers, das direkten Zugriff auf hochwertigen Journalismus bietet und teilnehmende Verlage für die Nutzung ihrer Inhalte kompensiert – in eine ähnliche Richtung [10].
Einen kuriosen Weg zum Datensammeln ging die App „Neon“. Sie lockte Nutzer damit, ihre Telefongespräche aufzuzeichnen und dafür bezahlt zu werden. Doch die Aufnahmen, Transkripte sowie Telefonnummern der Nutzer waren ungeschützt im Internet abrufbar. Nach Bekanntwerden des massiven Datenschutzlecks nahm der Anbieter die Plattform kurzfristig offline [11].
Wohl eher als langfristige Perspektive schlägt der Erfinder des World Wide Web, Tim Berners-Lee vor, dass für das Training von KI-Modellen künftig Mikropayments fließen sollten – winzige Beträge pro genutztem Inhalt, direkt an die Urheber gezahlt, um eine fairere Wertschöpfung zu ermöglichen [12].
Software-Highlights
Die agentischen Browser kommen
Der von Perplexity entwickelte Browser Comet, bisher nur für Perplexity-Max-Kunden verfügbar, kann nun von allen frei heruntergeladen und genutzt werden [13]. Er überzeugt durch beeindruckend schnelles und präzises Question Answering und hat das Potenzial, unser Surfverhalten grundlegend zu verändern – definitiv einen Blick wert. Max-Kunden erhalten zusätzlich exklusiv einen intelligenten E-Mail-Assistenten, der Posteingänge automatisiert verwaltet, Antworten entwirft und Prioritäten setzt [14].
Google will sich die Butter nicht vom Brot nehmen lassen und rüstet Chrome mit der Integration von Gemini um ähnliche Funktionen auf [15], [16]. Der KI-Assistent wird direkt in die Adressleiste integriert, versteht den Kontext offener Tabs, findet Referenzen in YouTube-Videos und kann bereits besuchte Seiten wiederfinden. Der Rollout startet für Mac- und Windows-Nutzer in den USA – wir müssen uns also noch etwas gedulden. Eine Vorschau zeigt folgendes Video: [17].
ChatGPT Pulse – die proaktive KI
Vom im Juli angekündigten Browser von OpenAI ist bisher nichts zu hören. Stattdessen bringt das Unternehmen nun ChatGPT Pulse auf den Markt – ein Produkt für proaktive, personalisierte Recherchen, die als Updates direkt auf dem Mobilgerät erscheinen [18].
Image Editing
Für den Bereich Image Editing lohnt sich ein Blick auf das neue Reve [19] und Google Gemini 2.5 Flash Image (aka Nano Banana) [20], welches nun auch direkt in Photoshop integriert ist [21].
Sonstiges
Weitere Produktupdates gab es von Microsoft (Copilot nutzt jetzt auch Anthropic-Modelle [22]), Gamma (agentische Erstellung von Powerpoints [23]) und Synthesia (Version 3.0 mit Echtzeit Video-Avataren [24] – da sind wir sehr gespannt, vielleicht entsteht hier eine Alternative zu HeyGen).
Hardware-Highlights
Die KI-Brillen gehen in die nächste Runde
Neben der zweiten Generation der KI-Brillen Ray-Ban Meta (Gen 2) und Oakley Meta Vanguard präsentiert Meta eine KI-Brille mit Display und passendem Armband zur Gestensteuerung [25].
Einem Bericht von Bloomberg [26] zufolge verstärkt auch Apple die Entwicklung eines ähnlichen Produkts – offenbar auf Kosten der nächsten Generation der Apple Vision Pro.
OpenAIs Hardware-Ambitionen
Die Gerüchte verdichten sich: OpenAI soll laut Medienberichten [27] gemeinsam mit Ex-Apple-Chefdesigner Jony Ive an mehreren eigenen Hardware-Produkten arbeiten – darunter ein smarter Lautsprecher, eine smarte Brille, ein Voice Recorder sowie ein tragbarer „Pin“. Dafür versucht das Unternehmen offenbar, Zulieferer und Fachkräfte von Apple abzuwerben.
Amazon Alexa+
Auch Amazon hat neue Hardware vorgestellt, die in den USA einen Early Access auf die bereits im Februar angekündigte Alexa+-Plattform ermöglicht [28]. Ob es Amazon damit gelingt, endlich eine ernstzunehmende Plattform jenseits von Tierstimmen- und Pupsgeneratoren aufzubauen, bleibt abzuwarten – wetten würden wir darauf nicht.
Alterego
Ebenfalls würden wir nicht darauf wetten, ob und wann das aus dem MIT Media Lab stammende Wearable Alterego marktreif wird. Ein Ankündigungsvideo [29] zeigt bereits die Vision: Ein nicht-invasives Gerät soll mithilfe neuronaler Schnittstellen „stille Sprache“ erkennen und die Signale, die vor dem Sprechen an die Sprachmuskulatur gesendet werden, in natürliche Sprache umwandeln und an die KI schicken.
KI-Modell-Highlights
Anthropic Claude Sonnet 4.5
Anthropic hat Claude Sonnet 4.5 veröffentlicht und sich damit wieder den Spitzenplatz bei den Coding-Modellen zurückerobert [30], aber OpenAI bleibt mit einem Upgrade zum Codex-Modell nicht untätig [31].
OpenAI Sora 2
OpenAI hat bei den Videomodellen nachgelegt, mit der Veröffentlichung von Sora 2 [32] den kompletten Hype auf sich gezogen. Dies überschattet die ebenfalls beeindruckenden Videomodell-Updates der Konkurrenz (Ray 3 [33], [34], Kling 2.5 [35] und WAN 2.5 [36]). OpenAIs Sora 2-Modell kann aktuell nur in den USA und mit Einladung genutzt werden, generierte Videos zeigen aber deutlich, welchen Sprung das Modell beim physikalischen Verständnis und der Konsistenz der Charaktere gemacht hat – bei einer Szenenlänge von bis zu 20 Sekunden.
Die Sora-2-App von OpenAI wurde als innovatives Social Network entwickelt und versteht es offenbar, Nutzer zu fesseln. Besonders spannend: Mit dem Feature „Cameo“ können Anwender eigene Avatare erstellen, in KI-generierten Szenen einsetzen und sogar für andere freigeben. Die dadurch möglichen Missbrauchsszenarien – etwa die Nachbildung geschützter Charaktere oder Prominenter ohne Zustimmung – haben intern wie extern für Kritik gesorgt [37]. Der Schritt könnte dennoch strategisch klug sein: Sora 2 stärkt so die Nutzerbindung und eröffnet neue Wege zur Monetarisierung. Einnahmen daraus könnten laut CEO Sam Altman langfristige, ambitionierte Projekte von OpenAI finanzieren [38]. Um der Kritik zu begegnen kündigt OpenAI an, granulare Opt-in-Kontrollen einzuführen, damit Rechteinhaber selbst bestimmen können, ob ihre Figuren und Inhalte genutzt werden dürfen [39].
IBM Granite 4.0
Etwas abseits vom Mainstream finden wir ein weiteres Modell spannend: IBM positioniert Granite 4.0 für Unternehmensanwendungen und kombiniert dafür eine hybride Mamba-2/Transformer-Architektur, die besonders effizient mit sehr langen Kontexten wie Verträgen, technischen Dokumenten oder Code umgeht. Trotz kleinerer Modellgrößen erreichen die neuen Varianten laut Benchmarks Leistungen, die mit deutlich größeren Modellen konkurrieren – bei teils über 70 % weniger Speicherbedarf. Dank der Apache 2.0-Lizenz lassen sich die Modelle frei anpassen und in eigene Produkte integrieren [40].
Google VaultGemma
VaultGemma [41] ist ein neues Open-Source-Sprachmodell von Google Research, das vollständig mit Differential Privacy (DP) trainiert wurde – einer Technik, die gezielt Rauschen ins Training einfügt, damit sich aus dem Modell nicht ableiten lässt, ob einzelne Personen in den Trainingsdaten enthalten waren. Google will damit helfen, Datenschutz, Rechenaufwand und Modellqualität besser auszubalancieren. Von der Qualität kommt VaultGemma zwar noch nicht an konventionelle Modelle heran, aber es zeigt, wie sich Datenschutz und KI-Training zunehmend miteinander verbinden lassen.
Weitere Modelle
Die anderen Labs waren auch nicht untätig, warten diesmal aber eher mit inkrementellen Updates ihrer Modelle auf: Google mit Verbesserungen bei Gemini 2.5 Flash und Flash-Lite [42], xAI mit Grok 4 Fast mit deutlichen Effizienzsteigerungen [43], Alibaba mit einem breiten Upgrade von Qwen3 [44], [45], [46], und DeepSeek mit dem auf Agenten optimierten Modell V3.1-Terminus [47].
Entwickler-Highlights
Bei der Entwicklungsinfrastruktur dreht sich vieles um Agenten (wer hätte es gedacht).
Neue Agent-SDKs
Zwei neue Agent-SDKs erweitern den ohnehin schon beachtlichen Zoo bestehender Frameworks: Microsoft hat mit dem Agent Framework ein neues Open-Source-Toolkit vorgestellt, das die bisherigen Projekte Semantic Kernel und AutoGen vereint und gezielt auf produktive, unternehmensreife Multi-Agenten-Anwendungen ausgerichtet ist [48]. Anthropic macht mit dem Claude Agent SDK erstmals die Agenten-Infrastruktur hinter Claude Code für alle verfügbar [49].
Protokolle für Zahlungen
Sowohl Google als auch OpenAI machen sich Gedanken zu Zahlungen mit Agents: OpenAI startet mit Instant Checkout einen praktischen Einstieg in agentischen E-Commerce direkt in ChatGPT: Nutzer in den USA können schon jetzt Produkte kaufen (z. B. bei Etsy, bald Shopify), Zahlungen laufen über hinterlegte Karten, und das offene Agentic Commerce Protocol (ACP) soll Händleranbindung und Datenschutz vereinfachen [50].
Google setzt mit dem Agent Payments Protocol (AP2) stärker auf die Infrastruktur-Ebene: ein offener, zahlungsunabhängiger Standard mit kryptografischen Mandaten, der Agenten sichere, nachvollziehbare Käufe über verschiedene Zahlungssysteme hinweg ermöglicht [51].
Die beiden Ansätze stehen nicht im Widerspruch: OpenAI liefert die nutzernahe Checkout-Experience im Chat, Google baut mit AP2 die zugrunde liegende Zahlungsinfrastruktur.
Sonstiges
In der Developer-Beta von macOS Tahoe 26.1 führt Apple eine MCP-Integration von App Intents ein, um KI-Agenten auf dem Mac, dem iPhone und dem iPad systemweit den Zugriff auf App-Funktionen zu ermöglichen [52].
OpenAI führt die Responses API ein mit verschiedenen Optimierungen für Agenten, wie beispielsweise „Persisted Reasoning“: Das Modell merkt sich seinen Denkprozess über mehrere Schritte hinweg, anstatt alles nach jeder Antwort zu vergessen [53].
Das war unser Überblick der letzten Wochen rund um generative KI. Wir hoffen, Sie konnten ein paar spannende Impulse mitnehmen. Wir freuen uns sehr über Ihr Feedback zu diesem Format.