Logo für das KI Highlights Briefing von THINKING LABS
Blogbeitrag

KI Highlights Briefing - 2025/04

Eleven Labs lizenziert KI-generierte Stimmen berühmter Persönlichkeiten, Apple nutzt Google Gemini für Siri und NotebookLM hat ein großes Update erhalten - unser Experte Stephan Kurpjuweit erklärt im KI Highlights Briefing von THINKING LABS, was sich in den vergangenen beiden Wochen im Bereich der Künstlichen Intelligenz getan hat.

Von Stephan Kurpjuweit - 17. November 2025

Generative Künstliche Intelligenz entwickelt sich rasant – und wer hat neben dem Tagesgeschäft schon die Zeit, alles im Blick zu behalten? Für uns gehört es zum Job, Entwicklungen zu verfolgen, zu filtern und einzuordnen, damit wir Sie fundiert beraten können.

Wir dachten uns: Vielleicht ist es für Sie spannend, direkt von unseren Recherchen zu profitieren. Hier finden Sie unsere Highlights der letzten zwei Wochen – handverlesen, kompakt und mit Links für alle, die tiefer einsteigen möchten. Dieses Format ist neu, und wir freuen uns über Ihr Feedback, damit wir es optimal für Sie weiterentwickeln können. Viel Spaß beim Lesen!

Die letzten beiden Wochen war viel los. Steigen wir gleich ein:

Business-Highlights

Nvidia in der Zwickmühle

Beide Supermächte verschärfen die Regeln: Die USA verbieten Nvidia den Verkauf neuer KI-Chips nach China, während Peking ausländische Chips in staatlich geförderten Rechenzentren verbietet. Nvidia rechnet nun mit keinen Umsätzen mehr aus China und sieht sich als Kollateralschaden der geopolitischen Spannungen, während chinesische Chip-Hersteller von staatlicher Unterstützung und einer geschützten Nachfrage profitieren [1]. Nvidia wir dies bei der aktuellen Nachfrage im Rest der Welt verkraften, aber mittelfristig kann das Heranwachsen chinesischer Konkurrenz im geschützten Raum für das Unternehmen durchaus zum Problem werden.

EU-Regulierung

Die EU-Kommission will die Einführung des AI Acts verschieben und wesentliche Teile der Regulierung vereinfachen. Ziel dabei ist, Wirtschaft und Innovation weniger zu belasten und auf Umsetzungsprobleme zu reagieren. Die Details sind jedoch noch in Abstimmung. [2] Damit liegt die EU-Kommission auf einer Linie mit der Bundesregierung, die in einem Positionspapier ebenfalls eine Entbürokratisierung des AI-Acts fordert [3].

Es gibt jedoch auch eine gegenläufige Bewegung zu mehr Regulierung: Ein Ausschuss des EU-Parlaments fordert, dass wesentliche Personalentscheidungen am Arbeitsplatz (Kündigungen, Einstellungen und Gehaltsveränderungen) nicht allein von KI- oder algorithmischen Systemen getroffen werden dürfen. Eine Abstimmung des Plenums folgt im Dezember [4].

Apple nutzt Google Gemini als KI-Engine für Siri

Apple plant, für die Integration von Googles Gemini in die Sprachassistentin Siri jährlich etwa eine Milliarde US-Dollar auszugeben. Der Deal ist laut Bloomberg [5] nahezu abgeschlossen und sieht vor, dass Google als technischer Anbieter im Hintergrund agiert, ohne sichtbare Erwähnung in Siri. Die Integration soll Siri schon ab dem Frühjahr 2026 vorerst als Zwischenlösung modernisieren, bis Apple selbst eigene KI-Modelle mit ähnlicher Leistungsfähigkeit entwickelt hat [6].

Yann LeCun verlässt Meta und baut World Models

KI-Urgestein und Turing-Preisträger Yann LeCun, aktuell noch Meta’s Chief AI Scientist, plant laut Medienberichten [7], Meta zu verlassen, um ein eigenes KI-Startup mit Fokus auf „World Models“ zu gründen. World Models sind KI-Modelle, die eine abstrakte Repräsentation der Umwelt lernen, um zu planen und Handlungen mental zu simulieren. Ein World Model kann beispielsweise „im Kopf“ simulieren, was passieren würde, wenn sich ein Roboterarm bewegt ohne echte Versuche durchzuführen [8]. LeCuns Abschied fällt in eine Phase tiefgreifender Umstrukturierungen bei Meta im KI-Bereich, nachdem die Llama-4-Modelle hinter Konkurrenzprodukten zurückblieben.

LeCun ist nicht der einzige KI-Pioneer, der auf World Models setzt: World Labs, das von der Stanford-Forscherin Fei-Fei Li gegründete Startup, hat mit „Marble“ gerade sein erstes kommerzielles World Model vorgestellt [9].

Cyberangriff auf Anthropic

Anthropic berichtet [10], dass im September 2025 erstmals ein großangelegter, überwiegend autonomer KI-Cyberangriff entdeckt und gestoppt wurde. Eine mutmaßlich chinesische Gruppe nutzte Claude Code im Agentenmodus, um gezielt etwa 30 Organisationen anzugreifen; darunter Tech-Konzerne, Finanzdienstleister und Regierungsbehörden. Die Angreifer „jailbreakten“ das Sicherheitsmodell, zerlegten den Angriff in viele kleine Aufgaben und tarnten ihn als legitimen Sicherheitstest. Claude analysierte daraufhin effizient Systeme, fand Schwachstellen, schrieb Exploit-Code, sammelte Zugangsdaten und bereitete Dokumentationen vor – mehr als 80 % des Angriffs erfolgten ohne relevantes menschliches Eingreifen. Anthropic warnt davor, dass künftige KI-Angriffe neue Maßstäbe setzen könnten.

Yann LeCun (siehe oben) sieht das etwas anders und kritisiert, dass Anthropic mit Berichten über KI-gesteuerte Cyberangriffe gezielt Angst vor KI schüre, um politische Regulierung im eigenen Interesse zu beeinflussen, strengere Gesetze durchzusetzen und Open-Source-Konkurrenz auszubremsen [11].

KI-Rechenzentren im Weltraum

Google bringt das nächste „Weltraumrennen“ ins Rollen: Im Projekt „Suncatcher“ plant Google, KI-Rechenzentren als Schwärme aus Satelliten in einen sonnensynchronen Erdorbit zu verlegen, angetrieben durch nahezu kontinuierliche Solarenergie. Ein Vorteil: Solarpanele liefern dort bis zu achtmal mehr Strom als auf der Erde. 2027 sollen zwei Prototypen starten; auch Amazon und SpaceX verfolgen ähnliche Pläne [12].

Medien-Highlights

Folgende Meldungen sind speziell für Medienunternehmen interessant:

Disney+ wird interaktiv

Wahrscheinlich inspiriert durch Sora 2 macht Disney einen großen Schritt: Der Konzern plant, Disney+ über reines Streaming hinaus zu einer KI-gestützten interaktiven Kreativplattform für die Fans auszubauen. Nutzer sollen die Möglichkeit erhalten, eigene Videoclips und Kurzfilme in Disney-Welten wie Frozen oder Marvel zu erstellen und zu teilen. Durch die Partnerschaft mit Epic Games kommen auch spielerische Features hinzu, stets unter Sicherung der Urheberrechte [18][19].

GEMA vs. OpenAI

Im Rechtsstreit zwischen der deutschen GEMA und OpenAI um urheberrechtlich geschützte Songtexte signalisiert das Münchner Landgericht deutliche Unterstützung für die Argumentation der Gema. Die Richterin hält es für wahrscheinlich, dass OpenAI Songtexte aus dem Gema-Repertoire beim Training ihrer KI systematisch nutzt und diese in ChatGPT meist sogar wortgleich wieder ausgeben kann. Offenbar spricht die nahezu identische Wiedergabe laut Gericht für eine Memorisierung und Vervielfältigung durch das KI-System, was eine Urheberrechtsverletzung darstellen könnte. Eine finale Entscheidung steht noch aus, das Urteil könnte aber ein Präzedenzfall für den Umgang mit kreativen Inhalten beim KI-Training werden und deutliche Auswirkungen auf Lizenzierungspraktiken und die Vergütung von Urhebern haben [13].

Bemerkenswert: Die Einschätzung widerspricht komplett einer aktuellen Entscheidung aus Großbritannien, wo KI-Modelle nicht als rechtsverletzende Kopien gelten; dort sieht das Gericht die Modellgewichte nicht als urheberrechtlich relevante Speicherung. Das verdeutlicht die aktuell sehr uneinheitliche Rechtslage zu KI und Urheberrecht in Europa [14].

KI greift hinter die Paywall

Zum Thema ob und wie KIs auf Inhalte hinter Paywalls zugreifen, gibt es zwei aktuelle Meldungen:

OpenAIs neuer KI-Browser „Atlas“ umgeht gezielt Zugriffssperren der New York Times (NYT) und ähnlicher Medien: Anstatt Originalinhalte zu liefern, erstellt Atlas Zusammenfassungen aus anderen lizenzierten Quellen wie Guardian, Washington Post, Reuters oder Social Media. In einigen Fällen wurde auch die Paywall direkt technisch umgangen, etwa wenn der eigentliche Text nur durch ein Overlay verborgen war. Das Vorgehen ermöglicht Nutzern weiterhin Zugang zu NYT-nahen Informationen, auch wenn die NYT ChatGPT geblockt hat. Das verschärft das Dilemma von Publishern: Wer KI-Zugriffe blockiert, läuft Gefahr, Reichweite an Konkurrenzmedien zu verlieren, welche den KI-Unternehmen die Nutzung ihrer Inhalte per Lizenz gestatten [15].

Common Crawl [16] ist eine gemeinnützige Organisation, die das offene, frei zugängliche „Archiv des Webs“ erstellt, indem sie große Teile des Internets regelmäßig crawlt und die gesammelten Daten kostenlos für Forschung, KI-Training und andere Zwecke bereitstellt, darunter oft auch urheberrechtlich geschützte und Paywall-Inhalte. Tech-Größen wie OpenAI, Google, Meta und Anthropic finanzieren und nutzen diese Daten aktiv, um ihre Modelle zu trainieren. Trotz Protesten und Löschanfragen von Verlagen bleibt ihr Content meist im Archiv erhalten [17].

Software-Produkt-Highlights

Bei den Produkten war es in den letzten beiden Wochen eher ruhig:

Elevenlabs startet Marktplatz für Stimmen

ElevenLabs Iconic Marketplace [20] ermöglicht die Lizenzierung von KI-generierten Stimmen berühmter Persönlichkeiten. Unternehmen können kommerzielle Nutzungsrechte erwerben und direkt mit den Rechteinhabern zusammenarbeiten. Die Plattform bietet eine kuratierte Auswahl von Legenden aus Film, Musik, Wissenschaft und Sport – darunter John Wayne und Liza Minnelli. Projekte werden individuell genehmigt, um transparente Verträge und faire Vergütung sicherzustellen.

Deep Research in Google NotebookLM

Googles NotebookLM hat ein großes Update erhalten [21]: Mit „Deep Research“ übernimmt ein KI-Agent automatisiert komplexe Online-Recherche, erstellt detaillierte, quellenbasierte Reports und empfiehlt relevante Artikel, Papers und Websites. Neu ist zudem die Unterstützung weiterer Dateiformate wie Google Sheets, Microsoft Word, Bilder und Drive-Links. Wie The Decoder berichtet, ermöglicht das Update, Video-Zusammenfassungen völlig frei im gewünschten Stil zu generieren – etwa im Stil bekannter Marken wie „Die Simpsons“. Dadurch sind Copyright-Verletzungen möglich, was jedoch Fragen zum Umgang mit Urheberrecht und zu künftigen Lizenzierungsmöglichkeiten  aufwirft [22].

Group Chats in ChatFPT

Unspektakulär aber potentiell nützlich für Teams: OpenAI bereitet eine neue „Group Chats“-Funktion für ChatGPT vor, mit der mehrere Nutzern in gemeinsamen Chats miteinander und mit der KI interagieren können [23] – ähnlich wie in Microsoft Copilot.

KI-Modell-Highlights

ChatGPT 5.1

OpenAI hat GPT-5.1 veröffentlicht, ein Update, das auf ein allgemein besseres Gesprächsverhalten und eine präzisere Befolgung von Anweisungen abzielt. GPT-5.1 bietet zwei Varianten: „Instant“ (schnell, gesprächiger, wärmer) und „Thinking“ (gründlicher bei komplexen Fragen). Nutzer können jetzt den Ton und Stil von ChatGPT mit neuen Personalisierungsmöglichkeiten anpassen. GPT-5.1 wird zunächst Pro- und Business-Nutzern zur Verfügung gestellt und kommt bald auch in die API [24].

Gemini 3 und Nano Banana Pro in den Startlöchern

Google soll am 22. November Gemini 3 und Nano Banana Pro auf den Markt bringen [25]. Besonders Nano Banana Pro soll nochmal einen deutlichen Qualitätssprung in der KI-Bildgenerierung liefern. Parallel startet das kostenpflichtige Google AI-Plus-Abo (7,99 €/Monat) nun auch in Deutschland [26]. Das Abo liegt preislich deutlich unter dem AI Pro-Tarif (21,99 Euro/Monat), gespart wird bei dem zur Verfügung stehenden Kontingent [27].

SAP stellt Basismodelle vor

SAP beteiligt sich nicht am Rennen um große Sprachmodelle [28], ist aber auch nicht untätig: Das Unternehmen hat auf der TechEd 2025 die SAP-RPT-1-Familie vorgestellt – drei neue AI-Modelle speziell für strukturierte Geschäftsdaten [29]. Anders als klassische LLMs sind diese Relational-Pretrained-Transformer-Modelle optimal für tabellarische Daten ausgelegt und benötigen dank In-Context-Learning kein aufwendiges Training pro Anwendungsszenario. Neben zwei kommerziellen Versionen gibt es auch ein Open-Source-Modell auf GitHub und Hugging Face [30][31].

Chinesische Open Source-Modelle vorn dabei

Moonshot AI hat mit Kimi K2 Thinking ein neues Open-Source-Modell vorgestellt, das als „Thinking Agent“ komplexe Aufgaben eigenständig löst. In Benchmarks zu Reasoning, Coding und agentenbasierter Suche erreicht K2 Thinking laut dem Unternehmen teils bessere Werte als führende US-Modelle und zeigt überdurchschnittliche Performance bei langen, verschachtelten Problemstellungen [32].

Auch Baidu hat mit ERNIE-4.5-VL-28B-A3B-Thinking ein neues Open-Source-Multimodalmodell veröffentlicht, das laut eigenen Angaben bei visuellen Reasoning-Aufgaben GPT-5 und Google Gemini übertrifft. Zu den Highlights zählen „Thinking with Images“ (flexibles Hinein- und Hinauszoomen für Bildanalysen – ähnlich dem menschlichen Vorgehen bei der Bildanalyse), Dokumentenverständnis und Chart-Analysen. Unabhängige Benchmarks zur Validierung stehen noch aus, das Modell ist aber bereits auf Hugging Face verfügbar [33].

Beide Modelle setzen auf eine Mixture-of-Experts-Architektur und sind dadurch effizient lauffähig mit überschaubaren Hardwareanforderungen.

TechRepublic berichtet über einen aktuellen Sicherheitstest von Holistic AI [34], der chinesische Open-Source-Modelle wie MiniMax M2, DeepSeek, Kimi und Qwen mit US-Modellen (Claude & GPT) vergleicht. MiniMax M2 erreichte sowohl bei der sicheren Antwortquote als auch der Widerstandsfähigkeit gegen Jailbreaks Spitzenwerte (99–100%) und übertrifft in manchen Bereichen sogar US-Modelle. Andere chinesische Modelle schnitten durchwachsen ab, speziell bei Resistenz gegen soziales Engineering/Manipulationen. Auffällig ist zudem das starke Preis-Leistungs-Verhältnis: MiniMax soll doppelt so schnell wie Claude Sonnet und deutlich günstiger sein. Holistic AI empfiehlt den Einsatz chinesischer Open-Source-Modelle mit strikter Governance und Monitoring zur sicheren Nutzung, da die Sicherheitsqualität je Modell deutlich variiert.

Neue Speech-to-Text-Modelle

ElevenLabs hat Scribe v2 Realtime vorgestellt, ein besonders schnelles Speech-to-Text-Modell für Echtzeit-Anwendungen wie Voicebots, Meeting-Assistenten und Live-Untertitelung. Es transkribiert Sprache in unter 150 ms in sechs Hauptsprachen (u.a. Deutsch, Englisch, Spanisch) und versteht 90 weitere Sprachen. Das Modell soll herausragende Genauigkeit auch bei schwierigen, verrauschten Samples zeigen und sich dadurch für den Einsatz in anspruchsvollen Support-Szenarien eignen. Die API steht ab sofort zur Verfügung [35].

Parallel dazu hat Meta Omnilingual ASR vorgestellt – eine Familie von Open-Source-Transkriptionsmodellen, die 1.600+ Sprachen unterstützt, darunter 500 bisher von KI nie transkribierte. Der Ansatz nutzt self-supervised Training auf einer riesigen, weltweit kuratierten Datensammlung. Die Modelle sind flexibel von Edge-Geräte bis zu Serveranwendungen einsetzbar. [36]

Entwickler-Highlights

Verständnis großer Code-Repositories

Zwei Highlights zielen darauf ab, große Code-Repositories automatisiert zu dokumentieren:

Google hat mit Code Wiki [37] eine Plattform vorgestellt, die für jedes Code-Repository eine kontinuierlich aktualisierte, strukturierte Wiki-Dokumentation erzeugt. Anstatt reiner statischer Texte bietet Code Wiki interaktive Navigation von High-Level-Konzepten bis zu spezifischen Codestellen, unterstützt durch einen Gemini-basierten Chatagenten mit direktem Kontextbezug. Automatisch generierte Architektur- und Klassendiagramme sorgen für visuelle Transparenz.

Cognition zielt mit Windsurf Codemaps in eine ähnliche Richtung. Codemaps (strukturierte Karten großer Codebasen) sollen Entwicklern helfen, schnell tragfähige mentale Modelle ihres Codes aufzubauen, gezielt zu navigieren und komplexe Aufgaben wie Debugging oder Refactoring effizienter zu lösen. Die Codemaps lassen sich auch als Kontext für Agenten nutzen [38].

Cursor 2.0

Die KI-Entwicklungsumgebung Cursor bietet in der Version 2.0 zwei zentralen Neuerungen [39]: Das neue eigene Coding-Modell „Composer“ wurde speziell für schnelle, agentenbasierte Code-Generierung entwickelt. Es soll komplexe Multi-Step-Programmierungsaufgaben mit niedriger Latenz meistern und durch semantische Codebasis-Suche große Projekte besonders gut verstehen. Zudem vereinfacht die neue Multi-Agenten-Oberfläche paralleles Arbeiten mit vielen Agenten, inklusive automatisierter Code-Reviews und integrierten Tests. Das Unternehmen hinter Cursor wächst rasant, hat gerade eine Series-D-Finanzierung über 2,3 Mrd. USD erhalten und zählt bereits Millionen Entwickler weltweit [40].

Der Autor ist Geschäftsführer von THINKING LABS und Schwerpunktprofessor für Generative AI Engineering an der Hochschule Worms.

Referenzen

[1] https://www.artificialintelligence-news.com/news/nvidia-ai-chip-ban-china-market-share/

[2] https://www.handelsblatt.com/politik/international/kuenstliche-intelligenz-eu-will-ki-gesetz-deutlich-abschwaechen/100172121.html

[3] https://www.heise.de/news/Bundesregierung-will-EU-KI-Regeln-massiv-ueberarbeiten-10964150.html

[4] https://www.heise.de/news/Arbeitsrecht-EU-Abgeordnete-sind-gegen-Kuendigung-durch-KI-11076207.html

[5] https://www.bloomberg.com/news/articles/2025-11-05/apple-plans-to-use-1-2-trillion-parameter-google-gemini-model-to-power-new-siri

[6] https://www.heise.de/news/Fuer-eine-Milliarde-US-Dollar-im-Jahr-Siri-kriegt-wohl-ein-Google-Gemini-Herz-11067255.html

[7] https://techcrunch.com/2025/11/11/metas-chief-ai-scientist-yann-lecun-reportedly-plans-to-leave-to-build-his-own-startup/

[8] https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence

[9] https://techcrunch.com/2025/11/12/fei-fei-lis-world-labs-speeds-up-the-world-model-race-with-marble-its-first-commercial-product/

[10] https://www.anthropic.com/news/disrupting-AI-espionage

[11] https://the-decoder.de/ki-pionier-yann-lecun-anthropic-schuert-ki-aengste-fuer-eigene-zwecke/

[12] https://blog.google/technology/research/google-project-suncatcher/

[13] https://www.manager-magazin.de/unternehmen/tech/gema-vs-openai-muenchner-gericht-sieht-verwertungsgesellschaft-im-vorteil-a-f26cddb3-590e-45a5-8002-f6cfb7260bc3

[14] https://the-decoder.de/das-ki-copyright-dilemma-geht-weiter-zwei-gerichte-zwei-voellig-gegensaetzliche-urteile/?utm_source=mailpoet&utm_medium=email&utm_source_platform=mailpoet&utm_campaign=copyright

[15] https://www.cjr.org/analysis/how-ai-browsers-sneak-past-blockers-and-paywalls.php

[16] https://commoncrawl.org/get-started

[17] https://www.cjr.org/analysis/how-ai-browsers-sneak-past-blockers-and-paywalls.php

[18] https://www.digitaltrends.com/movies/your-disney-experience-is-about-to-get-way-more-interactive/

[19] https://www.npr.org/2025/11/13/nx-s1-5608271/disney-ai-user-generated-content

[20] https://elevenlabs.io/iconic-marketplace

[21] https://blog.google/technology/google-labs/notebooklm-deep-research-file-types/

[22] https://the-decoder.de/man-kann-jetzt-auch-mit-googles-notebooklm-das-copyright-verletzen/

[23] https://www.testingcatalog.com/openai-readies-chatgpt-group-chats-with-custom-controls/

[24] https://openai.com/index/gpt-5-1/

[25] https://www.testingcatalog.com/google-to-release-nano-banana-pro-powered-by-gemini-3-pro-next-week/

[26] https://www.smartdroid.de/gemini-neues-google-ai-plus-fuer-nur-799-euro-jetzt-in-deutschland-verfuegbar/

[27] https://one.google.com/intl/de_de/about/google-ai-plans/

[28] https://www.capital.de/wirtschaft-politik/warum-sap-beim-kampf-der-ki-sprachmodelle-nicht-mitmacht-36345470.html

[29] https://www.sap.com/swiss/products/artificial-intelligence/sap-rpt.html

[30] https://www.handelsblatt.com/technik/it-internet/kuenstliche-intelligenz-sap-entwickelt-eigenes-ki-basismodell/100170913.html

[31] https://www.heise.de/en/news/Business-AI-with-little-training-effort-SAP-announces-SAP-RPT-1-11063968.html

[32] https://www.cnbc.com/2025/11/06/alibaba-backed-moonshot-releases-new-ai-model-kimi-k2-thinking.html

[33] https://venturebeat.com/ai/baidu-just-dropped-an-open-source-multimodal-ai-that-it-claims-beats-gpt-5

[34] https://www.techrepublic.com/article/news-chinese-ai-models-safety-tests/

[35] https://elevenlabs.io/blog/introducing-scribe-v2-realtime

[36] https://ai.meta.com/blog/omnilingual-asr-advancing-automatic-speech-recognition/

[37] https://developers.googleblog.com/en/introducing-code-wiki-accelerating-your-code-understanding/?utm_source=tldrai

[38] https://cognition.ai/blog/codemaps/

[39] https://cursor.com/blog/2-0

[40] https://cursor.com/blog/series-d