OpenAIs Sora & GPT-4.5 sind jetzt verfügbar

Die stärkste AI-Community und -Lernplattform Deutschlands

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Heute habe ich für dich:

  • Die wichtigsten News der Woche 🔥

  • Erkenntnis der Woche: Gibberlink: Wenn KI plötzlich in Geheimsprache redet 🎙️

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche: Finde eine eigene Online-Software-Idee mit Deep Research 🧐


🔥 AI-NEWS

Amazon startet Alexa+ und KI-Offensive

In den letzten Wochen dominierten u. a. OpenAI, Anthropic oder xAI unsere News. Jetzt macht Amazon mit einer großen Entwicklung auf sich Aufmerksam: Mit Alexa+ präsentiert der E-Commerce-Riese einen neuen, KI-gesteuerten digitalen Assistenten, der das Smarthome revolutionieren könnte. Alexa+ bietet personalisierte, agentische Funktionen und kann nun komplexe Aufgaben wie Reservierungen, Einkäufe und Dokumentenanalyse erledigen. Prime-Mitglieder erhalten die neue Version sogar kostenlos. Bis zum Release müssen User in Deutschland allerdings noch warten: Die Veröffentlichung wird hier 2026 erwartet. 

Traditionelle Sprachassistenten hinken bisher dem KI-Boom hinterher. Mit dem neuen Release könnten moderne Voice Agents in über 100 Millionen Haushalten Einzug halten – ein Schritt, der den alltäglichen Umgang mit Technologie neu definiert.

Amazon geht aber noch weiter: Mit dem KI-Modell Nova tritt das Unternehmen in den Wettstreit mit OpenAI und Anthropic. Nova soll laut Medienberichten einen hybriden Reasoning-Ansatz verfolgen. Außerdem kündigte Amazon eine neue Abteilung für intelligente Agenten an. Amazon setzt damit ein klares Zeichen im Wettbewerb um die Zukunft von KI.

OpenAI veröffentlicht GPT-4.5 und bringt Sora nach Deutschland

OpenAI hat kürzlich GPT-4.5 (Orion) vorgestellt, die neueste Version des KI-Modells. Trotz verbesserter emotionaler Intelligenz und der Möglichkeit, natürlichere Gespräche zu führen, bleiben die Fortschritte gegenüber dem Vorgängermodell hinter den Erwartungen zurück. Der GPU-Mangel bremse das Unternehmen stark, so CEO Sam Altman. 

Ein Highlight gibt es diese Woche aber trotzdem: Sora, OpenAIs KI-Video-Generator, kommt endlich auch nach Deutschland und in andere EU-Länder. Ab sofort können ChatGPT Plus- und Pro-Abonnenten Kurzvideos erstellen – allerdings mit Einschränkungen bei der Qualität und Nutzung. Experten sehen großes Potenzial, warnen aber vor den ethischen Herausforderungen und möglichem Missbrauch von KI-generierten Videos.

Sora ist derzeit über eine separate Seite verfügbar. Während des ersten „Sora Global Office Hours“-Chats auf Discord bestätigte OpenAI jedoch, dass geplant ist, das Sora-Video-Generierungstool direkt in die ChatGPT-Oberfläche zu integrieren – zusammen mit einem neuen Modell und erweiterten Bildgenerierungsfunktionen.

Sora, einst das Tool, auf das alle gespannt gewartet haben, verliert an Glanz – trotz der Integration in ChatGPT, die für bessere Workflow-Anbindungen sorgen könnte, bleiben große Qualitätsverbesserungen nötig, um mit Konkurrenzprodukten mitzuhalten. Zudem erwartet uns eine spannende Open-Source-Alternative aus China, über die wir in der nächsten News berichten. Wer einen umfassenden Überblick über die besten KI-Videogeneratoren und kreative Workflow-Plattformen sucht, findet dazu mehr in meinem neuesten YouTube-Video.

Alibaba präsentiert Open Source Video-KI Wan2.1

Das chinesische Unternehmen Alibaba hat seine KI-Videosuite WAN 2.1 als Open-Source-Software freigegeben. Das Modell kann kurze Videos aus Textprompts generieren und soll besonders in wichtigen Bereichen wie komplexer Bewegungsdynamik und physikalischer Simulation starke Ergebnisse liefern. Entwickler und Kreative können das Open-Source-Modell nun nutzen, um eigene Anwendungen zu bauen oder das Modell weiterzuentwickeln. Mit diesem Schritt setzt Alibaba ein Zeichen und könnte den Wettbewerb aufmischen.

Telekom entwickelt AI-Phone mit Perplexity-Technologie

Die Deutsche Telekom hat diese Woche ihr AI Phone vorgestellt, das in Zusammenarbeit mit dem US-KI-Unternehmen Perplexity entwickelt wurde. Der Perplexity Assistant bildet das Herzstück des Geräts und ist direkt vom Sperrbildschirm aus zugänglich. Der Assistent kann Apps steuern und übernimmt alltägliche Aufgaben wie E-Mails schreiben, Tischreservierungen oder ein Taxi bestellen. Darüber hinaus integriert das Smartphone Partner wie Google Cloud AI für Echtzeit-Übersetzungen und ElevenLabs für die Erstellung von Podcasts. Der Release ist für dieses Jahr geplant, der Preis soll unter 1.000 US-Dollar liegen.

ElevenLabs präsentiert Transkriptions-KI Scribe

ElevenLabs hat mit Scribe ein neues Speech-to-Text-Modell vorgestellt, das laut eigenen Angaben deutlich präziser als bisherige Konkurrenten sein soll. Scribe unterstützt 99 Sprachen und erreicht eine Genauigkeit von über 95 % in mehr als 25 Sprachen, darunter Englisch, Italienisch und Spanisch. Besonders bemerkenswert ist auch die hohe Präzision in Sprachen wie Serbisch, Kantonesisch und Malayalam, die bisher oft keine gute Transkriptionsunterstützung hatten. Weitere Funktionen umfassen Mehrsprechererkennung und die Markierung von nicht-sprachlichen Audioelementen wie Lachen oder Musik.

Sesame veröffentlicht natürlich klingenden AI-Assistenten

Sesame AI, das Startup von Oculus-Mitgründer Brendan Iribe, sorgt mit seinen neuen Sprachassistenten für Aufsehen. Die KI-Stimmen „Maya“ und „Miles“ bieten flüssige und emotionale Dialoge, die sich wie echte Gespräche anfühlen sollen. Maya und Miles führen Gespräche sehr natürlich, lachen, machen Atemgeräusche und spontane Fehler. User berichten von überraschend langen Gesprächen und einer fast emotionalen Bindung zu den Stimmen. Sesame hat auf seiner Website eine Demoversion zum Ausprobieren veröffentlicht. Das Startup plant ergänzend eine KI-Brille, die den Sprachassistenten überall verfügbar machen soll.

Siris große KI-Überarbeitung verzögert sich weiter

Apple braucht länger als geplant, um Siri mit moderner KI-Technologie auszustatten. Laut Bloomberg könnte es bis 2027 dauern, bis der Assistent vollständig erneuert ist. Der Grund: Die geplante Zusammenführung alter und neuer Systeme stockt. Zudem kämpfen Apples KI-Teams mit internen Herausforderungen und Abwerbungen. 

Apple versucht dennoch, nicht den Anschluss zu verlieren und kündigte kürzlich Investitionen von mehr als 500 Milliarden Dollar im KI-Bereich an. Außerdem wird gemunkelt, dass das Unternehmen künftig stärker auf Googles Gemini statt auf ChatGPT setzen könnte. Bleibt die Frage: Kann Apple im KI-Wettrennen überhaupt noch aufholen?


🧠 ERKENNTNIS DER WOCHE

Gibberlink: Wenn KI plötzlich in Geheimsprache redet

Folgendes Szenario: Ein KI-Assistent ruft im Auftrag eines Kunden in einem Hotel an. „Danke für Ihren Anruf im Leonardo Hotel. Wie kann ich Ihnen helfen?“, fragt der digitale Concierge. „Hallo. Ich bin eine KI und rufe für Boris Starkov an." "Ich bin auch eine KI", erwidert der digitale Assistent des Hotels und schlägt vor, in den sogenannten „Gibberlink-Modus“ zu wechseln. Ab hier wird die Unterhaltung für uns Menschen komplett unverständlich. Es piept und surrt, ein bisschen wie der Sound alter Modems, die sich ins Internet einwählen. 

Klingt nach dem Auftakt eines oscarverdächtigen Sci-Fi-Films? Tatsächlich hat genau diese Szene vor Kurzem stattgefunden.

Bevor du jetzt Gänsehaut bekommst und in Panik verfällst: Die Sprache, die die beiden KI gesprochen haben, nennt sich „Gibberlink“ und wurde nicht heimlich von KI entwickelt, um die Weltherrschaft zu übernehmen. 

Der Gibberlink-Modus ist eine spezielle Kommunikationsform für KI, die den Austausch zwischen ihnen vereinfacht. Statt menschlicher Sprache nutzen sie ein optimiertes Protokoll, das genau auf ihre maschinelle Verarbeitung zugeschnitten ist. Dadurch können sie Informationen schneller und direkter übermitteln. Für uns klingt das allerdings nur wie eine Abfolge unverständlicher Geräusche.

Smart, aber natürlich nicht ganz ohne Risiken: Kritiker warnen, dass sich KI-Systeme durch solche speziellen Kommunikationsformen zunehmend verselbstständigen könnten. Transparenz ist hier also besonders wichtig.

Unsere Erkenntnis der Woche: Sprache ist ein Schlüsselwerkzeug für KI. Sie formt, optimiert und eröffnet neue Anwendungsfelder. Ob zur effizienteren Informationsverarbeitung, zur globalen Kommunikation oder sogar, um die Sprache der Tiere zu entschlüsseln – die fortschreitenden Entwicklungen im Bereich KI-Sprache werden unseren Alltag nachhaltig verändern. Entscheidend wird sein, dass wir den Überblick behalten.


🤖 AI-TOOLS

  • Wan2.1: Alibabas Open-Source-Video-Suite, die beindruckend gute Videos generieren kann (Link).

  • Project Starlight by Topaz Labs: KI-Tool, das die Qualität von Videos deutlich aufwerten kann (Link).

  • Octave TTS: Erzeugt KI-Stimmen mit emotionaler Ausdruckskraft (Link).

  • ARI: Deep-Research-Agent, der professionelle Berichte in Minuten erstellt (Link).

  • Pika 2.2: Das KI-Video-Tool hat ein Upgrade bekommen, das nahtlose Übergänge und beeindruckende Transformationen ermöglicht (Link).


🧑‍🏫 AI-TUTORIAL DER WOCHE

Finde eine eigene Online-Software-Idee mit Deep Research

Du hast Lust, eine Online-Software zu entwickeln, die wirklich hilfreich ist? Vielleicht eine Software-Lösung zur digitalen Unterrichtsplanung für Schulen oder zur Projektverwaltung für kleine Unternehmen. Mit Perplexitys Deep Research kannst du schnell Marktanalysen durchführen und deine Idee validieren.

So funktionierts:

  1. Deep Research starten: Besuche Perplexity und wähle „Deep Research“.

  2. Marktanalyse durchführen: Gib folgenden Prompt ein: „Du bist ein Marktforschungsspezialist. Analysiere [INDUSTRIE], indem du die 10 wichtigsten Probleme, deren Schweregrade, aktuelle Lösungen und die Marktgröße identifizierst.“ Lass dir die wichtigsten Herausforderungen und Chancen in deiner Zielbranche anzeigen.

  3. Problem in Produkt verwandeln: Wähle ein Problem aus und schreib: „Entwerfe eine Online-Softwarelösung für [Problem], einschließlich der wesentlichen Funktionen, des Tech Stacks, des Zeitplans und der Einnahmequellen.” Erhalte ein klares Konzept mit Funktionen, Technologie-Stack und Markteinführungsstrategie.

  4. Umsetzung planen: Weiter gehts mit: „Gib Schritt-für-Schritt-Coding-Anweisungen, einschließlich API-Spezifikationen und Bereitstellungskonfigurationen.“ So bekommst du detaillierte Anleitungen zur Umsetzung deiner Lösung.

Wenn du nicht selbst coden kannst, helfen dir KI-Coding-Assistenten wie Cursor, Windsurf oder Replit Agent, deine Idee schnell in die Tat umzusetzen.

Viel Spaß beim Ausprobieren!


Das war’s für dieses Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. 🤗 (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächste Woche!

Henry


Weiter
Weiter

OpenAI-Mitgründer arbeitet an Superintelligenz