Neue Super-KI aus China geht viral!

Die stärkste AI-Community und -Lernplattform Deutschlands

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Heute habe ich für dich:

  • Die wichtigsten News der Woche 🔥

  • Erkenntnis der Woche: And the Oscar goes to ... SORA! 🍿

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche: So erstellst du Landing-Page-Mockups mit Ideogram 🧑🏻‍💻


🔥 AI-NEWS

China stellt „vollautonomen“ KI-Agenten Manus vor

Im Januar sorgte das chinesische Start-up DeepSeek mit seinem Modell R1 für Aufsehen und stellte die US-Dominanz in der KI-Entwicklung infrage. Nun sorgt das chinesische Startup Monica mit seinem autonomen KI-Agenten Manus AI für Schlagzeilen.

Das Startup hat vor wenigen Tagen einen autonomen KI-Agenten präsentiert. Laut Entwicklern kann Manus eigenständig komplexe Aufgaben wie Bewerbungsprüfungen, Immobilienrecherche oder Arbeiten auf Plattformen wie Upwork oder Fiverr erledigen. Es ist dabei nicht auf menschliche Prompts angewiesen. Manus initiiert seine Aufgaben selbstständig. In Benchmarks übertraf Manus etablierte KI-Assistenten wie ChatGPT und Gemini.

Doch erste Tests zeigen auch Schwächen: Technische Probleme, mangelnde Transparenz und Datenschutzfragen werfen Schatten auf den neuen Hype. Trotz dieser Hürden gilt Manus als möglicher Durchbruch in der Entwicklung autonomer KI-Agenten. Teile des Systems sollen noch in diesem Jahr als Open Source veröffentlicht werden.

Laut Bericht: OpenAI plant Premium-KI-Agenten für bis zu 20.000 Dollar im Monat

Laut einem Bericht von The Information arbeitet OpenAI an einer neuen Generation spezialisierter Premium-KI-Agenten. Diese sollen anspruchsvolle Aufgaben in Wirtschaft, Softwareentwicklung und Forschung übernehmen können – zu Preisen zwischen 2.000 und 20.000 Dollar pro Monat.

Besonders die teuerste Stufe, die angeblich auf PhD-Level-Forschung (Forschung auf dem Niveau eines Doktortitels) ausgelegt ist, könnte sich für Unternehmen lohnen: Wenn die Agenten halten, was sie versprechen, könnten sie ganze Teams ersetzen und dabei kosteneffizient sein. SoftBank als Investor soll bereits 3 Milliarden Dollar für die Produktreihe 2025 zugesagt haben. Noch ist nichts bestätigt. Doch OpenAIs Vorstoß könnte den Markt für KI- und menschliche Arbeitskräfte maßgeblich verändern.

OpenAI bringt neue Open-Source-Tools für KI-Agenten

Mit neuen Entwicklertools erleichtert OpenAI den Aufbau von KI-Agenten, die komplexe Aufgaben eigenständig ausführen. Besonders bemerkenswert: Erstmals setzt OpenAI dabei auf Open Source.

Responses API (Application Programming Interface): Ermöglicht Entwicklern, mit nur einem Aufruf verschiedene Funktionen zu nutzen:

  • Websuche: Echtzeit-Informationen aus dem Internet abrufen

  • Dateisuche: Inhalte aus großen Dokumentensammlungen effizient durchsuchen

  • Computersteuerung: Automatisierung von Aufgaben wie Dateneingaben oder Recherchen

Agents SDK (Software Development Kit): Eine Sammlung von Tools zur einfachen Steuerung mehrerer KI-Agenten:

  • Koordination komplexer Workflows

  • Automatisierte Übergaben zwischen Agenten

  • Sicherheitsmechanismen für mehr Kontrolle

  • Verbesserte Überwachung und Optimierung

Mit diesen Neuerungen können Entwickler schneller von der Idee zur Umsetzung kommen.

Google erweitert KI-Suche: AI Mode, verbesserte Overviews und neues Text-Embedding

Google bringt diese Woche gleich mehrere Updates für seine Suchtechnologie. Mit dem neuen AI Mode, optimierten AI Overviews und der Einführung von Gemini Embedding treibt das Unternehmen die Entwicklung intelligenter Suchfunktionen weiter voran.

  • AI Mode: Diese neue Funktion für die Google-Suche verzichtet auf klassische Linklisten und zeigt stattdessen KI-generierte Antworten in Fließtextform an. Mithilfe der „Query Fan-Out“-Technik durchsucht die KI mehrere Quellen gleichzeitig, um detaillierte und fundierte Antworten zu liefern. User können direkt Folgefragen stellen.

  • AI Overviews: Google hat die Funktion, die bereits mehr als eine Milliarde Nutzer hat, verbessert: Für User in den USA laufen die AI Overviews jetzt unter Gemini 2.0 und sind dadurch auch zu anspruchsvolleren Aufgaben wie Programmierung oder komplexe Mathematik fähig. Gleichzeitig sind die AI Overviews künftig auch um nicht-eingeloggten Zustand verfügbar. 

  • Gemini Embedding: Ein neues Modell zur semantischen Textanalyse verbessert das Verständnis von Kontext und Bedeutung. Dadurch kann die KI unausgesprochene Zusammenhänge besser erfassen und relevantere Suchergebnisse liefern.

Mistral OCR: KI-Tool für Dokumentenverarbeitung übertrifft Google und Microsoft

Mistral AI hat mit Mistral OCR eine neue API für schnelle und präzise Texterkennung in komplexen Dokumenten vorgestellt. OCR (Optical Character Recognition) bedeutet, dass Texte aus Bildern oder gescannten Dokumenten automatisch erkannt und in bearbeitbaren Text umgewandelt werden. Das Tool verarbeitet bis zu 2000 Seiten pro Minute und unterstützt mehrere Sprachen, darunter Hindi und Arabisch. Benchmark-Tests zeigen, dass es Modelle wie Googles Document AI und Microsoft Azure OCR in allen Kategorien übertrifft. Mit der Möglichkeit, die Technologie lokal zu betreiben, eignet sich Mistral OCR besonders für Unternehmen mit sensiblen Daten.

Tavus macht mit Update AI-Avatare realistischer

Der Entwickler Tavus hat ein großes Update seiner Conversational Video Interface (CVI)-Plattform vorgestellt. Gleich drei neue KI-Modelle machen Video-Interaktionen mit Avataren deutlich menschlicher: Phoenix-3 sorgt für natürliche Gesichtsausdrücke, Raven-0 reagiert auf Körpersprache und Emotionen in Echtzeit, und Sparrow-0 optimiert das Gesprächstiming, um unnötige Pausen zu vermeiden.

Dadurch können Avatare nun plötzlich fließende, emotionale Gespräche führen und erschweren es, zwischen Menschen und Maschinen zu unterscheiden.

Microsoft entwickelt eigene KI-Modelle: MAI als Konkurrent zu OpenAI

Microsoft arbeitet an einer neuen Familie von KI-Modellen namens MAI, die als direkte Konkurrenz zu den führenden Anbietern wie OpenAI und Anthropic gelten. Geplant ist, diese Modelle über Azure anzubieten und sie als Ersatz für OpenAI-Technologien in der Copilot-Suite zu testen. Microsoft möchte sich dadurch unabhängiger von OpenAI machen, insbesondere nachdem die Zusammenarbeit zwischen den Unternehmen durch wachsende Spannungen belastet wurde.

Neben der Entwicklung eigener Modelle wurde diese Woche bekannt, dass Microsoft auch kräftig in den südafrikanischen Tech-Sektor investiert. Mit 300 Millionen Dollar will das Unternehmen dort KI und Cloud-Computing vorantreiben.

McDonald's lässt KI in Filialen einziehen

McDonald's rüstet seine 43.000 Filialen mit neuen KI-Systemen aus, die von der Wartung von Küchengeräten bis zur Bestellgenauigkeit unterstützen sollen. In Zusammenarbeit mit Google Cloud werden Echtzeit-Datenverarbeitung und KI-Analyse direkt im Restaurant ermöglicht. Die KI-Initiative soll sowohl Kundenprobleme lösen als auch Mitarbeitende bei der Bearbeitung von Bestellungen unterstützen.


🧠 ERKENNTNIS DER WOCHE

And the Oscar goes to ... SORA!

Wer die diesjährigen Oscars verfolgt hat, könnte sich fragen, ob der Preis für den besten Sound, die besten visuellen Effekte oder das beste Drehbuch in den nächsten Jahren vielleicht an eine KI geht.

Bei den Oscars 2025 wurde jedenfalls deutlich: Künstliche Intelligenz ist längst in Hollywood angekommen. In Filmen wie Emilia Pérez und The Brutalist half das KI-Tool Respeecher dabei, dass amerikanische Schauspieler auf Spanisch und Ungarisch authentischer klangen. Complete Unknown nutzte eine KI-Technologie, um Stunt-Doubles den Schauspielern ähnlicher zu machen.

Und das ist erst der Anfang. Von automatischem Color Grading über visuelle Effekte bis hin zur Drehbuchanalyse lassen sich Produktionsprozesse mit Tools wie OpenAIs Sora, Veo 2 oder Alibabas Wan 2.1 effizienter, kreativer und kostengünstiger gestalten.

Doch mit der technologischen Revolution kommen auch Fragen. Die Oscar-Academy überlegt bereits, ihre Richtlinien anzupassen. Denn wie bewertet man künstlerische Leistung, wenn eine KI Gesichter nachbearbeitet und Schauspielerinnen und Schauspielern noch mehr Ausdruck und Emotionen verleiht? Wenn eine Performance am Rechner perfektioniert wird: Wem gehört dann der Applaus – beziehungsweise der Oscar?

Eins ist klar: KI definiert kreative Prozesse neu. Sie kann kleinen Filmemachern ohne großes Budget helfen, ihre Visionen zu verwirklichen. Sie kann die verrücktesten kreativen Ideen umsetzen. Aber sie zwingt uns auch, darüber nachzudenken, was es bedeutet, kreativ zu sein.

Um dieses Thema geht es auch in unserer neuen Podcast Episode in Mensch, Maschine, Mindshift. Bei Interesse kannst du gerne hier reinhören: YouTube oder Spotify.


🤖 AI-TOOLS

  • Sesame: Conversational-AI für natürliche, interaktive Gespräche (noch im Test, nur auf Englisch) (Link).

  • QwQ-32B: Qwens günstiges, effizientes Open-Source-Modell für logisches Denken (Link).

  • Windsurf Wave 4: Agentisches Coden mit Vorschau-Funktion, Auto-Import, Claude und neuem MPC-Server (Link).

  • Ray2: Leistungsstarke Video-KI mit Keyframes, Extend- und Loop-Funktionen (Link).

  • Tavus: Conversational-Video-Interface, das KI-Agenten mit emotionaler Intelligenz zum Leben erweckt (Link).


🧑‍🏫 AI-TUTORIAL DER WOCHE

So erstellst du Landing-Page-Mockups mit Ideogram 

Du brauchst eine Landing Page für dein Business, einen Online-Kurs oder eine Produktvorstellung, hast aber keine Designkenntnisse? Mit Ideogram kannst du in wenigen Schritten überzeugende Mockups erstellen – nur mit Text. 

So funktionierts:

  1. Konto erstellen: Registriere dich kostenlos bei Ideogram und öffne die Kreativ-Oberfläche.

  2. Landing Page beschreiben: Formuliere einen detaillierten Prompt: Welche Elemente brauchst du? (z. B. Header, Call-to-Action, Features) Welche Farben und welcher Stil passen zu deinem Thema?

  3. Einstellungen anpassen: Wähle das 16:9-Format für Desktop-Ansichten. Setze den Modus auf „Design“, um ein professionelles Layout zu erhalten. 

  4. Mockup generieren: Klicke auf „Generate“, um mehrere Varianten zu erstellen. 

Wähle dein Lieblingsdesign aus oder optimiere es weiter. Wenn du dein Mockup in eine echte Website verwandeln willst, lade es in einen AI-Coding-Assistenten wie Windsurf oder Cursor. Mit einem einfachen Prompt wie „Code diese Landing Page“ wird daraus direkt nutzbarer Code – so sparst du Zeit und setzt deine Idee sofort um.

Viel Spaß beim Ausprobieren!


Das war’s für dieses Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. 🤗 (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächste Woche!

Henry


Zurück
Zurück

Agenten-Boom: Adobe bringt gleich 10 KI-Agenten

Weiter
Weiter

OpenAIs Sora & GPT-4.5 sind jetzt verfügbar