Durchbruch bei OpenAI: “Operator”-Agent übernimmt komplexe Aufgaben

50% BLACK FRIDAY DEAL
Die stärkste AI-Community und -Lernplattform Deutschlands

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Heute habe ich für dich:

  • Die wichtigsten News der Woche 🔥

  • Erkenntnis der Woche:  Der Machtkampf der KI-Giganten: Wer beherrscht die Zukunft? 🥊

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche: Individuelle Stimme erstellen mit ElevenLabs Voice Design 🎤


🔥 AI-NEWS

OpenAI kündigt revolutionären „Operator“-Agenten an

Agenten sind aktuell das Trend-Thema im Bereich KI und markieren den nächsten großen Meilenstein: Weg von reinen Chatbots hin zu Systemen, die selbstständig Aufgaben im Alltag übernehmen können. OpenAI hat nun einen großen Schritt in diese Richtung angekündigt – mit dem neuen KI-Tool Operator, das im Januar 2025 starten soll.

Der Operator-Agent soll in der Lage sein, komplexe Prozesse fast vollständig autonom zu erledigen und so beispielsweise Flüge zu buchen oder Code zu schreiben. Dabei steuert er aktiv einen Webbrowser, um Aufgaben mit minimalem menschlichem Eingreifen abzuwickeln. 

OpenAI steht mit diesem Durchbruch allerdings nicht allein da: Unternehmen wie Anthropic, Microsoft und Google arbeiten ebenfalls an ähnlichen Technologien. 

Gleichzeitig hat OpenAI ein Update für die Desktop-App veröffentlicht, mit dem ChatGPT direkt mit anderen Anwendungen auf dem Mac arbeiten kann. User können die KI nun einfach in Tools wie VS Code oder Xcode integrieren, ohne Inhalte manuell kopieren zu müssen. So kommt OpenAI seinem Ziel näher, KI-unterstützte Workflows zu ermöglichen.

Mistral präsentiert Pixtral Large und neue Le Chat-Funktionen

Das französische KI-Startup Mistral hat sein neues multimodales Modell Pixtral Large vorgestellt, das Top-Modelle wie Gemini 1.5 Pro und GPT-4 in Bereichen wie dem Verständnis von Diagrammen und Dokumenten übertrifft. Besonders beeindruckend ist das 128K Kontextfenster, das gleichzeitig 30 hochauflösende Bilder oder ein 300-seitiges Buch verarbeiten kann.

Gleichzeitig wurde die Le Chat-Plattform um neue Funktionen erweitert: Nutzer können kostenlos nun Web-Suchen durchführen, Dokumente analysieren und Bilder erstellen. Die neue Canvas-Funktion erlaubt es außerdem, Inhalte in Echtzeit zu erstellen und zu bearbeiten. Mistral zeigt damit eindeutig, dass europäische KI-Modelle zunehmend mit den führenden US-Technologien konkurrieren können.

Microsoft erreicht nahezu unendliches KI-Gedächtnis

Microsoft AI-CEO Mustafa Suleyman hat kürzlich in einem Interview (ab 06:14 min) einen wichtigen Fortschritt in der KI-Entwicklung angekündigt: Bis 2025 soll Künstliche Intelligenz über ein „nahezu unendliches“ Gedächtnis verfügen. Er erklärte: „Wir haben Prototypen, an denen wir arbeiten, die über einen nahezu unbegrenzten Speicher verfügen. Sie vergessen einfach nicht, was wirklich transformativ ist.“ 

Mit diesem Gedächtnis können KIs Erinnerungen über unbegrenzte Sitzungen hinweg speichern und fortlaufende, sich entwickelnde Gespräche führen. Suleyman bezeichnete dieses Gedächtnis als den kritischen Baustein für die Zukunft der KI. Es ermöglicht eine tiefere, nachhaltigere Interaktion, bei der KI-Systeme nicht nur reagieren, sondern über längere Zeiträume hinweg die Bedürfnisse und Ziele der Nutzer verstehen.

ElevenLabs bringt personalisierte KI-Agenten

ElevenLabs hat eine neue Funktion vorgestellt, mit der eigene konversationelle KI-Agenten erstellt werden können, die beispielsweise in Callcentern eingesetzt werden. User können zwischen verschiedenen Sprachmodellen (Gemini, GPT oder Claude) wählen, den Tonfall anpassen und die KI mit spezifischen Dateien oder URLs versorgen. Die Agenten sind mit gängigen Programmiersprachen wie Python, React und Swift kompatibel.

Die Funktion ist derzeit kostenlos in der Beta-Phase verfügbar. Damit bietet ElevenLabs eine interessante Alternative zu großen Anbietern wie OpenAI.

O2 setzt auf KI-Oma Daisy, um Betrüger auszutricksen

Der Mobilfunkanbieter O2 hat in Großbritannien eine clevere Lösung gegen Scam-Anrufe entwickelt: Eine KI-generierte Oma namens Daisy, die Betrüger am Telefon in die Irre führt. Mit ihrer langsamen, gutgläubigen Art hält sie die Kriminellen in langen Gesprächen fest und verhindert so, dass sie echte Kunden belästigen. Manche Betrüger sollen bereits über eine Stunde mit Daisy gesprochen haben, ohne zu merken, dass sie von einer KI ausgetrickst werden. 

Die Idee hinter Daisy: Während die Betrüger mit der KI beschäftigt sind, haben sie weniger Zeit, echten Menschen Schaden zuzufügen. O2 setzt damit auf eine besonders kreative und fortschrittliche Methode zur Betrugsabwehr. Ein Paradebeispiel dafür, wie KI zum Wohle unserer Gesellschaft eingesetzt werden kann.

Microsoft startet maßgeschneiderte KI-Industriemodelle für verschiedene Branchen

Microsoft hat eine Reihe neuer, auf verschiedene Branchen zugeschnittene KI-Modelle vorgestellt. Diese sind über den Azure KI-Modellkatalog verfügbar und bieten maßgeschneiderte Lösungen für Unternehmen aus den Bereichen Landwirtschaft, Automobil, Fertigung und Finanzen.

Ein kleiner Überblick:

  • Bayer: Das Modell „E.L.Y. Crop Protection“ soll den nachhaltigen Pflanzenschutz unterstützen, indem es landwirtschaftliche Daten verarbeitet und Lösungen für spezifische Bedürfnisse anpasst.

  • Cerence: Das „CaLLM™ Edge“-Modell soll in Fahrzeugen KI-gesteuerte Funktionen wie die Steuerung des Klimasystems auch ohne Cloud-Verbindung ermöglichen.

  • Rockwell Automation: Das „FT Optix Food & Beverage“-Modell soll in der Lebensmittel- und Getränkeindustrie helfen, Fehler bei Maschinen schnell zu beheben und Produktionsprozesse zu optimieren.

  • Saifr (Fidelity Labs): Vier Modelle sollen Finanzinstitutionen im Bereich Compliance unterstützen, indem sie regulatorische Risiken in Texten und Bildern identifizieren und alternative Formulierungen vorschlagen.

  • Siemens: Der „NX X Copilot“ für CAD soll Ingenieuren KI-gesteuerte Empfehlungen zur Optimierung von Produktentwicklungen bieten.

  • Sight Machine: Der „Factory Namespace Manager“ soll Fabrikdaten in standardisierte Formate übersetzen und eine End-to-End-Optimierung von Produktion und Energieverbrauch ermöglichen.

KI für den Planeten: NASA und Microsoft entwickeln Earth Copilot

NASA hat in Zusammenarbeit mit Microsoft den KI-Chatbot Earth Copilot entwickelt, der es künftig ermöglichen soll, komplexe geografische Daten der NASA in leicht verständliche Informationen umzuwandeln. Earth Copilot kann so dazu beitragen, das Wissen zu demokratisieren und auch Laien Einblicke in globale Themen wie Klimawandel, Umweltveränderungen und Naturkatastrophen zu ermöglichen. Der Chatbot befindet sich derzeit in der Testphase und wird bald in die NASA-Plattform VEDA integriert, die allen Nutzern offensteht.

KI übertrifft Shakespeare

Erinnert ihr euch an das KI-Gemälde, von dem wir euch letzte Woche berichtet haben, das für 1,3 Millionen Dollar versteigert wurde? In einer neuen Studie der Universität Pittsburgh zeigt sich, dass Künstliche Intelligenz auch in der Poesie durchaus begabt ist. Teilnehmende der Studie konnten KI-generierte Gedichte kaum von denen berühmter Autoren wie Shakespeare unterscheiden und bewerteten sie sogar höher in Kategorien wie Rhythmus und emotionaler Wirkung. Das Ergebnis stellt einmal mehr die Frage, wie KI menschliche Kreativität herausfordert und wird sicherlich auch in der Literaturwelt für Diskussionen sorgen.


🧠 ERKENNTNIS DER WOCHE

Der Machtkampf der KI-Giganten: Wer beherrscht die Zukunft?

Wenn wir über KI sprechen, sprechen wir auch viel über das Thema Macht. Du denkst jetzt vielleicht an den Machtkampf zwischen Mensch und Maschine – wir müssen die Macht über die KI behalten, sie kontrollieren und sicherstellen, dass sie uns dient. Doch heute möchten wir hier über einen nicht weniger wichtigen Machtkampf sprechen: Den Machtkampf der Big Player im Bereich KI.

Sicher denkst auch du hier direkt an Sam Altman und Elon Musk. Zwei Giganten, deren Konflikte fast schon zur dramatischen Soap Opera geworden sind. Seit Jahren streiten sie sich um Ideologien, Einfluss und Milliarden – und dabei ist keiner der beiden dafür bekannt, klein beizugeben. Musk, Mitbegründer von OpenAI, hat dem Unternehmen inzwischen den Rücken gekehrt und nennt es einen „Verrat“ an der ursprünglichen Mission. Altman, der heutige CEO, bleibt an Bord, steuert das Schiff OpenAI weiter in Richtung kommerziellen Erfolgs.

Doch der wahre Dreh- und Angelpunkt dieser Rivalität ist Microsoft. Mit Investitionen in Milliardenhöhe – 13 Milliarden Dollar, um genau zu sein – sind sie nicht nur der größte Geldgeber von OpenAI, sondern auch ein strategischer Strippenzieher im Hintergrund. Musk sieht diese Partnerschaft als „de facto Fusion“ und reicht Klage ein. Dabei veröffentlichte er sogar alte E-Mails zwischen ihm und Altman, die die Gründung von OpenAI beleuchten. Die Idee war einst, eine gemeinnützige Organisation zum Wohle der Menschheit zu schaffen – doch heute ist OpenAI ein 157-Milliarden-Dollar-Konzern und integriert die OpenAI-Technologie in Azure und Copilot. Musk dagegen baut mit xAI eigene Supercomputer in Rekordzeit und finanziert sie mit Milliarden aus Saudi-Arabien.

Während Musk nun über Trump in die politische Arena einsteigt, baut Microsoft weltweit KI-Infrastrukturen aus, eröffnet Labore in Tokio und plant milliardenschwere Investitionen in Europa. Es ist ein Wettlauf um Macht, Infrastruktur und den Kurs der Zukunft. Wer am Ende gewinnt? Das bleibt abzuwarten. Aber eines ist sicher: In dieser Soap Opera Deluxe wird es so schnell nicht langweilig.


🤖 AI-TOOLS

  • Voltmailer: AI-Tool, das automatisiert personalisierte E-Mail-Kampagnen für Unternehmen erstellt. (Link)

  • Scribly AI: Automatisiertes KI-Tool zur schnellen Erstellung von SEO-Inhalten. (Link)

  • Blunge: Generiere benutzerdefinierte Grafiken für dein Business. (Link)

  • WizApply: KI-Assistent, der dir bei der Jobsuche und im Bewerbungsprozess hilft. (Link)

  • Screenpipe: KI-gestützte Bildschirm- und Sprachaufzeichnungssoftware das dir dabei hilft, produktiver zu arbeiten. (Link)


🧑‍🏫 AI-TUTORIAL DER WOCHE

Individuelle Stimme erstellen mit ElevenLabs Voice Design

Mit der Voice Design-Funktion von ElevenLabs kannst du kostenlos deine Wunschstimme anhand einer Beschreibung erstellen – ideal, wenn du eine genaue Vorstellung einer Stimme hast, sie aber so nicht in der Voice Library verfügbar ist. So gehts: 

  • Gehe auf die Website von ElevenLabs und logge dich ein. 

  • Klicke im Seitenmenü auf „Voices”. 

  • Wähle dann „Create or clone a new voice” und anschließend „Voice Design” aus.

  • Beschreibe nun die gewünschte Stimme detailliert: 

  • Alter (z. B. young, middle aged, old)

    1. Akzent (z. B. british, american)

    2. Geschlecht

    3. Stil (z. B. friendly, energetic, bored) 

    4. Beispiel: An old British male with a raspy, deep voice.

  • Klicke dann auf „Generate Voice”.

  • Du erhältst drei KI-generierte Vorschläge basierend auf deiner Beschreibung. Hör dir die Vorschläge an und wähle deinen Favoriten. 

  • Gib dann der Stimme einen Namen, damit du sie verwenden kannst. 

Viel Spaß beim Experimentieren!


Das war’s für diese Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. 🤗 (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächste Woche!

Henry


Zurück
Zurück

Leak, Browser-Kampf & die große Frage: Können wir KI trauen?

Weiter
Weiter

OpenAI CEO: AGI schon in 2025!