Google schockt OpenAI – Sora übertrumpft!
Die stärkste AI-Community und -Lernplattform Deutschlands
Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!
Das Jahr neigt sich dem Ende zu und wir wünschen dir schon jetzt frohe Weihnachten und einen guten Rutsch ins neue Jahr! Nächste Woche legen wir eine kurze Pause ein, aber keine Sorge: Anfang Januar sind wir wieder für dich da – mit einem spannenden Ausblick auf die KI-Trends, die 2025 prägen werden.
Mach den besten deutschsprachigen KI-Newsletter noch besser – jetzt bist du gefragt!
Teile uns in unserer kurzen Umfrage mit, was dir gefällt und wo wir noch Luft nach oben haben. So wird unser KI-Newsletter im nächsten Jahr noch relevanter, spannender und nützlicher für dich. Hier zur Umfrage!
Heute habe ich für dich:
Die wichtigsten News der Woche 🔥
Erkenntnis der Woche: Ein KI-Jahr voller Überraschungen🚀
5 Nützliche AI-Tools 🤖
AI-Tutorial der Woche: Last-Minute-Weihnachtsgeschenk: Dein Weihnachtsgedicht mit ChatGPT Canvas 📝
🔥 AI-NEWS
Google bringt starkes, neues Videomodell und übertrifft Sora
Google hat mit Veo 2 und Imagen 3 zwei neue Modelle vorgestellt, die das Rennen um die Spitzenposition in der KI-generierten Medienproduktion anführen. Veo 2 erstellt 8-Sekunden-Videos in 4K-Qualität und bietet beeindruckende Verbesserungen in Realismus und Physiksimulationen – womit sie in Tests sogar OpenAIs Sora übertreffen konnten. Das Bildmodell Imagen 3 punktet mit lebendigeren Farben und einer besseren Detailtreue und schlägt Konkurrenten wie Midjourney und Ideogram. Momentan sind die Modelle in Deutschland noch nicht zugänglich.
Ein Grund, warum Google hier so stark auftrumpfen kann, liegt in der riesigen Datengrundlage von YouTube. Interessant ist dabei die neue Entscheidungshoheit für Content-Creator: Sie können nun gezielt freigeben, ob Drittunternehmen wie OpenAI oder Meta ihre YouTube-Videos für KI-Trainingszwecke nutzen dürfen. Standardmäßig bleibt der Zugriff für externe Player blockiert. Google hingegen behält sich vor, weiterhin eigenes Material für das KI-Training einzusetzen – und sichert sich so einen strategischen Vorteil für Modelle wie Veo 2 und Imagen 3.
Google veröffentlicht Gemini 2.0: KI mit „Augen“ und Langzeitspeicher
Google hat kürzlich sein neues KI-Modell Gemini 2.0 vorgestellt – ein bedeutender Fortschritt in der Entwicklung von KI-Agenten. Mit Gemini 2.0 setzt Google auf noch leistungsfähigere multimodale Fähigkeiten, die Text, Bild, Audio und Video integrieren. Neben einer verbesserten Multimodalität bietet Gemini 2.0 auch fortschrittliche Funktionen wie Logik- und Schlussfolgerungsfähigkeiten.
Ein besonderes Highlight ist das Projekt Astra, das die KI mit der Fähigkeit ausstattet, die Welt zu „sehen“ und interaktive Aufgaben im Browser zu übernehmen. Diese Neuerungen sind Teil von Googles Vision, universelle KI-Assistenten zu entwickeln.
Neben diesen Innovationen bietet Gemini 2.0 auch fortschrittliche Funktionen wie langes Kontextverständnis und eine schnellere Reaktionszeit. Entwicklern und ausgewählten Testern wird das Modell ab sofort zur Verfügung gestellt, eine breite Einführung soll im kommenden Jahr erfolgen.
Google testet KI-Smartglasses mit Gemini 2.0
Nach dem Flop der Google Glasses vor einigen Jahren hat Google einen neuen Prototyp für smarte Brillen entwickelt, die mit Gemini 2.0 ausgestattet sind. Die Brillen sollen Echtzeitübersetzungen, Navigation durch Google Maps und Sprachsteuerung bieten – alles direkt vor den Augen des Users.
Durch die Auslagerung der Rechenleistung auf das Smartphone bleibt das Design minimalistisch und leicht. Damit tritt Google in Konkurrenz zur Apple Vision Pro und Metas Ray-Ban, die bislang nicht massentauglich sind. Wann die Brille auf den Markt kommt, ist nicht bekannt.
12 Days of OpenAI mit spannenden neuen Features
Bei OpenAI laufen nach wie vor die 12 Days of OpenAI mit täglichen Releases. Besonders spannend in den letzten Tagen waren:
ChatGPT-Projekte: Eine neue Funktion, um Chats, Dokumente und KI-Anweisungen in einem praktischen Ordnersystem zu organisieren – verfügbar für Plus, Pro und Teams-Nutzer.
Such-Update: Die Suchfunktion SearchGPT ist nun für alle User weltweit zugänglich. ChatGPT kann damit das Internet nach aktuellen Informationen durchsuchen, und es werden visuelle Elemente wie Restaurantbewertungen direkt in der App angezeigt.
Santa-Stimme: Pünktlich zu den Feiertagen lässt sich die Stimme von ChatGPT auf den “Santa-Modus” umstellen (verfügbar im Advanced Mode).
OpenAI o1 API: Mit der neuen o1 API können Entwickler komplexe, mehrstufige Aufgaben effizienter lösen, Daten integrieren und Modelle anpassen. Besonders nützlich: Preference Fine-Tuning zur individuellen Anpassung von Modellen basierend auf Nutzerpräferenzen.
Video und Sprachchat: Ab sofort ist es möglich, per Video und Stimme mit ChatGPT zu interagieren – für eine persönlichere Kommunikation (in Deutschland noch nicht verfügbar).
Bildschirm teilen: Nutzer des Advanced Voice-Modus können jetzt ihren Bildschirm teilen, um direktes Feedback zu erhalten (in Deutschland noch nicht verfügbar).
ChatGPT bekommt eigene Telefonnummer: Dadurch ermöglicht es OpenAI Nutzern in den USA die Interaktion mit ChatGPT per Anruf oder WhatsApp-Nachricht.
Microsoft stellt Phi-4 vor
Microsoft hat Phi-4, ein neues Sprachmodell mit nur 14 Milliarden Parametern, veröffentlicht. Trotz seiner geringen Größe übertrifft es größere Modelle wie GPT-4o und Gemini Pro 1.5 in Bereichen wie mathematischem Denken und komplexen Aufgaben. Das Geheimnis: Eine smarte Architektur und effizientes Training. Phi-4 wurde mit synthetischen Daten trainiert und löst wissenschaftliche Aufgaben auf Hochschulniveau besser als seine Vorgänger.
Grok AI wird schneller, smarter und zitiert Quellen
Elon Musks KI-Chatbot Grok hat ein großes Update erhalten. Ab sofort liefert die neue Version dreimal schnellere Antworten, präzisere Ergebnisse und unterstützt mehrere Sprachen. Ein Highlight ist die Quellenangabe: Grok zitiert nun sowohl X-Beiträge als auch externe Websites, um die Informationen transparenter und vertrauenswürdiger zu machen. Während Nicht-Premium-Nutzer bis zu zehn Anfragen alle zwei Stunden stellen können, haben Premium-Abonnenten erweiterte Nutzungsmöglichkeiten und frühzeitigen Zugang zu neuen Funktionen wie dem Bildgenerator Aurora.
Neue KI erstellt mehrminütige Filme aus Textideen
Das KI-Startup Higgsfield hat mit ReelMagic eine Plattform entwickelt, die aus einfachen Textideen vollständige, mehrminütige Videos zaubert. Die Plattform übernimmt auf Grundlage eines kurzen Prompts alles: Drehbuch schreiben, Rollen besetzen, filmen und schneiden – alles in wenigen Minuten. Die intelligente Technik wählt automatisch die besten KI-Modelle für jede Szene aus. Ein spannender neuer Player im Bereich KI-Videoproduktion.
🧠 ERKENNTNIS DER WOCHE
2024: Ein KI-Jahr voller Überraschungen
Was für ein Jahr! Wer hätte gedacht, dass Künstliche Intelligenz 2024 schon so präsent sein würde? Was zu Jahresbeginn noch eher ein Thema für Technik-Fans war, hat sich in nur zwölf Monaten in fast alle Bereiche unseres Lebens eingeschlichen.
Frühling: Der große Knall in der Videowelt
Im Frühling kam die erste große Überraschung: OpenAI stellte Sora vor und präsentierte der Welt damit den Durchbruch in der KI-Videogenerierung. Was bei Bildern schon ein Weilchen möglich war, klappte plötzlich auch bei Videos – so realistisch, dass selbst Hollywood aufhorchte.
Aber das war noch nicht alles: Firmen wie Google und Meta investierten kräftig in ihre KI-Zukunft. Klar war: Im Jahr 2024 würden alle Player im Bereich KI Vollgas geben. Auch wenn zeitgleich Deepfake-Scams Fahrt aufnahmen und die Schattenseiten der künstlichen Intelligenz offenbarten.
Sommer: KI als wirtschaftlicher Wachstumstreiber
Der Sommer offenbarte eindrucksvoll das wirtschaftliche Potenzial von Künstlicher Intelligenz. Unternehmen wie Amazon, Nvidia und Apple verzeichneten Rekordumsätze durch ihre KI-Produkte, während Apple mit dem iPhone 16 zeigte, wie KI zunehmend in Alltagsanwendungen integriert werden kann. Ein Meilenstein war außerdem das europäische KI-Gesetz, das globale Standards setzte und die ethische Debatte um KI vorantrieb.
Herbst: KI erobert die Arbeitswelt
Der Herbst brachte den nächsten großen Schritt für KI in der Arbeitswelt. Sie übernahm u. a. autonom die Steuerung und Programmierung von Software. Darüber hinaus konnten KI-Assistenten wie ChatGPT nun neben Texten auch Bilder, Sprache und sogar Videos verstehen. Diese multimodalen Fähigkeiten brachten eine neue Dimension der KI-Nutzung und legten die Grundlage für autonome KI-Agenten, die 2025 die Arbeitswelt weiter verändern könnten. Google und Meta beeindruckten mit fotorealistischen KI-Videos und Echtzeit-Übersetzungen, die die Art und Weise, wie wir arbeiten und kommunizieren, grundlegend verändern könnten.
Winter: KI ist jetzt überall – und noch viel mehr
Und dann der Winter: KI war endgültig überall. Tools wie Sora und Grok wurden für die breite Masse zugänglich, und OpenAIs CEO sprach bereits von der Möglichkeit einer Allgemeinen Künstlichen Intelligenz (AGI) bis 2025. Der Trend zur Integration von KI in alle größeren Apps und Plattformen setzte sich fort.
Nun stehen erste KI-Roboter in den Startlöchern. Tesla präsentierte mit Optimus einen humanoiden Roboter, der einen ersten Blick darauf bot, was 2025 noch kommen könnte. Der langsame, aber stetige Trend zu KI-gestützten Robotern wird Fahrt aufnehmen.
Ausblick: 2025 wird noch rasanter
Was erwartet uns 2025? In unserer nächsten Ausgabe Anfang des Jahres geben wir einen umfassenden Überblick über die wichtigsten Trends, die uns 2025 erwarten – von technologischen Durchbrüchen bis hin zu neuen Herausforderungen. Freuen wir uns auf ein weiteres Jahr voller KI!
🤖 AI-TOOLS
Gensmo: KI-Such-App für personalisierte Outfit- und Geschenkideen. (Link)
QuickPR: Vereinfache dein digitales PR-Management und steigere die Markenbekanntheit mit einer Plattform. (Link)
Curlent: KI-gestützte Aktienanalyse und -auswahl in wenigen Minuten. (Link)
Pika 2.0: Neues kreatives Videomodell, mit dem du deine Videos kinderleicht nach deinem Geschmack erstellst. (Link)
TopView: Professioneller KI-Videoeditor. (Link)
🧑🏫 AI-TUTORIAL DER WOCHE
Last-Minute-Weihnachtsgeschenk: Dein Weihnachtsgedicht mit ChatGPT Canvas
Fehlt dir etwa noch ein Weihnachtsgeschenk? Wie wäre es mit einem ganz persönlichen, „selbstgeschrieben” (zusammen mit KI als Assistenten) Weihnachtsgedicht? Die Canvas-Funktion von ChatGPT machts möglich und ist jetzt für alle verfügbar. So gehts.
Schritt 1: Neuen Chat starten
Öffne ChatGPT und aktiviere die Canvas-Funktion, indem du auf „Tools anzeigen“ klickst oder den Prompt „Öffne die Canvas-Funktion“ eingibst.
Schritt 2: Erstelle einen Chat und füge ihn in einem Projekt ein
Erstelle einen neuen Chat mit dem Modell GPT 4o und klicke auf die drei Punkte neben deinem Chat und wähle „Zu Projekt hinzufügen“. Erstelle ein neues Projekt, z. B. „Weihnachtsgedicht“, um alles übersichtlich zu organisieren.
Schritt 3: Gedicht generieren
Wähle bei den Tools “Canvas” aus und gib einen kreativen Prompt ein, z. B. „Schreibe ein Weihnachtsgedicht im Stil von Theodor Storm“.
Schritt 4: Bearbeiten
Jetzt kannst du das Gedicht nach deinen Vorstellungen anpassen:
Neue Zeilen hinzufügen: Schreibe eigene Strophen direkt im Canvas.
Text verschieben: Ändere die Reihenfolge der Strophen, indem du Textblöcke per Drag & Drop verschiebst.
Schritt 5: Feinschliff mit dem „Magischen Stift“
Nutze den Stift unten rechts in der Canvas Ansicht für den Feinschliff.
Text verbessern: Lass einzelne Strophen umschreiben, erweitern oder kürzen.
Stil anpassen: Gib Hinweise für Ton und Stil (z. B. „Mach es humorvoller“ oder „Verwende Paarreime“).
Thema erweitern: Ergänze zusätzliche Details, wie „eine verschneite Winterlandschaft“, um das Gedicht noch lebendiger zu gestalten.
Viel Spaß und Frohe Weihnachten!
Das war’s für dieses Jahr. Vielen Dank fürs Lesen!
Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. 🤗 (Anmeldelink).
Hier kannst du gerne meine vorherigen Newsletter durchstöbern.
Bis nächste Woche!
Henry