KI-Wahnsinn: Neue Meilensteine in der KI-Revolution!

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Heute habe ich für dich:

  • Die wichtigsten News der Woche 🔥

  • Erkenntnis der Woche: Gefahr für Hollywood? Diese Chancen & Herausforderungen bringt Sora 🎬

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche: Befrei dich von langweiligen Arbeitsabläufen mit ChatGPT und Zapier 📝



🔥 AI-NEWS

Durchbruch bei KI-Videos: Sora erschafft realistische Videos

Wahrscheinlich hast du bereits von Sora gehört, aber weil es ein großer Durchbruch ist, möchte ich es in den News der Woche unbedingt noch einmal hervorheben und ein paar zusätzliche Infos dazu geben.

OpenAI hat ein neues KI-Modell namens Sora vorgestellt, das kurze Videos von bis zu 60 Sekunden in unglaublich realistischer Qualität generiert. Die Ergebnisse von Sora übertreffen deutlich bisherige Text-zu-Video-Tools wie Runway Gen-2 oder Pika.

Sora geht weit über die Grenzen hinaus, die wir bislang von Text-zu-Video-Tools kennen, indem es interaktive 3D-Welten erstellt, die Videospielumgebungen ähneln. Die typischen Probleme bisheriger KI-Videos kennt Sora nicht: Die Ergebnisse sind voller Details, realistischen Effekten und Kamerabewegungen. Obwohl Sora noch Grenzen hat, vor allem in physikalischen Fragen, ist jetzt schon seine Skalierbarkeit und damit sein gigantisches Potenzial erkennbar. Sora ist derzeit noch nicht öffentlich zugänglich und wird weiter verbessert.

In meinem YouTube-Video siehst du einige beeindruckende Sora Videos.

Wenn man wie bei Bildern jetzt auch Videos in einer Qualität mit KI generieren kann, die wie wie reale Aufnahmen wirken, dann hat das natürlich gigantische Auswirkungen. Das sehen wir uns weiter unten in Erkenntnis der Woche genauer an.

Microsoft investiert 3,2 Milliarden Euro für KI-Zukunft in Deutschland

Microsoft hat angekündigt, 3,2 Milliarden Euro in den deutschen Standort zu investieren. Das Geld soll hauptsächlich für den Ausbau von Rechenzentren für Cloud- und KI-Dienste sowie für KI-Weiterbildungen verwendet werden. Microsofts Ziel ist es, bis Ende 2025 1,2 Millionen Menschen in digitaler Kompetenz zu schulen. Die Investition ist die größte, die Microsoft in den 40 Jahren ihrer Präsenz in Deutschland getätigt hat.

Gemini bekommt ein vielversprechendes Upgrade

Woche für Woche überschlagen sich aktuell die News zu Googles neuer KI-Reihe Gemini. So auch diese Woche: Google hat Gemini 1.5 Pro angekündigt, eine neue Version ihrer KI-Reihe. Diese soll eine ähnlich gute Qualität wie ihr bisher stärkstes Modell, Gemini 1.0 Ultra, bieten, aber mit weniger Rechenleistung auskommen. Gemini 1.5 Pro kann bis zu 1 Million Token verarbeiten, im Vergleich zu 128.000 bei GPT-4 und 32.000 bei Gemini Pro.

Größere Token-Kapazitäten sind zunächst nichts Neues. Anthropic hatte bereits im Mai 2023 ein Update für den Claude Chatbot veröffentlicht, das eine Kapazität von 100.000 ermöglichte. Allerdings stiegen mit der Kapazität auch die Fehlerquoten. Gemini Pro 1.5 soll laut Google jedoch sehr präzise sein, selbst bei Audio- und Videoinhalten. Das wäre ein echter Durchbruch.

Die neue Tokengrenze von Gemini bedeuten eine enorme Erweiterung des Kurzzeitgedächtnisses des KI-Chatbots, was es ihm ermöglicht, viel mehr Informationen gleichzeitig zu verarbeiten. Allerdings bleibt auch hier wohl das Problem des Halluzinierens (falsche Informationen oder Fakten erfinden, die nicht auf realen Daten oder Ereignissen beruhen) bestehen, das selbst eine größere Anzahl von Token nicht lösen kann.

Wie üblich bei Google handelt es sich vorerst nur um eine Ankündigung. Wir halten dich hier auf dem Laufenden.

Will OpenAI Google mit eigener Suchmaschine herausfordern?

Gerüchten zufolge arbeitet OpenAI derzeit an der Entwicklung eines eigenen KI-gestützten Suchmaschinenprodukts. Es wird spekuliert, dass diese neue Suchmaschine auf der Bing-Suchtechnologie von Microsoft basieren und somit ein dialogorientiertes Sucherlebnis bieten könnte. Die Gerüchte erhalten zusätzliches Gewicht durch die Ankündigung von Microsoft vor etwa einem Jahr, mehr als 10 Milliarden US-Dollar in OpenAI zu investieren.

Obwohl die Details noch begrenzt sind, passt dieser Schritt zur Strategie von OpenAI, die Fähigkeiten von ChatGPT weiter auszubauen.

Die perfekte Ergänzung für Sora? AI Sound Effekte

OpenAIs neues Videotool Sora hat einen Nachteil: Die generierten Videos enthalten keinen Ton, da das Modell ausschließlich auf die Videoerstellung spezialisiert ist. Das KI-Startup ElevenLabs behauptet jetzt, eine Lösung für das Problem zu haben. Ihr neues Tool namens "AI Sound Effects" kann aus Texteingaben Klänge für Videos generieren.

Das offizielle Veröffentlichungsdatum soll bald bekannt gegeben werden. In einem Video teilt ElevenLabs aber bereits einige vielversprechende Beispiele ihrer Soundeffekte und kombiniert sie mit Sora-Videos. Du kannst das hier anschauen.

HeyGen ermöglicht personalisierte Videos

Im AI-Video-Creator-Tool HeyGen gibt es eine neue Funktion namens “Personalized Video”: User können in ihren Videos jetzt bestimmte Parameter, z. B. Namen, einfach austauschen. Wer Beispielsweise eine Videobotschaft an verschiedene Menschen schicken will, kann den Namen der angesprochenen Person im Video anpassen, ohne ein neues Video erstellen zu müssen. Das funktioniert ganz einfach über den Upload einer Tabelle oder auch automatisiert über Tools wie Zapier, Typeform oder eine API.

Meta arbeitet an neuer KI-Architektur

Meta hat eine neue KI-Architektur namens Video Joint Embedding Predictive Architecture (V-JEPA) vorgestellt. Sie ist ein Bestandteil von Metas Forschung im Bereich der JEPA-Architektur, welche darauf abzielt, KI-Systeme bei der Erfassung und Interaktion mit der physischen Welt zu unterstützen.

V-JEPA wurde von Metas KI-Leiter und Turing-Preisträger Yann LeCun sowie seinem Team entwickelt, um komplexe Interaktionen in Videos vorherzusagen und zu verstehen. Anstatt jedes einzelne Pixel eines Videos zu rekonstruieren, ergänzt das Modell fehlende oder verdeckte Teile, indem es eine abstrakte Darstellung der Szene dekodiert. Diese Darstellung ähnelt laut Meta der Art und Weise, wie Bilder in unserem Gehirn verarbeitet werden.

Telekom bringt Smartphone ohne Apps auf den Markt

Das Rennen um die Zukunft des Smartphones ist in vollem Gange. Nach Humanes AI Pin und dem Rabbit r1 bringt die Deutsche Telekom ihr KI-Phone als potenziellen Nachfolger auf den Markt.

Entwickelt in Zusammenarbeit mit Qualcomm und Brain.ai, wird das Gerät Ende Februar auf dem Mobile World Congress in Barcelona vorgestellt. Telekom beschreibt es als digitalen Assistenten, der User in verschiedenen Lebensbereichen unterstützen soll, beispielsweise bei Reiseplanungen oder dem wöchentlichen Einkauf.

Der Clou: Das KI-Phone soll frei von Apps sein, Anfragen werden per Sprache oder Texteingabe direkt an den KI-Assistenten gerichtet. Obwohl die genaue Funktionsweise noch nicht klar ist, wird vermutet, dass der Assistent geeignete Anwendungen im Browser auswählt. Wir sind gespannt auf die Präsentation und weitere Details Ende des Monats.

Reddit verkauft Nutzer-Inhalte an KI-Firma

Reddit hat einen Vertrag mit einem nicht namentlich genannten KI-Unternehmen abgeschlossen. Es soll sich um ein bedeutendes Unternehmen handeln, das beabsichtigt, seine Künstliche Intelligenz mithilfe der Reddit-Inhalte zu trainieren. Dafür soll Reddit jährlich 60 Millionen Dollar erhalten. Laut Bloomberg steht der Social-News-Aggregator kurz vor seinem Börsengang.

Mit dem unaufhörlichen Zustrom menschlicher Daten, die den Aufstieg der KI antreiben, verwandeln sich soziale Medienplattformen zunehmend in wahre Schatzkammern, gefüllt mit Daten, die ideal sind, um neue Modelle zu trainieren. Während Meta und X eigene KI-Ziele verfolgen, versuchen andere Plattformen wie Reddit anderweitig davon Profit zu schlagen.


🧠 ERKENNTNIS DER WOCHE

Gefahr für Hollywood? Diese Chancen & Herausforderungen bringt Sora

Als ich letzte Woche von OpenAIs neuestem Geniestreich Sora hörte, hatte ich eine Art zweiten ChatGPT-Moment. Das Gefühl: Wow. Hier entsteht gerade etwas Großes, etwas Revolutionäres. Ein echter Meilenstein.

Wie bei nahezu allen neuen technischen Entwicklungen bringt auch Sora seine Sonnen- und Schattenseiten, die ich hier einmal kurz beleuchten will.

Erstmal ist Sora zweifellos eine bahnbrechende Technologie, die eine Vielzahl von neuen Möglichkeiten eröffnet. Menschen wie du und ich haben bald die Chance, ihre Geschichten in beeindruckenden Videos zu erzählen. Dafür brauchen wir keinerlei Hintergrundwissen – wir müssen nur unsere blühende Fantasie in Prompts packen und schon können wir die Bilder aus unseren Köpfen für andere visualisieren. Der allgemeine Zugang zu leistungsfähigen Tools ist für mich ein wichtiger Schritt hin zu einer demokratisierten Medienlandschaft.

Was das für Hollywood bedeutet, ist schwer abzuschätzen. Tatsache ist: Sora bietet Filmstudios und Schauspieler, die exakt aussehen und handeln können, wie das Studio es will – und das zu jeder Zeit, ohne Bezahlung. Das klingt verlockend, oder? Für große Hollywood-Produktionen ist Sora jedoch noch nicht bereit. Die nächsten Entwicklungsschritte werden auf jeden Fall mit Spannung beobachtet.

Akuter sind wohl eher die klassischen Herausforderungen, die mit der Technologie einhergehen. Vor allem Deepfakes und die mögliche Verbreitung von Fehlinformationen sind hier mal wieder ein großes Thema. KI-Hersteller arbeiten schon seit einiger Zeit an Wegen, in KI-Inhalte eindeutige Erkennungsmerkmale wie Wasserzeichen einzubauen. Auch bei Sora-Videos soll erkennbar sein, dass sie von KI erzeugt wurden.

Sora ist zweifellos ein Durchbruch in der visuellen Technologie, der neue kreative Möglichkeiten eröffnet. Dennoch müssen die damit verbundenen gesellschaftlichen Herausforderungen sorgfältig angegangen werden, um sicherzustellen, dass die Vorteile dieser Technologie die potenziellen Risiken überwiegen.


🤖 AI-TOOLS

  • Zenfetch: AI-Tool, mit dem du Artikel, PDFs und YouTube-Videos sammeln und dir so eine personalisierte Datenbank erstellen kannst. (Link)

  • TurboScribe: Tool, das Audio- und Videoinhalte in Sekundenschnelle in präzisen Text umwandelt. (Link

  • Repeto: Tool, das es dir ermöglicht, mit Dokumenten zu interagieren: Du kannst u. a. mit ihm chatten, ein Quiz erstellen oder schwer verdauliche Themen visualisieren lassen. Perfekt zum Lernen! (Link)

  • Magiscan: App, mit der du reale Objekte fotografieren und sie mithilfe einer KI in 3D-Bilder verwandeln kannst. (Link

  • Neiro AI: Erstelle deinen menschlichen AI-Video-Avatar. (Link)


🧑‍🏫 AI-TUTORIAL DER WOCHE

Befrei dich von langweiligen Arbeitsabläufen mit ChatGPT und Zapier

Zapier ist ein Automatisierungstool, das es ermöglicht, verschiedene Apps miteinander zu verbinden. Durch die Erstellung von automatisierten Workflows, sogenannten "Zaps", kannst du bestimmte Aufgaben zwischen zwei oder mehr Anwendungen automatisch ausführen lassen. Zapier unterstützt eine Vielzahl von Anwendungen, darunter Notion, Slach, Gmail, Slack, Dropbox und viele andere.

Zapier kannst du zusätzlich mit ChatGPT verbinden und damit die Fähigkeiten der KI nutzen, um dich von langweiligen Arbeitsabläufen zu befreien. Ein paar Ideen, was du mit Zapier und ChatGPT machen kannst:

  • Slack-Nachrichten automatisch von ChatGPT in eine Notion To-Do-Liste umwandeln

  • Personalisierte Calendly-E-Mails mit ChatGPT senden

  • ChatGPT mit deinem Kalender verbinden, um Meetings vorzubereiten

KI-Automatisierungen wird bei mir ein Fokusthema in nächster Zeit sein und ich werde dazu viel mehr Content teilen. Ich sehe hier sehr viel Potential


Das war’s für diese Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächsten Mittwoch!

Henry


Zurück
Zurück

Nach Sora: Neue KI wird Gaming revolutionieren

Weiter
Weiter

Hype um Gemini-Ultra: Kann Googles neues KI GPT-4 verdrängen?