Gigantische Entwicklungsschritte bei AI-Bildern und -Videos

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Heute habe ich für dich:

  • Die wichtigsten News der Woche 🔥

  • Erkenntnis der Woche: Stellt dieses neue Tool jetzt TikTok & Instagram komplett auf den Kopf? 🧠

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche: So verwandelst du (alte) Gamefiguren in real wirkende Charaktere 🧑‍🏫



🔥 AI-NEWS

GPT Store kommt später – dafür stehen andere Updates an

Erst vor wenigen Wochen kündigte OpenAI an, dass User künftig ganz ohne Programmierkenntnisse via ChatGPT eigene Chatbots erstellen und in einem GPT-Store verkaufen können. Der Start des Stores war ursprünglich für November geplant. Nun hat OpenAI den Start seines GPT-Stores wegen “unerwarteter Dinge” auf Anfang 2024 verschoben. Einen genauen Termin für den Start gibt OpenAI nicht an, stellt aber bis dahin "einige weitere große Updates" in Aussicht.

Welche großen Updates das sind, darüber lässt sich ebenfalls nur munkeln. Eine Möglichkeit: Veröffentlichte Screenshots deuten darauf hin, dass OpenAI an einer neuen Version von ChatGPT arbeitet. Diese Version soll in der Lage sein, aus sämtlichen Chat-Daten eines Accounts zu lernen und so im Laufe der Zeit immer hilfreicher zu werden.

Google Deepmind startet mit GPT-4-Rivalen Gemini

Es ist ihre fortschrittlichste multimodale KI bisher und gilt als größter Konkurrent von GPT-4. Das KI-Modell versteht Texte, Bilder, Audio-, Videoinhalte und Code und wird als Meilenstein bezeichnet. Gemini gibt es in drei Größen: Ultra für komplexe Aufgaben, Pro für vielfältige Einsatzmöglichkeiten und Nano für effiziente Aufgaben auf Geräten.

Gemini Ultra übertrifft in 30 von 32 Benchmarks für LLM-Forschung und -Entwicklung und ist das erste KI-Modell, das mit 90% auf dem MMLU-Benchmark besser als menschliche Experten abschneidet. Zu den Funktionen gehören ausgefeiltes Reasoning, Multimodalität und fortgeschrittene Codierung.

Gemini Pro wird ab heute in Google-Produkten wie Gmail, YouTube und Docs durch Bard integriert. Gemini Ultra wird Anfang nächsten Jahres eingeführt. Gemini wird auch direkt auf dem Pixel 8 mit Gemini Nano verfügbar sein.

Dies ist bedeutsam, da Googles lang erwarteter "ChatGPT-Killer" nun mit drei einzigartigen Modellen für mehr Flexibilität da ist. Zwar müssen wir noch auf die volle Leistung von Gemini Ultra warten, allerdings können wir bereits Gemini Pro in Bard nutzen, das wohl aktuell der bester kostenlose Chatbot ist.

Microsoft führt KI-Assistent Copilot für Windows-10-Nutzer ein

Microsoft hat die Testversion seines KI-Assistenten Copilot für Windows-10-Nutzer veröffentlicht. Durch ein entsprechendes Update können Anwender Copilot zur Taskleiste hinzufügen und die Funktionen ausprobieren. Die Vorschau steht vorerst einer begrenzten Nutzerzahl zur Verfügung und wird in den kommenden Monaten schrittweise erweitert. Das Preview-Update ist ausschließlich für "nicht verwaltete" Geschäftsgeräte und private Geräte mit Windows-10-Home- oder -Pro-Editionen verfügbar.

Copilot soll Nutzern vielseitige Unterstützung bei verschiedenen Aufgaben bieten, indem er u. a. KI in Programme wie Paint integriert, Unterstützung beim Verfassen von E-Mails bietet und die Bildbearbeitung vereinfacht.

Runway ML und Getty Images schließen Partnerschaft für KI-Video-Modell

Das KI-Video-Startup Runway ML hat eine Partnerschaft mit dem Stock-Medienriesen Getty Images abgeschlossen. Gemeinsam arbeiten sie an der Entwicklung des "Runway & Getty Images Models" (RGM), einem fortschrittlichen generativen Modell, das Unternehmen die Erstellung maßgeschneiderter, hochwertiger Videoinhalte ermöglichen soll. Die Synergie aus Runways fortschrittlicher KI und Gettys umfangreicher Bildbibliothek verspricht viele spannende Möglichkeiten in der Videoproduktion. RGM soll voraussichtlich in den kommenden Monaten für die kommerzielle Nutzung zur Verfügung stehen.

Neues KI-Modell SDXL Turbo generiert Bilder in Sekunden

Stability AI hat seinem Bildgenerator "Stable Diffusion" ein Upgrade verpasst. Mit einer neuen Methode namens "Adversarial Diffusion Distillation" (ADD) kann das Modell nun Bilder nahezu in Echtzeit auf Basis von Textprompts generieren. In einem kurzen Video präsentiert Stability AI die neue Funktion, bei der Bilder praktisch genauso schnell entstehen, wie der Nutzer Worte in die Eingabe tippt. Ein bedeutender Vorteil von SDXL Turbo liegt darin, dass bei KI-generierten Bildern selten die erste Version perfekt ist. Dank des Upgrades können Anpassungen in Sekundenschnelle vorgenommen werden, ohne wiederholt auf neue Ergebnisse warten zu müssen. Hier auf der Plattform Clipdrop kannst du das Tool kostenlos ausprobieren.


🧠 ERKENNTNIS DER WOCHE

Stellt diese neue KI jetzt TikTok und Instagram komplett auf den Kopf?

Mal ehrlich: Hast du dich schon an einem der unzähligen TikTok-Tänze probiert? Nein? So wie es aussieht, kann bald jeder in nur wenigen Sekunden zum Profitänzer werden – selbst wenn du eigentlich der größte Körperklaus bist.

Möglich macht das ein neues KI-Tool der Alibaba Group: Mit Animate Anyone kannst du ein Foto von dir animieren, sodass es aussieht, als würdest du dich flüssig bewegen (oder eben tanzen). Das funktioniert nicht nur mit Fotos echter Menschen, sondern z. B. auch mit Cartoon- oder Anime-Charakteren.

Dieses Tool könnte TikTok und Instagram in den nächsten Monaten komplett auf den Kopf stellen: Kurze Clips, in denen Outfits gezeigt oder Tänze präsentiert werden, lassen sich mit der KI in wenigen Sekunden erstellen, genauso unterhaltsamer Content mit jeglichen Cartoonfiguren. Bricht damit eine neue Ära der Content Creation an? Wir halten die Augen offen – oder versuchen es zumindest. Denn die mit Animate Anyone erstellten Inhalte werden sich nur schwer von echten Videos unterscheiden lassen.

Hier auf Hugging Face kannst du das Tool ausprobieren.


🤖 AI-TOOLS

  • Meshy: AI-Tool, mit dem du Texte und Bilder in 3D-Modelle verwandeln kannst. (Link

  • Ollie: Der AI-Einkaufsberater hilft dir, die perfekten Geschenke zu finden. (Link

  • Postwise: AI-Twitter-Tool, das für dich u. a. Tweets verfasst und Beiträge einplant. (Link

  • Dubbing AI: Mit Dubbing AI kannst du deine Stimme in Echtzeit mit AI verstellen. (Link

  • GETitOUT: Tool, das dir mit AI-Personas hilft, deine Zielgruppe besser zu verstehen. (Link


🧑‍🏫 AI-TUTORIAL DER WOCHE

So verwandelst du (alte) Gamefiguren in real wirkende Charaktere

Bei Twitter und Instagram werden gerade Beiträge gehyped, in denen Fotos (älterer) Videospiele oder Zeichentrickserien in realistisch wirkende Fotos verwandelt werden.

Du wolltest auch immer mal wissen, wie Mario, Lara Croft oder Zelda in Echt aussehen würden? Mit diesen Tools klappts:

  • Magnific ist ein KI-Tool, das Bilder mithilfe von KI hochskalieren kann. Wenn du dir dabei etwas mehr Fantasie wünschst, kann Magnific auch neue Details „halluzinieren“. (Link)

  • Alternativ kannst du Krea AI ausprobieren. Das Tool funktioniert ähnlich. (Link)

Viel Spaß beim Ausprobieren!


Das war’s für diese Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. 🤗 (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächsten Mittwoch!

Henry


Zurück
Zurück

Diese neuen KI-Vorschriften gelten bald in der EU

Weiter
Weiter

OpenAI Mitarbeiter warnen vor bedrohlicher KI