Amazons KI-Plan: Nova fordert OpenAI und Google heraus

30% CYBER WEEK DEAL
Die stärkste AI-Community und -Lernplattform Deutschlands

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Heute habe ich für dich:

  • Die wichtigsten News der Woche🔥

  • Erkenntnis der Woche:  Selbstlernende KI – Evolution mit Nebenwirkungen? ⚠️

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche: Claude AI an deinen Schreibstil anpassen 🖊️


🔥 AI-NEWS

Amazons „Olympus“ wird zu „Nova“: Das neue Foundation-Modell ist da

Amazon lüftet mit seiner neuen Nova-Modellreihe den Schleier über das bislang als „Olympus“ bekannte Projekt. Die multimodalen Modelle sollen Text-, Bild- und Videodaten verstehen und verarbeiten – ein entscheidender Schritt, um im KI-Wettrennen endlich aufzuholen.

Nova fokussiert sich auf spezialisierte Video- und Bildverarbeitung und soll bereits nächste Woche auf den Markt kommen. Das Modell ermöglicht präzise Analysen wie das Verfolgen eines Basketballs in der Luft oder die Identifikation von Problemen an Unterwasser-Bohrgeräten. Damit setzt Amazon auf eine Nische, die bisher kaum erschlossen ist. Die Modelle sind über Amazon Bedrock zugänglich und bieten Lösungen für unterschiedliche Anwendungsfälle.

Die Nova-Modelle im Überblick

  1. Amazon Nova Micro: Ein reines Textmodell, das durch extrem geringe Latenz und niedrige Kosten überzeugt – ideal für einfache textbasierte Anwendungen.

  2. Amazon Nova Lite: Ein kostengünstiges Multimodal-Modell, das blitzschnell Text-, Bild- und Videoeingaben verarbeitet. Perfekt für Anwendungen, bei denen Geschwindigkeit entscheidend ist.

  3. Amazon Nova Pro: Dieses Modell kombiniert Genauigkeit, Geschwindigkeit und Kosten in einer Balance und eignet sich für ein breites Spektrum an Aufgaben.

  4. Amazon Nova Premier: Das leistungsfähigste Modell der Reihe für komplexe Schlussfolgerungsaufgaben und als Top-Auswahl zur Erstellung individueller Modelle. Die Verfügbarkeit ist für das 1. Quartal 2025 geplant.

  5. Amazon Nova Canvas: Ein hochmodernes Modell für Bildgenerierung, das sich besonders an kreative und gestalterische Branchen richtet.

  6. Amazon Nova Reel: Ein innovatives Modell für die Videogenerierung, das die Möglichkeiten im Bereich Medien und Content-Produktion revolutionieren könnte.

Während Nova bei der Textgenerierung nicht an die Modelle von OpenAI oder Anthropic heranreicht, setzt Amazon auf spezialisierte Funktionen und wettbewerbsfähige Preise, um Marktanteile zu gewinnen.

Trotz der Milliardeninvestitionen in Anthropic setzt Amazon mit Nova auf Eigenentwicklungen. Diese Kombination könnte Amazon eine Schlüsselrolle im KI-Markt sichern – und mit Nova wird das Unternehmen endlich sichtbar in der KI-Landschaft.

Amazon und Anthropic: Mega-Supercomputer „Rainer“

Amazon baut mit „Projekt Rainer“ einen der größten KI-Supercomputer der Welt. Das EC2 UltraCluster basiert auf Hunderttausenden der selbst entwickelten Trainium-2-Chips von Amazon. Nach seiner Fertigstellung wird es die Größe des Clusters, das für Anthropics derzeit leistungsstärkstes Modell genutzt wurde, um das Fünffache übertreffen. Ziel ist es, generative KI kosteneffizienter und zugänglicher zu machen.

Die neuen Ultraserver, die 64 Trainium-2-Chips bündeln, ermöglichen eine Rechenleistung, die mit Nvidias GPUs konkurrieren kann – und das bei bis zu 40% geringeren Kosten. Amazon stärkt damit seine Position im KI-Markt und zeigt, dass es auch ohne Nvidia bedeutende Fortschritte erzielen kann.

Der Name „Rainer“ ist dabei Programm: Wie der mächtige Mount Rainier steht dieses Projekt sinnbildlich für Größe und technologische Spitzenleistung. Mit Partnern wie Anthropic will Amazon generative KI für Unternehmen weltweit skalierbar machen.

World Labs verwandelt Bilder in immersive 3D-Welten

World Labs, das Start-up von Fei-Fei Li, hat ein KI-System vorgestellt, das aus einem einzigen Bild eine interaktive 3D-Welt generiert. Nutzer können die Szene in Echtzeit erkunden, mit dynamischen Kamerafunktionen anpassen und Objekte modifizieren.

Die Technologie erzeugt konsistente und physikalisch korrekte Szenen, die sich durch Stabilität und Präzision auszeichnen. In einer Demo wurde Edward Hoppers Gemälde „Nighthawks“ in eine begehbare 3D-Umgebung transformiert. Erste Tools für Film- und Spieleentwickler sollen 2025 verfügbar sein.

Auch DeepMind’s Genie 2 erstellt spielbare Welten aus Bildern

DeepMind hat mit Genie 2 ein KI-Modell vorgestellt, das aus einfachen Bildvorgaben interaktive 3D-Umgebungen erstellt. Diese Welten bieten Echtzeit-Physik, realistische Lichtsimulation und Spielersteuerung, unterstützt durch First- und Third-Person-Perspektiven. Besonders bemerkenswert ist die Fähigkeit, räumliches Gedächtnis zu bewahren, was eine realistischere Interaktion ermöglicht.

Nur wenige Tage nach der Ankündigung von World Labs tritt DeepMind in den Wettbewerb der Weltenerstellung ein. Genie 2 bietet unbegrenzte, vielfältige Trainingsumgebungen – ein entscheidender Schritt für die Entwicklung fortschrittlicher KI-Agenten. Zudem könnte es das Game-Design-Prototyping beschleunigen und kreativen Prozessen völlig neue Möglichkeiten eröffnen.

OpenAI erwägt Werbung, hält sich aber bedeckt

OpenAI erwägt, Werbung als mögliche Einnahmequelle zu testen, um die steigenden Kosten für KI-Entwicklung und -Betrieb zu decken. CFO Sarah Friar betonte jedoch, dass es aktuell keine aktiven Pläne gibt, Werbung einzuführen.

Trotz dieser Zurückhaltung hat OpenAI kürzlich Experten aus der Werbebranche rekrutiert, darunter Shivakumar Venkataraman, den ehemaligen Leiter der Suchanzeigen bei Google. CEO Sam Altman bleibt skeptisch und bezeichnet Werbung als „letztes Mittel“. Bisher stützt sich OpenAI vor allem auf Abo-Modelle und API-Lizenzen.

Mit geschätzten Kosten von über fünf Milliarden Dollar jährlich muss OpenAI langfristig jedoch zusätzliche Einnahmequellen erschließen.

ElevenLabs bringt GenFM: Die Zukunft des Podcastings

ElevenLabs hat GenFM vorgestellt – ein KI-Tool, das automatisch Podcasts aus YouTube-Videos, Dokumenten oder Texten erstellt. Das Besondere: Die Podcasts simulieren natürliche Gespräche zwischen zwei Sprechern, mit Pausen, „Ähms“ und sogar Lachen. Über ein Dutzend Stimmen stehen zur Auswahl, und die Technologie unterstützt 32 Sprachen, darunter auch Deutsch.

Im Vergleich zu anderen Tools wie NotebookLM, die oft „steril“ wirken, bietet GenFM eine menschlichere und authentischere Podcast-Erfahrung. ElevenLabs kombiniert modernste KI-Technologie mit kreativem Storytelling und hebt das Podcasting auf ein neues Level.

GenFM ist in der ElevenReader-App für iPhones ab iOS17 integriert und soll auch bald für Android erscheinen. Es ist ein spannendes Tool für die Zukunft des Audio-Contents!

KI-Video-Innovationen: Tencent, MiniMax, Google und Kling setzen neue Maßstäbe

Wieder einmal gibt es spannende Neuerungen im Bereich KI-Video. Hier die Highlights:

Tencent hat das Hunyuan-Video-Modell mit 13 Milliarden Parametern als Open Source veröffentlicht, was Entwicklern nun ermöglicht, fortschrittliche Videoerstellungsfunktionen zu nutzen. Das Modell bietet neue Möglichkeiten für die KI-Videoerstellung und setzt Maßstäbe für Open-Source-Entwicklungen in diesem Bereich.

MiniMax hat die l2V-01-Live Technologie vorgestellt, mit der 2D-Kunst in fließende, dynamische Animationen verwandelt wird. Besonders für Anime-Fans dürfte die neue Technologie ein Highlight sein, da sie bekannten Illustrationen neues Leben einhaucht.

Google Cloud integriert die fortschrittlichen Modelle Veo und Imagen 3 in Vertex AI, wodurch Unternehmen erstmals Zugang zu diesen leistungsstarken Tools erhalten. Damit wird die Erstellung hochwertiger Videos und realistischer Bilder effizienter und einfacher nutzbar.

Kling AI Try-On” lässt dich Outfits visuell anprobieren, um den perfekten Look zu finden. Diese innovative Funktion könnte die Modebranche und die Art, wie Nutzer Kleidung online entdecken, verändern.


WERBUNG

Die AMD Ryzen™ PRO Prozessoren bringen KI direkt auf euren Laptopohne Cloud und Internet. Das bedeutet: schnelleres Arbeiten, volle Kontrolle über eure Daten und maximale Sicherheit dank der mehrschichtigen Architektur und dem AMD Secure Processor.

Mit über 150 KI-optimierten Anwendungen wie Adobe Premiere Pro bietet AMD die perfekte Plattform für AI-gestützte Workflows – egal, ob es um Multitasking, Videoschnitt oder Datenanalyse geht. Und mit bis zu 29 Stunden Akkulaufzeit seid ihr überall produktiv.

Das Beste? Testet die Technologie kostenlos mit dem AMD Leihprogramm und bringt euer Business auf das nächste Level! (Link)


🧠 ERKENNTNIS DER WOCHE

Selbstlernende KI – Evolution mit Nebenwirkungen? 

Eine KI, die eigenständig lernt und sich selbst verbessert – klingt bahnbrechend, oder? Genau das hat DeepMind mit ihrem Konzept „Boundless Socratic Learning“ im Sinn. Damit könnte die nächste Generation von KI-Systemen ganz ohne menschliches Feedback oder externe Daten Fortschritte machen. Revolutionär, aber nicht ohne Tücken.

Das Prinzip dahinter erinnert an eine Art Spielplatz für KI-Agenten: In sogenannten „Sprachspielen“ interagieren sie miteinander, tauschen Wissen aus und bewerten ihre eigenen Fortschritte. Dabei geht es nicht nur ums Üben – die KI kann sogar eigene Trainingspläne erstellen und sich anpassen, wenn etwas nicht optimal läuft. In der Theorie könnte sie irgendwann ihren eigenen Code überarbeiten und so die Grenzen ihrer ursprünglichen Programmierung sprengen.

Das klingt genial, aber …

… genau hier wird es knifflig. Was passiert, wenn eine KI selbst entscheidet, was richtig oder falsch ist? Wie stellen wir sicher, dass ihre Ziele mit unseren Werten übereinstimmen? Und vor allem: Können wir die Kontrolle behalten, wenn diese Systeme anfangen, schneller zu lernen, als wir verstehen?

DeepMind öffnet mit selbstlernender KI die Tür zu einer aufregenden Zukunft, aber auch zu einem riesigen Fragezeichen. Es wird entscheidend sein, diese Technologie nicht nur klug, sondern auch verantwortungsvoll zu gestalten. Denn so faszinierend „grenzenloses Lernen“ auch ist – am Ende muss der Mensch das letzte Wort behalten.


🤖 AI-TOOLS

  • Pine: KI-Assistent, der Rechnungen analysiert, unfaire Gebühren erkennt und Streitigkeiten für dich klärt. (Link)

  • DataFuel: Tool, das Webseiten in LLM-fähige Daten umwandelt und Wissensdatenbanken in einer Anfrage durchsucht. (Link)

  • Side Space: Organisiere deine Browser-Tabs mit einer vertikalen Ansicht für besseres Multitasking. (Link)

  • MukuAI: Die erste KI-Agentur, die UGC-Videos mit KI-Avataren erstellt. (Link)

  • Ideaape: Marktanalyse-Tool, das dir KI-gestützte Einblicke liefert. (Link)


🧑‍🏫 AI-TUTORIAL DER WOCHE

Claude AI an deinen Schreibstil anpassen

Mit der neuen Funktion von Claude AI kannst du den Schreibstil der KI so anpassen, dass er deinen eigenen Stil widerspiegelt. So funktioniert es:

Schritt 1: Auf die Website oder App zugreifen

Gehe auf die offizielle Claude-Website oder öffne die App. (Link)

Schritt 2: Schreibstil auswählen

Unter dem Texteingabefeld findest du die Option „Choose Style“. Wähle hier einen der drei voreingestellten Stile aus:

  • Formal: Perfekt für professionelle Inhalte.

  • Concise: Kurz und knackig für schnelle Antworten.

  • Explanatory: Ideal für ausführliche und verständliche Erklärungen.

Schritt 3: Eigenen Schreibstil erstellen

Klicke auf „Create your style“ und wähle eine der folgenden Optionen:

  • Schreibprobe hochladen: Lade ein Dokument hoch oder füge Text ein, der deinen Schreibstil zeigt.

  • Stil beschreiben: Schreibe eine Beschreibung deines Stils, so ausführlich wie möglich.

Schritt 4: Analyse bestätigen

Bestätige deine Eingaben, damit Claude AI deinen Stil analysieren kann. Die KI passt ihre Antworten ab sofort deinem ausgewählten Schreibstil an, um die Interaktion persönlicher und natürlicher zu gestalten.

Probier es aus und bringe deinen Stil in die Welt der KI!


Das war’s für diese Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. 🤗 (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächste Woche!

Henry


Zurück
Zurück

Sora ist hier – und Google setzt einen drauf!

Weiter
Weiter

Leak, Browser-Kampf & die große Frage: Können wir KI trauen?