Hype um Gemini-Ultra: Kann Googles neues KI GPT-4 verdrängen?
Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!
Heute habe ich für dich:
Die wichtigsten News der Woche 🔥
Erkenntnis der Woche: Praxistest: Wie schlägt sich Gemini Ultra gegen GPT-4? 🥋
5 Nützliche AI-Tools 🤖
AI-Tutorial der Woche: So erstellst du deine persönlichen Chatbots ohne ChatGPT Plus Abo ⌨️
🔥 AI-NEWS
Kampf gegen Deepfakes: OpenAI und Meta führen Wasserzeichen ein
Erst letzte Woche konntest du in meinem Newsletter lesen, welche Gefahr von Deepfakes ausgeht und wie du dich davor schützen kannst. Jetzt gibt es passend dazu gute Nachrichten: OpenAI und Meta haben angekündigt, KI-generierte Bilder künftig mit einem Wasserzeichen zu versehen und Deepfakes so den Kampf anzusagen.
Bilder, die mit OpenAIs Bildgenerator Dall-E 3 erstellt wurden, erhalten nun ein Wasserzeichen in ihren Metadaten. OpenAI nutzt dafür die Coalition for Content Provenance and Authority (C2PA), eine Initiative, die die Herkunft digitaler Inhalte transparent machen möchte.
Meta möchte ebenfalls KI-Content deutlich kennzeichnen und geht dabei noch einen Schritt weiter: Das Unternehmen plant, KI-generierte Bilder und Videos auf Facebook, Instagram und Threads automatisch mit einem sichtbaren Symbol zu markieren. Dabei sollen sowohl Inhalte gekennzeichnet werden, die mit Metas eigenem KI-Tool „Imagine AI“ generiert wurden, als auch solche, die von Wettbewerbern wie Midjourney, Google, OpenAI oder Adobe stammen.
Nvidia veröffentlicht “Chat with RTX”: AI-Chatbot lokal auf deinem PC
Diese kostenlose KI bietet eine revolutionäre neue Möglichkeit, mit deinen Dateien zu interagieren. Der Chatbot läuft lokal, was bedeutet, dass die Ergebnisse schnell sind, du ihn ohne Internetverbindung verwenden kannst und die Daten des Benutzers privat bleiben. Dafür ist eine Windows RTX-Maschine erforderlich (RTX 30-Serie GPU und 16GB RAM). Es sind die modernsten Sprachmodelle (Llama 2, Mistral) integriert, um deine Dokumente, Notizen, PDFs und sogar YouTube-Transkripte in einen hochpersonalisierten KI-Chatbot zu verwandeln.
Google veröffentlicht Gemini Ultra
Google hat seinen KI-Chatbot Bard offiziell in Gemini umbenannt und das Gemini Pro 1.0-Modell veröffentlicht. Es ist nun in über 40 Sprachen einschließlich Deutsch verfügbar. In den USA können Nutzer bereits eine mobile Gemini-App für Android und iOS ausprobieren. Wann die App in Deutschland verfügbar sein wird, ist noch unklar.
Zusätzlich veröffentlicht Google sein mit Spannung erwartetes Ultra-Modell: Mit Gemini Advanced erhalten User Zugang zum Ultra 1.0-Modell, Googles "größtes und leistungsfähigstes" KI-Modell, das bei Leistungstests mit OpenAIs GPT-4 konkurriert. Um Gemini Advanced zu nutzen (in Deutschland zurzeit nur auf Englisch), müssen User das neue Google One AI Premium-Abo abschließen, das 21,99€/Monat kostet.
In meiner Erkenntnis der Woche liest du, wie sich Gemini Ultra im Praxistest schlägt.
OpenAI plant Billionen-Investments in Chip-Fabriken
OpenAI reitet ohne Zweifel auf einer riesigen Erfolgswelle. Laut einem Bericht der "Financial Times" hat das Unternehmen hinter ChatGPT im Dezember die Umsatzmarke von zwei Milliarden US-Dollar erreicht. Um weiter zu wachsen, plant CEO Sam Altman nun laut Medienberichten eine gigantische Investition zum Bau weiterer KI-Chip-Fabriken. Das "Wall Street Journal" berichtet, dass Altman anstrebt, zwischen fünf und sieben Billionen Dollar bei finanzkräftigen Investoren einzusammeln. Zur Verdeutlichung: 7 000 000 000 000 $. Dafür ist Altman angeblich in Gesprächen mit den Vereinigten Arabischen Emiraten sowie dem taiwanischen Chiphersteller TSMC.
Sam Altmans Ambitionen deuten darauf hin, dass er die Realisierung von AGI (Artificial General Intelligence) nicht allein als technologisches Problem betrachtet, sondern vielmehr als Herausforderung, die durch die effektive Nutzung von Ressourcen, insbesondere Rechenleistung, bewältigt werden muss.
Super Bowl: AI erobert Werbespots
Jahr für Jahr ist der Super Bowl eines der größten Sportevents weltweit. Neben dem sportlichen Wettbewerb und der Halbzeitshow erregen auch die Werbespots, die speziell für das NFL-Finale produziert werden, jedes Jahr großes Interesse. Kein Wunder: Unternehmen mussten in diesem Jahr satte sieben Millionen Dollar für einen 30-sekündigen Spot ausgeben. Dafür muss man sich schon etwas einfallen lassen.
Das Thema KI stand dieses Jahr besonders im Rampenlicht: Microsoft stellte seinen Assistenten Copilot vor, Google präsentierte die KI-Vorteile des Google Pixel 8 und Etsy führte den KI-Geschenkefinder vor. Allerdings fokussierten sich nicht alle Werbespots auf die Sonnenseiten von KI: In einem 30-Sekunden-Teaser für den neuen Minion-Film, der im Sommer erscheint, nehmen die kleinen gelben Wesen schlecht generierte KI-Bilder auf die Schippe. Hier könnt ihr euch die besten Werbespots ansehen.
YouTube: KI in den Schwerpunkten für 2024
Für Googles Videoplattform YouTube steht auch in diesem Jahr viel auf dem Plan. YouTube-CEO Neal Mohan hat die Top-Prioritäten für das Jahr 2024 nun in einem Blogartikel angekündigt und wenig überraschend spielt auch in diesem Jahr das Thema Künstliche Intelligenz eine große Rolle.
Mohan betont, dass KI die menschliche Kreativität stärken und nicht ersetzen soll. Zahlreiche neue KI-Funktionen sollen YouTuber dabei unterstützen, hochwertige Videos zu erstellen. Dazu gehören u. a. Tools wie Dream Screen, mit denen Benutzer AI-generierte Hintergründe für YouTube-Shorts erstellen können, sowie Dream Track für AI-generierte Musik.
Konkurrenz für Apple? Brilliant Labs entwickelt KI-Brille
Das Unternehmen Brilliant Labs hat die "Frame AI Glasses" vorgestellt, eine Augmented-Reality-Brille mit KI-Funktionen. Durch Sprachbefehle können Nutzer die Brille u. a. dazu verwenden, Übersetzungen zu erhalten, Sehenswürdigkeiten zu identifizieren, online nach Produkten zu suchen oder Nährwertangaben von Lebensmitteln zu erhalten.
Die Frame AI Glasses kann derzeit für einen Preis von 349 US-Dollar vorbestellt werden und wird ab dem 15. April ausgeliefert. Im Vergleich zur Vision Pro von Apple ist sie damit ein echtes Schnäppchen. Besonders interessant: Die Software der Brille ist vollständig Open Source und auf Github verfügbar, was es Nutzern ermöglicht, sich aktiv an der Weiterentwicklung der AR-Technologie zu beteiligen.
Im Vergleich zur Apple Vision Pro ist die Brille von Brilliant Labs besonders für den Einsatz im Freien interessant, da sie schlichter ist. Die Vision Pro hingegen eignet sich besser für Unterhaltung und spezielle Anwendungen.
Midjourney wird einfacher zugänglich
Um Midjourney zu nutzen, müssen sich User derzeit noch über einen Discord-Server einloggen. Das soll sich bald ändern: Midjourney arbeitet an einer eigenen Webanwendung, um das Bildgenerierungstool auch der breiteren Masse zugänglich zu machen. Das Unternehmen arbeitet außerdem an einer App.
Nutzer, die über Midjourney mehr als 1.000 Bilder generiert haben, sind dazu eingeladen, beim Alphatest der Website mitzuhelfen.
🧠 ERKENNTNIS DER WOCHE
Praxistest: Wie schlägt sich Gemini Ultra gegen GPT-4?
Gemini Ultra wird als enorm leistungsstarkes KI-Modell gehandelt, das mit GPT-4 mithalten soll. Was ist dran?
Ethan Mollick, Professor an der Wharton School der University of Pennsylvania, hatte die Möglichkeit, Gemini einen Monat lang zu testen. Er lehrt Innovation und Unternehmertum, forscht an den Auswirkungen künstlicher Intelligenz auf Arbeit und Bildung und bietet mit seiner Expertise spannende Einblicke auf die neue Google-KI.
Für Mollick ist der Hype um Gemini definitiv berechtigt: “Gemini ist eindeutig ein Modell der GPT-4 Klasse. Das zeigen sowohl Statistiken als auch mein einmonatiger Test. Und das ist eine große Sache, weil OpenAIs GPT-4 seit über einem Jahr die dominierende KI ist”, schreibt er in seinem Bericht.
Dennoch hat Gemini für Mollick bislang nicht das Zeug, GPT-4 zu verdrängen. Vielmehr haben für Mollick beide Modelle ihre Stärken und Schwächen, wobei GPT-4 im Umgang mit Code und Worten raffinierter ist, während Gemini besser bei Erklärungen und Integration von Bildern und Suche abschneidet. Auch findet er: “Beide sind seltsam inkonsequent und halluzinieren mehr, als sie sollten. Ich benutze sowohl Gemini Advanced als auch GPT-4, je nach Umständen.”
Ein entscheidender Unterschied für Mollick: Gemini verkörpert erstmals einen leistungsstarken integrierten persönlichen Assistenten. Microsoft hat mit Copilot kleine clevere Begleiter für Software wie Word und PowerPoint geschaffen, während OpenAI eher an autonomen KI-Agenten arbeitet. Google scheint einen echten KI-Assistenten entwickeln zu wollen.
Frühere Versionen von Geminis Vorgänger Bard hatten bereits Verbindungen zum Google-Ökosystem, waren aber nicht ausgefeilt. Mit Gemini scheint Google nun die vorbereitete Infrastruktur mit einem intelligenten Gehirn gefüllt zu haben. So kann Gemini beispielsweise verlässlich die folgenden Aufgaben erledigen: „Gehe durch meine E-Mails, sage mir, welche wichtig sind, und entwerfe Antworten für jede“ oder „Suche meine nächste Konferenz und plane eine Reise, die mir gefallen würde.“
Mollick folgert: “Das ist teilweise der Grund, warum ich vermute, dass Gemini Advanced der Anfang nicht das Ende einer Welle der KI-Entwicklung ist. Wir können eine Welt sehen, in der KI-Agenten in unserem Auftrag handeln. Ein Modell der Klasse GPT-4 ist nicht ganz stark genug, um diese Agenten zu betreiben. Aber wir kommen näher.”
🤖 AI-TOOLS
Gemini Advanced: Den fortschrittlichen KI-Assistenten von Google kannst du für zwei Monate kostenlos testen. (Link)
Spinach.io: Ein KI-Projektmanagement-Assistent, der u. a. Tagesordnungen erstellt, Online-Meetings zusammenfasst und das Projektboard aktualisiert. (Link)
Deepl: KI-Tool, das PDF-Dateien übersetzt. (Link)
Namify: KI-Namensgenerator für dein Business. (Link)
Rizzle AI: Erstelle urheberrechtskonforme Videos aus Texten, Podcast-Audio/Video oder Langform-Videos. (Link)
🧑🏫 AI-TUTORIAL DER WOCHE
So erstellst du deine persönlichen Chatbots mit Hugging Face
Wie wir letzte Woche berichtet haben, hat Hugging Face eine Funktion eingeführt, mit der User wie bei OpenAIs GPTs eigene Chatbots erstellen und in einer Art Store verbreiten können. Im Gegensatz zu OpenAIs Variante geht das bei Hugging Face kostenlos. So gehts:
Geh auf die Website „Hugging Face Assistants“
Klick auf die Schaltfläche „Create New Assistant“.
Wähle ein Bild oder Logo aus und gib deinem Assistenten einen Namen.
Wähle ein Modell: Hugging Face bietet verschiedene Optionen wie OpenChat, MixtralAI, Llama und Codellama.
Erstelle deinen System Prompt mit Anweisungen, die für den Assistenten generell gelten sollen: Wenn du zum Beispiel einen persönlichen Kochassistenten erstellen möchtest, schreib etwas wie: „Fungiere als persönlicher Kochberater. Biete maßgeschneiderte Rezepte und Kochanleitungen basierend auf meinen Ernährungspräferenzen, Allergien und verfügbaren Zutaten an. Hier ist mein erster Auftrag: Ich habe Lust auf ein vegetarisches Gericht mit viel Protein und wenig Kohlenhydraten.“
Am besten gibst du deinem Chatbot viel Kontext und viele Infos, damit er später bei spezifischen Aufgaben zielgerichtet helfen und relevante Antworten generieren kann, ohne dass du jedes Mal wieder einen langen Prompt schreiben musst. Das kann diverse Arbeitsabläufe extrem vereinfachen. Viel Spaß beim Ausprobieren!
Das war’s für diese Woche. Vielen Dank fürs Lesen!
Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. (Anmeldelink).
Hier kannst du gerne meine vorherigen Newsletter durchstöbern.
Bis nächsten Mittwoch!
Henry