ChatGPTs neuer Voice-Mode und SearchGPT: Was du wissen musst
Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!
Heute habe ich für dich:
Die wichtigsten News der Woche 🔥
Erkenntnis der Woche: KI revolutioniert die Olympischen Spiele 2024 🥇
5 Nützliche AI-Tools 🤖
AI-Tutorial der Woche: In Sekunden zur perfekten Präsentation – mit Gamma 🧑💻
🔥 AI-NEWS
OpenAI startet mit “Advanced Voice Mode” den erweiterten Sprachmodus für ChatGPT
Der ursprünglich geplante Alpha-Release Ende Juni wurde verschoben, um sicherzustellen, dass der Modus den hohen Standards entspricht. OpenAI nutzte die Zeit, um die Erkennungs- und Ablehnungsfähigkeiten des Modells zu verbessern. Außerdem führte das Unternehmen Tests mit über 100 externen Red-Teamern durch. Zusätzlich wurden neue Filter implementiert, um Anfragen zur Generierung von urheberrechtlich geschütztem Audio zu blockieren.
Eine frühere Kritik an der neuen Stimme „Sky“ betraf ihre Ähnlichkeit mit der Schauspielerin Scarlett Johansson, die eine KI im Film „Her“ spielte. OpenAI hat daraufhin sichergestellt, dass der neue Modus lediglich vier voreingestellte Stimmen von Synchronsprechern verwendet und keine Stimmen anderer Personen nachahmen kann.
Der neue Sprachmodus ist deutlich leistungsfähiger als sein Vorgänger. Auf der Bühne demonstrierten OpenAI-Mitarbeiter beeindruckend, wie der Chatbot Unterbrechungen meisterhaft verarbeitet und Geschichten in unterschiedlichen Stilen erzählt. Das Ganze erinnert an den Kinofilm Her. Ab Herbst soll der neue Modus allen ChatGPT Plus-Nutzern zur Verfügung stehen.
OpenAI präsentiert SearchGPT: Die Zukunft der Internetsuche
OpenAI stellt mit SearchGPT einen Prototyp vor, der Echtzeit-Webinformationen mit KI-Modellen kombiniert, um schnelle und präzise Antworten mit klaren Quellenangaben zu liefern. Das dürfte die Art und Weise, wie wir im Internet nach Informationen suchen, grundlegend verändern.
Wichtige Features:
Verbesserte Sucherfahrung: SearchGPT nutzt konversationelle KI-Fähigkeiten, um in Echtzeit auf aktuelle Webinformationen zuzugreifen und liefert dadurch direkte, relevante Antworten.
Echtzeitinformationen: Das Tool ist immer aktuell. Es bietet somit die neuesten Informationen und Links zu den entsprechenden Quellen, wodurch Nutzer Folgefragen konversationell stellen können.
Zusammenarbeit mit Verlegern: OpenAI arbeitet eng mit Verlegern und Content-Erstellern zusammen, um hochwertige Inhalte hervorzuheben und die Nutzerbindung zu stärken.
Zukunftsvision: OpenAI wird das Feedback von Nutzern und Verlagen verwenden, um anschließend die besten Funktionen in ChatGPT zu integrieren. Interessierte Nutzer können sich bereits jetzt für die Warteliste anmelden.
Fokus auf lokale Informationen und Handel: Künftige Verbesserungen werden lokale Informationen und den Handel weiter optimieren.
Die Kombination aus Echtzeit-Webinformationen und KI bietet eine effizientere und ansprechendere Sucherfahrung. Das Ende der klassischen Google-Suche könnte bevorstehen, mit erheblichen Auswirkungen auf SEO, Webseitenbetreiber und Onlineshops.
Mehr Infos und die Anmeldung zur Warteliste findet ihr hier: LINK
KI-Suchmaschinen: Die Strategie von OpenAI und Perplexity
Suchmaschinen mit großen Sprachmodellen (LLMs) sollen den Suchprozess beschleunigen, indem sie direkt Antworten liefern, anstatt Links zu durchsuchen. Allerdings ist die Fehlerrate dieser Modelle noch relativ hoch, da sie oft nur vermuten, wie eine Antwort aussehen könnte, statt die korrekte Antwort zu liefern.
Während Bing Copilot ebenfalls schnelle und passende Antworten mit verlässlichen Quellen verspricht, hat OpenAI einen entscheidenden Vorteil: umfangreiche Verlagsdeals und hohe Investitionen in die Qualitätssicherung. OpenAI hebt sich durch seine Partnerschaften und Ressourcen von der Konkurrenz ab.
Mit einer Burnrate von 5 Milliarden US-Dollar jährlich investiert OpenAI nicht nur in Modelltraining und Personal, sondern auch in rechtlich abgesicherte Inhalte. Das könnte die beliebte LLM-Suchmaschine Perplexity ins Schwitzen bringen. OpenAI hat den Vorteil, rechtliche Herausforderungen durch Verlagsdeals zu umgehen, während Perplexity weiterhin Unterlassungsaufforderungen erhält.
Perplexity ist sich dessen bewusst und geht ebenfalls vermehrt Partnerschaften ein. Zu den Partnern gehören unter anderem Der Spiegel und Wordpress.
Canva übernimmt Generative-AI Startup Leonardo.Ai
Canva hat Leonardo.Ai übernommen, um die Innovation im Bereich generativer KI zu beschleunigen. Leonardo.Ai wurde vor 18 Monaten gegründet, um Kreativität durch eine fortschrittliche KI-Plattform zu demokratisieren. Die Plattform hat breite Akzeptanz gefunden, von Hobbyisten bis hin zu kreativen Profis.
Durch die Partnerschaft mit Canva wird Leonardo.Ai seine Forschungskapazitäten erheblich ausbauen und die Plattform weiterentwickeln. Leonardo.Ai bleibt als unabhängige Plattform bestehen und wird weiterhin von seinem Team in North Sydney betrieben. Nutzer können die bisherigen Tools und Preise wie gewohnt nutzen und dürfen sich auf spannende neue Funktionen freuen. Integration von Leonardo.Ai-Features in Canva ermöglicht eine nahtlose Verbindung beider Plattformen. Die Mission bleibt, erstklassige KI für visuelle Inhalte zu liefern und die Kreativität weltweit zu fördern.
Neu bei Runway Gen-3 Alpha: Bild-zu-Video
Runway’s Gen-3 Alpha ist jetzt in der Lage, hochwertige Videos aus Bildern zu erstellen. Bisher konnte das Modell nur Texte zu Videos umwandeln.
Die generierten Videos sind 5 oder 10 Sekunden lang und benötigen „Credits“, die über Runways Abonnements erworben werden. Um das Tool zu nutzen, besuche Runways Website, klicken auf „Gen-3 Alpha ausprobieren“ und laden ein Bild hoch.
Das neue Bild-zu-Video-Modell ermöglicht es Nutzern, Bilder zum Leben zu erwecken und bietet neue kreative Möglichkeiten. Laut Runway verbessert die Bild-zu-Video-Generierung die künstlerische Kontrolle und Konsistenz erheblich.
Meta enthüllt SAM 2: Die Revolution für Video-KI
Meta hat mit SAM 2 (Segment Anything Model 2) ein KI-Modell vorgestellt, das Objekte in Echtzeit über Videoframes hinweg identifizieren und verfolgen kann. Dies markiert einen großen Fortschritt im Bereich der Video-KI.
Highlights:
Echtzeit-Segmentierung: SAM 2 erweitert Metas Bildsegmentierung auf Videos und meistert dabei schnelle Bewegungen und Überlappungen von Objekten.
Einfache Anwendung: Segmentieren und Ausschneiden von Objekten in wenigen Klicks. Hier kannst du kostenlos die Demo ausprobieren.
Open Source: Meta macht SAM 2 und eine umfangreiche Datenbank von 50.000 Videos öffentlich zugänglich.
SAM 2 vereinfacht komplexe Video-Bearbeitungen, wie das Entfernen oder Ersetzen von Objekten, auf einen einzigen Klick.
Krise im Videospielsektor: Schauspieler gehen in den Streik
Am vergangenen Donnerstag kündigte die Gewerkschaft SAG-AFTRA (vertritt Sprach- und Motion-Capture-Darsteller) an, dass sie ab kommenden Freitag die Arbeit niederlegen wird. Grund ist das Scheitern der Verhandlungen mit großen Videospielunternehmen über den Schutz durch Künstliche Intelligenz.
„Wir werden keinen Vertrag akzeptieren, der es den Unternehmen erlaubt, KI auf Kosten unserer Mitglieder auszunutzen“, erklärte Fran Drescher, Präsidentin von SAG-AFTRA. „Es ist genug. Sobald die Unternehmen ernsthafte Angebote machen, mit denen unsere Mitglieder leben können, sind wir bereit zu verhandeln.“
Die Konflikte zwischen SAG-Mitgliedern und Videospielunternehmen über KI schaukeln sich seit Monaten hoch. Trotz intensiver Verhandlungen seit Oktober 2022 und einem Streikmandat seit September 2023 konnte kein Konsens gefunden werden.
Die beteiligten Unternehmen, darunter Activision, Disney und Electronic Arts, sind enttäuscht über den Streikbeschluss, obwohl sie fast alle Vorschläge der Gewerkschaft akzeptiert hatten. Ihr Angebot umfasst KI-Schutzmaßnahmen, die zu den stärksten in der Unterhaltungsindustrie gehören.
🧠 ERKENNTNIS DER WOCHE
Künstliche Intelligenz revolutioniert die Olympischen Spiele 2024
Die Olympischen Spiele 2024 in Paris setzen neue Maßstäbe durch den umfassenden Einsatz von KI. Diese Innovationen verändern nicht nur das Erlebnis für Athleten und Zuschauer, sondern könnten auch die Zukunft des Sports prägen.
Alle spannenden Neuerungen im Überblick:
AthleteGPT Chatbot: Entwickelt von Intel in Zusammenarbeit mit dem Internationalen Olympischen Komitee (IOC), bietet dieser KI-gestützte Chatbot rund um die Uhr Unterstützung für die 11.000 Athleten. Er liefert schnellen Zugriff auf wichtige Informationen und verbessert die Athletenbetreuung maßgeblich. (Mehr erfahren)
3D-Athletenverfolgung (3DAT): Durch präzise biomechanische Einblicke ermöglicht diese Technologie eine detaillierte Leistungsanalyse und potenzielle Verbesserungen für die Athleten.
KI im Talent-Scouting: Ein neues Pilotprogramm des IOC in Senegal demonstriert, wie KI zur Identifizierung und Förderung neuer Talente genutzt wird.
Personalisierte Highlights von NBC: Die KI-gestützte Technik von NBC liefert maßgeschneiderte Highlights und Echtzeit-Statistiken für ein verbessertes Zuschauererlebnis.
Überwachung von Online-Missbrauch: Ein KI-System scannt soziale Medien auf missbräuchliche Nachrichten gegen Athleten und sorgt somit für ein sicheres Online-Umfeld.
Interaktive Fan-Erlebnisse: Intels Technologie ermöglicht es Zuschauern, ihre körperlichen Stärken und Schwächen zu analysieren und herauszufinden, welche Sportarten ihnen am besten liegen könnten. (Interaktive Erlebnisse ansehen)
Immersives Broadcasting: In Zusammenarbeit mit OBS und Alibaba bietet KI verbesserte Mehr-Kamera-Wiederholungen, 3D-Modelle und Bewegungsverfolgung für detaillierte Event-Einblicke.
Digitale Zwillinge: Die KI erstellt digitale Nachbildungen der Olympiastätten, um die Planung und Verwaltung von Veranstaltungen durch Szenario-Simulationen zu optimieren. (Mehr Erfahren)
Der Einsatz von KI bei den Olympischen Spielen überwindet frühere Vorbehalte bezüglich KI und könnte den Weg für eine revolutionäre Ära im Sport-Viewing und -Management ebnen.
🤖 AI-TOOLS
EverArt: Feinabstimmung deiner Marke auf ein neues Niveau – trainiere KI für jede Produktkategorie, jeden Stil oder Moodboard. (Link)
Runway Gen-3: Verwandle Bilder in fesselnde Videos, indem du sie als kreative Anleitung nutzt. (Link)
Granola: Transformiert deine Besprechungsnotizen in erstklassige Dokumente und hält alle wichtigen Informationen präzise fest. (Link)
Udio v1.5: Erlebe die nächste Stufe der Text-zu-Musik-Technologie mit verbesserter Audioqualität und global optimierten Spracheffekten. (Link)
PixVerse V2: Kreiere 8-sekündige, detailreiche KI-Videos, die durch fließende Bewegungen und konsistente Erzählweise überzeugen. (Link)
🧑🏫 AI-TUTORIAL DER WOCHE
In Sekunden zur perfekten Präsentation – mit Gamma
Nutze Gamma, die KI-gestützte Online-App, um blitzschnell beeindruckende Präsentationen, Dokumente und Webseiten aus Text zu erstellen.
So einfach geht es:
Melde dich kostenlos auf Gamma an.
Wähle im Hauptmenü „Create new AI“ und beschreibe, was du erstellen möchtest.
Lege die Anzahl der Folien und die Sprache fest und klicke auf „Generate outline“.
Bearbeite den Vorschau-Entwurf nach deinen Wünschen – wähle eine Textlänge aus und füge Details hinzu.
Wähle ein Design, klicke auf „Generate“ und beobachte, wie deine Präsentation in wenigen Sekunden fertig wird.
Passe Text an, füge Folien und Diagramme hinzu und exportiere dein Meisterwerk durch Klicken auf die drei Punkte oben rechts.
Viel Spaß beim Ausprobieren!
Das war’s für diese Woche. Vielen Dank fürs Lesen!
Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. (Anmeldelink).
Hier kannst du gerne meine vorherigen Newsletter durchstöbern.
Bis nächste Woche!
Henry