Zu riskant für die Öffentlichkeit? OpenAIs neues Voice-Tool

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Heute habe ich für dich:

  • Die wichtigsten News der Woche 🔥

  • Erkenntnis der Woche: OpenAIs neuester Streich: Vor- und Nachteile des neuen Voice-Tools 🔊

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche: Prompt Engineering Tipp #2: "Führe mich durch den Prozess"💡



🔥 AI-NEWS

OpenAI hält neues Voice-Tool vorerst zurück

OpenAI hat eine Software entwickelt, die mithilfe einer 15-sekündigen Audioprobe und Texteingabe menschliche Stimmen authentisch klonen kann. Aus Sorge vor Missbrauch hält das Unternehmen das neue Tool aber vorerst zurück. Deepfakes sind ein zunehmendes Problem, besonders im politischen Kontext. Im Januar wurden beispielsweise in den USA automatisierte Anrufe getätigt, bei denen eine Stimme, die der von US-Präsident Joe Biden ähnelte, Demokraten in New Hampshire dazu aufrief, nicht an den Vorwahlen teilzunehmen.

In einem Blogbeitrag betonte OpenAI die Notwendigkeit gesellschaftlicher Maßnahmen, um die Herausforderungen durch Sprach-KI-Modelle anzugehen. So empfehlen sie u. a. die Abschaffung sprachbasierter Authentifizierung für den Zugang zu Bankkonten und anderen sensiblen Informationen. Außerdem brauche es Richtlinien zum Schutz individueller Stimmen im Bereich KI.

Apple entwickelt freihändigen KI-Assistenten

In einem Forschungsbericht stellen Apple-Mitarbeitende ein neues KI-System namens ReALM (Reference Resolution as Language Modeling) vor. ReALM ist ein Sprachmodell, das Bildschirmaufgaben, Gesprächskontexte und Hintergrundprozesse verarbeiten kann. Damit können Benutzer nach Dingen auf ihrem Bildschirm fragen, und das Sprachmodell kann den Kontext verstehen und die richtige Antwort geben.

Ein Beispiel: Ein Nutzer kann eine Liste von Apotheken auf seinem iPhone geöffnet haben und Siri bitten, die Apotheke in der Müllerstraße anzurufen. Siri kann dann die Telefonnummer auf der Website "sehen" und sie direkt anrufen. Apple hat solche "freihändigen" KI-Assistenten schon lange angekündigt. Offen ist, wann Apple das Siri-Update offiziell ankündigt.

Samsungs Assistent Bixby soll intelligenter werden

Samsungs Bixby-Assistent, der erstmals 2017 mit dem Galaxy S8 eingeführt wurde, bietet verschiedene Funktionen wie Live-Übersetzungen und Restaurantempfehlungen. Doch im Vergleich zu fortschrittlichen KI-Modellen, die weitaus komplexere Aufgaben verlässlicher erledigen können, war Bixby bislang ein echter Flop. Das will Samsung jetzt ändern, wie ein Unternehmenssprecher gegenüber CNBC offenbarte: Samsung plant die Integration einer generativen KI, um Bixby wieder attraktiver zu machen. Wann genau das geschehen soll, wurde jedoch bisher nicht kommuniziert.

Microsoft und OpenAI stecken 100 Milliarden Dollar in Rechenzentrum und Supercomputer

Einem Medienbericht zufolge planen Microsoft und OpenAI gemeinsam an einem neuen Rechenzentrum, das 100 Milliarden Dollar kosten und einen Supercomputer enthalten soll.

Der Rechner namens "Stargate" ist dem Bericht zufolge der Höhepunkt des Projekts und soll in einem Rechenzentrum mit Sitz in den USA enthalten sein, das die Arbeit von OpenAI im Bereich KI unterstützt. Die Finanzierung für das Projekt, das bis zu 100 Milliarden Dollar kosten könnte, wird wahrscheinlich von Microsoft kommen, so der Bericht. Ein großer Teil der Kosten entfällt auf Hochleistungschips, die für KI-Anwendungen benötigt werden.

Claude 3 überholt GPT-4 und bekommt Milliardeninvestition

Vor ein paar Wochen haben wir an dieser Stelle berichtet, dass Nutzer das KI-Modell Claude 3 Opus von Anthropic als herausragend und teilweise sogar stärker als GPT-4 bewertet haben. Diese Tendenz bestätigt sich nun, da Claude 3 Opus GPT-4 an der Spitze der Chatbot-Arena-Rangliste abgelöst hat. Die Chatbot-Arena ist eine Plattform, auf der Nutzer die Leistung verschiedener KI-Sprachmodelle vergleichen können. Tausende subjektive Vergleiche werden herangezogen, um die Modelle in der Rangliste zu platzieren. Jetzt hat erstmals Anthropics KI-Modell die Nase vorn.

Und Anthropic erhält aktuell noch mehr Rückenwind: Wie nun bekannt wurde, investiert Amazon weitere 2,75 Milliarden US-Dollar in Anthropic. Damit liegt die Gesamtbeteiligung des Unternehmens nun bei vier Milliarden Dollar. Dieser Schritt passt gut zu Amazons Fokus auf künstliche Intelligenz und stärkt ihr Cloud-Computing-Unternehmen AWS. Mit der Anthropic-Kooperation erhält AWS ein leistungsfähiges LLM und kann so zu Microsoft Azure, das mit GPT-4 ausgestattet ist, und Google Cloud, das die Gemini-Modelle nutzt, aufholen. Auf der anderen Seite setzt Anthropic auf die neuesten KI-Chips von AWS, Trainium und Inferentia, und macht sich von den dominierenden NVIDIA-Chips unabhängig.

Im gleichen Atemzug gab Anthropic die Kooperation mit dem Beratungsunternehmen Accenture bekannt. Das Ziel der Partnerschaft zwischen Anthropic, AWS und Accenture ist es, die Verbreitung fortschrittlicher KI in Unternehmen zu beschleunigen. Hierfür werden 1.400 Ingenieure von Accenture geschult, um bei der Implementierung zu unterstützen.


🧠 ERKENNTNIS DER WOCHE

OpenAIs neuester Streich: Vor- und Nachteile des neuen Voice-Tools

OpenAI hat es schon wieder getan: Nachdem das Unternehmen hinter ChatGPT Anfang des Jahres mit seinem revolutionären Text-zu-Video-Modell Sora weltweit für großes Aufsehen sorgte, kommt es nun mit einer weiteren Sensation um die Ecke: Eine Software, die menschliche Stimmen mithilfe einer kurzen Audioaufnahme und Texteingabe authentisch nachahmen kann. Wenn OpenAI in diesem Tempo weitermacht, werden uns neue KI-Modelle bald so beliebig vorkommen wie die 20. Staffel Grey's Anatomy oder ein 48. Stephen King Roman. Aber Spaß beiseite.

Wie wir bereits in den News erklärt haben, hält OpenAI das neue Modell aus Sorge vor Deepfakes vorerst zurück. Voice-Tools sind nämlich nicht neu: Mit Tools wie ElevenLabs und Play.ht war es schon länger möglich, die eigene Stimme zu klonen. Neu an OpenAIs Tool ist die Einfachheit. Die eigene Stimme muss nur 15 Sekunden lang aufgezeichnet werden, und schon kann die KI täuschend echte Sätze erzeugen.

Wenn du diesen Newsletter schon länger verfolgst, weißt du, wie wichtig uns die Auseinandersetzung mit KI-Problemen, insbesondere Deepfakes, ist. Heute wollen wir aber an dieser Stelle auch einmal berichten, was Voice-Tools für Chancen eröffnen:

  • Inhalte in andere Sprachen übersetzen: Unternehmen können zum Beispiel Marketingvideos übersetzen lassen, um ein globales Publikum zu erreichen.

  • Stimmen für Marketingzwecke testen: Unternehmen können verschiedene Stimmen testen, um die Effektivität ihrer Marketingkampagnen zu verbessern.

  • Podcasts automatisch generieren: Podcast-Episoden können automatisch aus Textinhalten erstellt oder in andere Sprachen übersetzt werden.

  • Audiobooks erstellen: Bücher können einfach und blitzschnell in Audioformate umgewandelt werden.

  • Virtuelle Assistenten und Chatbots verbessern: Durch KI-Voice-Tools werden natürlichere und interaktivere Gespräche mit virtuellen Assistenten und Chatbots möglich.

  • Barrierefreie Kommunikation ermöglichen: KI-Voice-Tools tragen dazu bei, die Kommunikation für Menschen mit Sprach- oder Hörbehinderungen zugänglicher zu machen.

Was fällt euch noch ein?


🤖 AI-TOOLS

  • Hume AI: Empathische KI, die in Konversationen verschiedene Emotionen erkennen und verwenden kann. (Link)

  • OpenArt: Kreative AI-Plattform, auf der Bilder in vielen unterschiedlichen Stilen und ohne komplizierte Prompts generiert werden können. (Link

  • AI Humanizer: Hilft, KI-Texte “menschlicher” zu machen, sodass sie nicht mehr als KI-Texte erkannt werden. (Link)

  • Virabble: Wandelt Webinhalte oder diverse Content-Formate in Social-Media-Posts um. (Link)

  • Living Images: Tool, das Bilder von einer Website mit generativen AI A/B-Tests optimiert. (Link)


🧑‍🏫 AI-TUTORIAL DER WOCHE

Prompt Tipp #2: Führe mich durch den Prozess

Wir haben schon mehrfach betont, wie wichtig das richtige Kommunizieren mit einer KI ist, um relevante Ergebnisse von ihr zu bekommen. “Prompt Engineering” nennt man diesen Skill der Zukunft.

Nächste Woche Dienstag kommt unsere zweite Masterclass zum Thema “Prompt Engineering” für alle neulandpro Member raus. Zudem wird es danach eine Team-Challenge zu dem Thema geben, damit du die Inhalte sofort anwendest und in greifbare Ergebnisse verwandelst. So stellen wir sicher, dass dir KI und Prompt Engineering in Fleisch und Blut übergeht. Sicher dir jetzt noch den Zugang zur stärksten KI-Community Deutschlands für nur 79 Euro im Monat. Der Preis steigt nächste Woche!

Mit dem "Führe mich durch den Prozess" Prompt kannst du für diverse Anwendungsfälle sehr gute Ergebnisse erzielen. Hier ist zuerst das Template und danach noch ein konkretes Beispiel.

Unterstütze mich, XY zu erstellen.

Stelle dazu nacheinander alle Fragen, die ich beantworten muss.

Stelle immer nur eine Frage, warte auf die Antwort und fahre dann mit der nächsten Frage fort.

Erstelle am Ende XY auf Grundlage der Antworten.

Prompt Beispiel:

Du bist Experte in dem Bereich der deutschen Patientenverfügung und begleitest die Nutzer durch den Erstellungsprozess.

Stelle dazu nacheinander alle Fragen, die der Nutzer beantworten muss, um eine wirksame Patientenverfügung nach deutschem Recht zu erstellen.

Stelle immer nur eine Frage, warte auf die Antwort und fahre dann mit der nächsten Frage fort.

Erstelle am Ende die Patientenverfügung für den Nutzer auf Grundlage seiner Antworten.


Das war’s für diese Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächsten Mittwoch!

Henry


Zurück
Zurück

Kampf um KI-Daten: Millionendeals bei OpenAI, Apple, Google & Co.

Weiter
Weiter

Neue Details geleakt: GPT-5 kommt bald mit bahnbrechender Neuerung