ChatGPT kann jetzt sehen, hören und sprechen

Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!

Ganz ehrlich? Ich schreibe diesen Newsletter jetzt schon seit 33 Wochen. Aber eine Woche wie diese, in der sich so viele wichtige Entwicklungen ereignet haben, gab es bisher noch nicht. (Falls dies dein erster Newsletter ist: Nein, das ist keine Floskel, die ich hier regelmäßig schreibe – ich meine es wirklich ernst 😉).

Heute habe ich für dich:

  • Die wichtigsten News der Woche 🔥

  • Erkenntnis der Woche: Wie neue ChatGPT-Funktionen unsere Arbeit revolutionieren 🧠

  • 5 Nützliche AI-Tools 🤖

  • AI-Tutorial der Woche 🧑‍🏫



🔥 AI-NEWS

ChatGPT kann jetzt sehen, hören und sprechen

OpenAI verleiht ChatGPT neue Fähigkeiten, die das Tool deutlich kommunikativer machen: Bald soll ChatGPT seinen Nutzern zuhören und mit einer menschenähnlichen Stimme antworten können. Zur Wahl stehen dabei fünf verschiedenen Stimmen, die möglichst natürliche Gespräche ermöglichen sollen.

Aber das ist nicht alles, was das Update bringt: Nutzer erhalten die Möglichkeit, Bilder hochzuladen und ChatGPT dazu Fragen zu stellen. Das bedeutet, du kannst dir beispielsweise Diagramme erklären lassen oder Unterstützung bei der Reparatur von technischen Geräten erhalten. Dabei können spezifische Bereiche in den Bildern markiert werden, um gezielte Detailfragen zu stellen. Diese neuen Funktionen werden in Kürze für ChatGPT Plus- und Enterprise-Nutzer verfügbar sein.

Diese Neuerungen erweitern die Möglichkeiten der Interaktion mit ChatGPT erheblich und markieren einen bedeutenden Fortschritt in der Entwicklung von KI-Modellen. Damit wird KI nicht nur vielseitiger und kreativer, sondern macht auch einen Fortschritt in puncto Barrierefreiheit.

DALL-E 3 kommt zu ChatGPT und beherrscht natürliche Sprache

Um gute Bilder von einer KI generieren zu lassen, war es bislang entscheidend, die richtigen Befehle (Prompts) zu beherrschen. Das soll sich schon bald ändern. OpenAI hat für Oktober ein Update für seine Bildsoftware DALL-E 3 angekündigt, das nahtlos in ChatGPT integriert wird.

DALL-E 3 soll Prompts erheblich besser verstehen als andere KI-Bildwerkzeuge, sodass Nutzer in natürlicher Sprache detaillierte Anweisungen geben können. Aufwändige Prompt-Engineering-Kenntnisse werden damit weniger wichtig.

Die erzeugten Bilder sollen von herausragender Qualität sein und sogar fotorealistische Darstellungen mit Texten umfassen. Der aktuelle Spitzenreiter bei KI-Bildern Midjourney dürfte ganz schön ins Schwitzen kommen. Anfang Oktober soll die neue Version ChatGPT Plus- und Enterprise-Kunden zur Verfügung stehen, schreibt OpenAI.

Von DALL-E 3 generiertes Bild (wie du siehst, es kann auch Texte richtig integrieren)

Podcasts aus aller Welt in deiner Muttersprache hören

Spotify hat eine Übersetzungsfunktion für Podcasts angekündigt. Dank KI-Technologie von OpenAI werden Podcasts damit in andere Sprachen übersetzt, und zwar in der authentischen Stimme des Podcasters. Das bedeutet, dass wir bald mühelos Podcasts aus aller Welt lauschen können.

Außerdem äußerte sich Spotify-Chef Daniel Ek in einem Interview mit der BBC über KI-generierte Musik: Er betonte, dass die Technologie sinnvoll in der Musik eingesetzt werden kann, aber nicht dazu verwendet werden sollte, sich ohne Zustimmung als menschliche Künstler auszugeben.

Amazon investiert Milliarden in KI-Startup

Amazon investiert 1,25 Milliarden Dollar in das KI-Startup Anthropic, das den KI-Assistenten Claude entwickelt hat. Diese Partnerschaft verspricht Vorteile für beide Seiten: Anthropic kann von Amazons Cloud-Plattform AWS und speziellen KI-Chips profitieren, was die Technologieentwicklung beschleunigt. Gleichzeitig stärkt Amazon seine Position im KI-Bereich durch diese Zusammenarbeit und plant, das Investment auf bis zu 4 Milliarden Dollar zu steigern.

Anthropics Claude-Chatbot ähnelt ChatGPT von OpenAI und Bard von Google und soll sich vor allem durch seine starken Fähigkeiten in Mathematik, im Coden und im Reasoning (Denkfähigkeit) abheben.

Meta führt KI-Chatbots für jüngere Nutzer ein

TikTok hat Instagram als beliebteste Video-Streaming-App für Teenager längst abgelöst. Aber der Instagram-Dachkonzern Meta will sich längst nicht geschlagen geben. Das Unternehmen will nun mit der Einführung von KI-Chatbots jüngere Nutzer dazu bewegen, mehr Zeit auf der Plattform zu verbringen. Die Einführung soll bereits in dieser Woche erfolgen.

Die "Gen AI Personas" sollen verschiedene Charaktere umfassen, darunter einen humorvollen Roboter namens Bob (inspiriert von Bender aus Futurama) und einen neugierigen Außerirdischen namens Alvin. Darüber hinaus sollen Promis und Influencer die Möglichkeit erhalten, eigene Chatbots zu verwenden, um mit ihren Fans und Followern zu interagieren.

Microsoft bringt KI in Word, Excel, Outlook und Co.

Microsoft läutet mit seinem “Copilot” eine neue Ära der künstlichen Intelligenz ein. Die KI-Lösung steht Nutzern schon bald über Edge, Bing, Microsoft 365 und Windows 11 zur Verfügung.

Mit über 150 neuen Features verspricht der Copilot, den Arbeitsalltag der Nutzer zu erleichtern. Diese umfassen die Integration von KI in Programme wie Paint oder der Foto-App, Unterstützung beim Verfassen von E-Mails oder Social-Media-Posts, KI-Teilnahme an Meetings, Bildbearbeitung, Meeting- und Desktop-Organisation und vieles mehr. Diese vielfältigen Funktionen versprechen eine erhebliche Erleichterung für alltägliche Aufgaben im Job.

Der Roll-out für Windows 11 hat bereits am 26. September begonnen. Im Herbst sollen die neuen Funktionen für Bing, Edge und Microsoft 365 eingeführt werden.

Google Bard hat neue Funktionen

Googles KI-Chatbot Bard hat einen Feinschliff bekommen und kann nun Informationen aus verschiedenen Google-Tools wie Gmail, Docs, Drive, Google Maps und YouTube durchsuchen und verwenden. Zusätzlich hat Google eine "Doppelüberprüfungsfunktion" eingeführt, die Benutzern ermöglicht, die Antworten des Chatbots mithilfe einer automatischen Google-Suche auf ihre Richtigkeit zu überprüfen.

YouTube setzt verstärkt auf KI für Content Creator

YouTube hat bei seinem Creator-Event mehrere neue KI-gesteuerte Tools vorgestellt: Statt sich bei externen Apps zu bedienen, sollen YouTuber künftig alle passenden Tools direkt auf der Plattform finden. So können sie z. B. Hintergründe und Musik für ihre Videos mit Hilfe von KI in sekundenschnelle direkt über YouTube generieren lassen. Dafür ist jetzt schon für Android die YouTube Create App verfügbar.


🧠 ERKENNTNIS DER WOCHE

Wie das neue ChatGPT Arbeit revolutionieren kann

Meiner Meinung nach wird ChatGPTs neue Funktionen (s.o.) unsere Arbeitswelt verändern. Findest du übertrieben? Dann ist dir vielleicht noch nicht bewusst, wie viel Potenzial in den neuen Funktionen steckt. Ein paar Beispiele:

  • Design-Assistent: Du kannst ein Bild deiner Landingpage, deines Logos oder anderer Marketingmaterialien hochladen und ChatGPT um eine Designkritik bitten. Du kannst ihm sogar ein Bild deines Produkts zeigen und es nach einem passenden Werbespruch fragen. ChatGPT wird zu deinem persönlichen Design-Assistenten.

  • Mit KI unterwegs interagieren: Du kannst mit dem Update auch dann mit ChatGPT kommunizieren, wenn du nicht an deinem Schreibtisch bist, oder ihm während eines Meetings eine schnelle Frage stellen.

  • Personalisierte Meditationen: Die Sprachfunktion von ChatGPT kann weit mehr als Siri oder Alexa: ChatGPT kann beispielsweise personalisierte Meditationen für dich erstellen und sie dir dank der Sprachfunktion direkt vorlesen.

Das sind nur wenige Ideen, wie die neuen Funktionen sinnvoll eingesetzt werden können. Dir fallen sicher noch viel mehr Möglichkeiten ein.


🤖 AI-TOOLS

  • myReach: Ein persönlicher KI-Assistent, der wie ein “zweites Gehirn” agiert. Er analysiert und speichert den Inhalt all deiner gespeicherten Elemente, sodass du sie später mühelos über den Chatbot finden kannst (Link)

  • Draw3D: Das Tool verwandelt deine Skizzen in fotorealistische Bilder. (Link)

  • 10Web: Erstelle mit Hilfe von KI Websites in wenigen Minuten. (Link)

  • MultiVerse AI: Das Tool verwandelt deine Selfies in professionelle Porträt-Bilder. (Link)

  • FireCut AI: Das Plugin für Adobes Premiere Pro erleichtert den Videoschnitt extrem. (Link)


🧑‍🏫 AI-TUTORIAL DER WOCHE

AI-Video-Generator Pika Labs hat ein neues Feature, mit dem du Textbotschaften oder Bilder (z.B. Logos) in dein Video integrieren kannst (Beispiel von mir siehe unten). Das funktioniert mit den folgenden drei Schritten:

Schritt 1: Geh auf Pika.Art und tritt der Beta-Plattform und Discord bei.

Schritt 2: Gehe zu einem der #generate-Kanäle und starte mit dem Befehl "/encrypt_text". Gib im Abschnitt ‘prompt’ ein, in welches Setting du den Text integrieren willst und füg im Abschnitt "message" den Text ein, den du im Video einbetten möchtest.

Für mein Beispiel:

/encrypt_text

Message: neuland

Prompt: cloudy stormy sky

Schritt 3: Dein Video wird direkt im Discord-Channel generiert – passe den Prompt bei Bedarf an, es kann einige Versuche dauern, um dein gewünschtes Ergebnis zu erzielen.


Das war’s für diese Woche. Vielen Dank fürs Lesen!

Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. 🤗 (Anmeldelink).

Hier kannst du gerne meine vorherigen Newsletter durchstöbern.

Bis nächsten Mittwoch!

Henry


Zurück
Zurück

Ersetzen diese AI-Geräte bald das Smartphone?

Weiter
Weiter

Generative KI nur Zwischenstufe? Überraschende Aussage von Google-Manager