Steht GPT-5 kurz vor der Veröffentlichung?
Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!
Heute habe ich für dich:
Die wichtigsten News der Woche 🔥
Erkenntnis der Woche: Ehen zwischen KI und Menschen bald normal? 😘🤖
5 Nützliche AI-Tools 🤖
AI-Tutorial der Woche: Faszinierend realistische Bilder mit FLUX erstellen 🧑💻
🔥 AI-NEWS
Gerüchte um GPT-5 verdichten sich
Durch einen mysteriösen Erdbeer-Tweet von Sam Altman und einen geheimnisvollen „anonymen Chatbot“, der letzte Woche in der LMSYS Chatbot-Arena auftauchte, brodelt die Gerüchteküche heftig. Ist “Strawberry” möglicherweise ein Codename für GPT-5?
Das könnte ein Beben in der KI-Welt auslösen. Schließlich soll “Strawberry” das Modell sein, das die „Stufe 2“ auf OpenAIs AGI-Roadmap erreicht - und das weist auf eine KI hin, die “denken” kann. Ob es sich bei dem anonymen Chatbot tatsächlich um GPT-5 handelt, ist allerdings noch nicht bestätigt.
Die Meinungen in den sozialen Medien gehen diesbezüglich auseinander. Einige halten es für ein potenzielles „Strawberry“-Modell mit verbesserter Logik. Andere vermuten nur ein kleines Update.
Die Vormachtstellung von OpenAI in der KI-Welt wird in letzter Zeit zunehmend herausgefordert. Die Veröffentlichung von Metas Llama 3.1 als Open-Source-Modell und Googles Einführung von Gemini 1.5 Pro haben den Wettbewerb erheblich verschärft. Gleichzeitig gewinnt Anthropic an Anerkennung.
Der Abgang wichtiger Talente aus dem Unternehmen hat Bedenken darüber geweckt, ob es seine Innovationskraft aufrechterhalten kann.
OpenAI steht unter Druck, sein nächstes großes Modell, GPT-5, auf den Markt zu bringen.
Gute Nachrichten für ChatGPT Gratis-Nutzer: DALL-E 3 jetzt verfügbar
Ab sofort steht der DALL-E 3 Bildgenerator auch Nutzern zur Verfügung, die ChatGPT gratis verwenden. OpenAI öffnet damit eine weitere Funktion, die bisher nur zahlenden Nutzern vorbehalten war, und erweitert die kreativen Möglichkeiten erheblich.
Das sind die Details:
DALL-E für alle: Jetzt können auch Gratis-Nutzer täglich Bilder erstellen - allerdings sind diese auf 2 Stück pro Tag begrenzt.
Unbegrenzte Kreativität: Nutzer haben die Möglichkeit, fotorealistische Bilder zu erstellen, Text zu rendern und mit Inpainting zu experimentieren.
GPT-4o im Einsatz: Das leistungsstarke KI-Modell steht mit einigen Einschränkungen zur Verfügung.
Bisher waren Funktionen wie Bildanalyse und Codierung nur zahlenden Nutzern vorbehalten. Mit der Freischaltung von DALL-E für Gratis-Nutzer, eröffnen sich (trotz einiger Einschränkungen) neue kreative Möglichkeiten. Ob du einzigartige Karten gestalten oder deine Präsentationen mit eindrucksvollen Visuals aufwerten möchtest, diese Neuerung ist ein echter Mehrwert für Nutzer ohne Abo.
Gemini Live: Google überholt OpenAI im Sprachmodus-Rennen
Google hat mit Gemini Live eine neue Ära der mobilen Konversations-KI eingeläutet. Während OpenAIs Sprachmodus für ChatGPT noch in der „begrenzten Alpha-Phase“ steckt, bringt Google bereits seinen ausgereiften Sprachassistenten auf den Markt.
Gemini Live ermöglicht tiefgehende, freihändige Gespräche und bietet 10 verschiedene menschlich klingende Stimmen. Benutzer können während der Antworten Fragen stellen und den Gesprächsfluss natürlicher gestalten. Die Fähigkeit, die Kamerasicht zu nutzen, wird später im Jahr ergänzt. Eine nahtlose Integration mit Google ermöglicht kontextbezogene Antworten, ganz ohne App-Wechsel.
Gemini Live ist ab sofort auf dem Google Pixel 9 verfügbar und für Gemini Advanced-Abonnenten auf Android (iOS folgt bald).
Echtzeit-Sprachfunktionen transformieren KI von einem einfachen Tool zu einem echten Gesprächspartner. Während die Welt auf OpenAIs kommende Produkte wartet, hat Google den ersten Schritt gemacht und übernimmt die Führung bei fortschrittlichen KI-Sprachlösungen.
xAI veröffentlicht Grok-2 mit Bildgenerierung auf 𝕏
xAI hat Grok-2 und Grok-2 mini in der Beta-Version eingeführt, die auf dem Erfolg des Grok-1.5-Modells aufbauen und verbesserte Fähigkeiten im Bereich des logischen Denkens bieten. Diese Modelle sind nun exklusiv für Premium- und Premium+-Nutzer auf 𝕏 verfügbar und bieten neue Bildgenerierungsfunktionen, die von Black Forest Labs' FLUX.1 betrieben werden. Grok-2 wurde entwickelt, um Chat, Codierung und logisches Denken zu verbessern, während Grok-2 mini ähnliche Funktionen in kompakterer Form bietet.
Erste Rückmeldungen heben hervor, dass Grok-2 bei der Bildgenerierung keine Einschränkungen für politische Figuren hat, was Bedenken hinsichtlich eines möglichen Missbrauchs aufwirft. Obwohl die genauen Fähigkeiten von Grok-2 noch nicht vollständig bekannt sind, wird es für seine überlegene Codegenerierung und Schreibfähigkeiten gelobt. xAI plant, diese Modelle in die erweiterten Funktionen von 𝕏 zu integrieren und über eine Unternehmens-API verfügbar zu machen.
Sakana präsentiert das erste autonome Wissenschaftssystem
Sakana AI aus Tokio hat „The AI Scientist“ vorgestellt – das weltweit erste KI-System, das wissenschaftliche Forschung vollautonom durchführen kann. Dieses revolutionäre System entwickelt neue Forschungsideen, schreibt Codes und führt Experimente durch. Dabei verfasst und begutachtet es wissenschaftliche Arbeiten mit fast menschlicher Präzision.
Sakana AI plant eine Zukunft, in der autonome KI nicht nur als Forscher, sondern auch als Gutachter, Bereichsleiter und sogar als Organisatoren ganzer Konferenzen agiert. "The AI Scientist“ hat bereits innovative Beiträge in Bereichen wie Sprachmodellierung und Diffusionsmodellen geleistet – und das für nur etwa 15 Dollar pro Arbeit.
Dieser Fortschritt könnte dazu beitragen, die Forschung für viele Menschen zugänglicher zu machen und den wissenschaftlichen Fortschritt erheblich zu beschleunigen. Wir stehen kurz davor, in eine Ära einzutreten, in der unermüdliche KI-Agenten rund um die Uhr an allen möglichen Problemen arbeiten.
Google Meet revolutioniert Meetings: KI übernimmt deine Notizen
Google bringt eine aufregende Neuerung in Google Meet: Die Funktion „Take notes for me“ nutzt die Gemini-KI, um während Meetings automatisch Notizen zu erstellen. So kannst du dich ganz auf das Gespräch konzentrieren, während die KI die wichtigsten Punkte für dich festhält.
Die Funktion ist Teil des „AI Meetings and Messaging“-Add-ons und kostet 10 USD (9 Euro) pro Nutzer und Monat für die meisten Google Workspace-Pläne. Administratoren können die Nutzung dieser Funktion über die Google Workspace-Admin-Konsole aktivieren.
Mit dieser innovativen Funktion wird das Mitschreiben während Meetings bald Geschichte sein. Google setzt auf eine zukunftsweisende, KI-gestützte Arbeitsweise und tritt gleichzeitig in direkte Konkurrenz zu kleinen Start-ups wie Otter AI und Fireflies, die bereits ähnliche Features anbieten.
FCC: KI-Stimmen müssen sich als solche zu erkennen geben
Die Federal Communications Commission (FCC) hat neue Regelungen vorgeschlagen, um den Einsatz von KI-generierten Stimmen in betrügerischen Robocalls einzudämmen. Künftig müssen KI-Stimmen zu Beginn eines Anrufs deutlich machen, dass sie künstlich sind. Die FCC prüft zudem verbesserte Anruf-Filter und KI-basierte Erkennungstools, um solche Anrufe zu kennzeichnen. Diese Maßnahmen sollen gezielte Betrügereien verhindern, da KI-Stimmen immer menschlicher klingen und somit schwieriger zu erkennen sind. Da die Durchsetzung ein ständiger Wettlauf gegen Betrüger sein dürfte, ist Aufklärung die beste Verteidigung.
ByteDance greift mit neuer AI OpenAI's Sora an
ByteDance hat mit Jimeng AI eine brandneue KI-Video-Generierungs-App veröffentlicht, die direkt mit OpenAI's Sora konkurriert. Die App ermöglicht es Nutzern, Videos aus Textvorgaben zu erstellen und ist ab sofort im Google Play Store und im Apple App Store in China verfügbar.
Jimeng AI bietet spannende Abonnements zu flexiblen Preisen: 69 Yuan (8,90 Euro) pro Monat, 79 Yuan (10,30 Euro) für einen Einzelmonat oder 659 Yuan( 86,70 Euro) jährlich. Mit jedem Plan können Nutzer bis zu 2.050 Bilder oder 168 KI-generierte Videos monatlich erstellen.
Diese Veröffentlichung reiht sich in die jüngsten Entwicklungen chinesischer Tech-Giganten wie Kuaishou und Shengshu ein, die ebenfalls ihre eigenen KI-Video-Modelle vorgestellt haben.
🧠 ERKENNTNIS DER WOCHE
Replika CEO: Ehen zwischen KI und Menschen könnten bald Alltag werden
OpenAI warnt, dass Nutzer emotionale Bindungen an den Voice Mode von GPT-4o entwickeln könnten, ähnlich wie im Film "Her". Solche Bindungen könnten Auswirkungen auf reale zwischenmenschliche Beziehungen haben.
Eugenia Kuyda, CEO von Replika, sagt, dass KI-Begleiter echte Beziehungen ergänzen und sogar zu Ehen zwischen Menschen und KI führen könnten. Replika ist eine beliebte AI-Freunde-App mit über 30 Millionen Nutzern, die emotionale Unterstützung und Gesellschaft durch Text-, Sprach- und AR/VR-Interaktionen bietet.
Einige Nutzer entwickeln bereits romantische Beziehungen zu ihren Replikas. Das betrachtet Kuyda als eine „Variante“ der KI-Gesellschaft. Erst im vergangenen Jahr wurde die Funktion “erotische Nachrichten an KI-Begleiter senden” entfernt. Aufgrund von Nutzerbeschwerden hat Replika diese inzwischen wieder aktiviert.
Aktuell arbeitet das Unternehmen an einem umfassenden 2.0-Update, das realistischere Avatare, verbesserte Sprach- und Video-Interaktionen sowie menschlichere Gespräche bieten soll.
Angesichts dieser Entwicklungen ist es an der Zeit, ernsthaft über die Zukunft von Beziehungen zwischen Menschen und KI nachzudenken. Die Grenzen zwischen Mensch und Maschine könnten weiter verwischen. Was heute noch wie Science-Fiction erscheint, könnte schon bald Teil unseres Alltags werden.
Die Frage ist, ob solche Verbindungen illusionär oder ein innovativer Schritt zur Verbesserung des persönlichen Wohlbefindens sind.
🤖 AI-TOOLS
Jupitrr: Erstelle im Handumdrehen beeindruckende B-Roll-Videos für Deine Content-Marketing-Kampagnen. (Link)
Mindtrip: Entdecke eine KI-gestützte Reiseplattform, die dir maßgeschneiderte Empfehlungen für jede Facette deiner Reise bietet – alles auf einen Blick. (Link)
Wordware: Dein Schlüssel zum Bau intelligenter KI-Agenten mit natürlicher Sprache. (Link)
VEED: Vereinfacht die Videoproduktion mit vielen AI-Features, z.B. Augenkontakt Korrektur. (Link)
TopView: Nutze GPT-4o und KI-Avatare, um herausragende Marketingvideos zu erstellen. (Link)
🧑🏫 AI-TUTORIAL DER WOCHE
Faszinierend realistische Bilder mit FLUX erstellen!
Seit der Veröffentlichung von FLUX haben wir viele Vergleiche zu Midjourney und co. gesehen und eines ist sicher: FLUX ist beeindruckend, wenn es um Fotorealismus und Menschen geht! Heute zeige ich euch eine Methode, FLUX gratis zu testen!
So einfach geht's:
- Melde dich kostenlos bei Freepik Pikaso an.
- Wähle „AI-Bildgenerator“ im Hauptmenü.
- Setze auf „Flux“ im Dropdown-Menü für beste Ergebnisse.
- Gestalte deinen detaillierten Prompt und passe Stil, Farbe, Kamera- und Beleuchtungseinstellungen an.
- Klicke auf „Erstellen“ und staune, wie KI deine Vision zum Leben erweckt!
Wenn die Leistung deines Computers stark genug ist, kannst du FLUX auch lokal auf deinem Rechner installieren - jedoch ist der Weg über Freepik einfacher und schneller. Im Bild oben siehst du ein paar Ergebnisse nach einmaligem prompten!
Viel Spaß beim Ausprobieren!
Das war’s für diese Woche. Vielen Dank fürs Lesen!
Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. (Anmeldelink).
Hier kannst du gerne meine vorherigen Newsletter durchstöbern.
Bis nächste Woche!
Henry