Deutsches KI-Startup macht Midjourney und Sora Konkurrenz
Hey! Willkommen zurück zu deinem wöchentlichen AI-Update! Dein Newsletter für die KI-Revolution - immer up-to-date und einen Schritt voraus!
Heute habe ich für dich:
Die wichtigsten News der Woche 🔥
Erkenntnis der Woche: EU-KI-Gesetz – Ein Paradebeispiel für Realitätsferne 🇪🇺
5 Nützliche AI-Tools 🤖
AI-Tutorial der Woche: 3 ChatGPT-Prompts, die deine Arbeitsproduktivität steigern 🧑💻
🔥 AI-NEWS
Deutscher Konkurrent zu Midjourney und Sora
Das Freiburger Team von Black Forest Labs hat sich aus dem Stealth-Modus gewagt und bringt uns bahnbrechende Innovationen im Bereich der KI-Bildgenerierung. Mit FLUX.1 haben sie hochmoderne KI-Bildgenerierungsmodelle auf den Markt gebracht, die mit den Marktführern Midjourney und DALL-E 3 konkurrieren.
FLUX.1 kommt in drei Varianten:
[pro]: Hochwertiges Modell mit erstklassiger Leistung, kostenlos über Replicate verfügbar.
[dev]: Offene, nicht-kommerzielle Version mit herausragender Effizienz.
[schnell]: Ultra-effizientes Modell für lokale Entwicklung und persönlichen Gebrauch.
In den sozialen Medien begeisterte Flux mit der herausragenden Qualität der KI-generierten Bilder, insbesondere im Vergleich zu führenden Tools. Stark gelobt wird die Fähigkeit von Flux, Text in Bildern präzise darzustellen. Ein weiteres Highlight: Teile der Flux-Modelle werden Open Source veröffentlicht, im Gegensatz zu den geschlossenen Systemen von OpenAI oder Midjourney.
Das Erfolgsgeheimnis liegt im Team: Die Gründer Robin Rombach, Patrick Esser und Andreas Blattmann, die bereits hinter Stable Diffusion standen, sowie ein erweitertes Team von ehemaligen Stability.ai-Forschern.
Und es wird noch spannender:
Black Forest Labs arbeitet an SOTA, einem neuen KI-Video-Modell, das OpenAI's Sora Konkurrenz machen soll.
OpenAI-Mitgründer ziehen sich zurück
John Schulman, Mitbegründer von OpenAI und maßgeblich an der Entwicklung von ChatGPT beteiligt, verlässt das Unternehmen, um sich dem konkurrierenden KI-Startup Anthropic anzuschließen. Schulman betonte auf X, dass er sich mehr auf die Ausrichtung von KI und technische Arbeit konzentrieren möchte. Sein Abgang hinterlässt eine bedeutende Lücke bei OpenAI, insbesondere in der Leitung der Ausrichtungswissenschaften.
Neben Schulman nimmt auch Greg Brockman, Präsident und Mitbegründer von OpenAI, eine längere Auszeit bis Ende des Jahres, um sich zu erholen. Ilya Sutskever, ein weiterer Mitbegründer und leitender Wissenschaftler, verließ das Unternehmen bereits im Mai. Auch Produktleiter Peter Deng soll das Unternehmen verlassen haben.
Von den ursprünglichen elf Gründern bleiben nun nur noch drei bei OpenAI: Sam Altman, Greg Brockman und Wojciech Zaremba. Diese Abgänge kommen zu einem Zeitpunkt, an dem OpenAI zunehmendem Wettbewerb durch Anthropic und Meta AI gegenübersteht.
Midjourney veröffentlicht Version 6.1
Midjourney hat die Version 6.1 seiner KI-Bildgenerierungssoftware veröffentlicht. Das Update bringt erhebliche Verbesserungen in der Bildqualität, Kohärenz, Textgenauigkeit sowie neue Upscaling- und Personalisierungsmodelle.
Wesentliche Neuerungen in V6.1:
Allgemein schönere Bilder: Übergreifende ästhetische Verbesserungen.
Kohärentere Bilder: Verbesserte Darstellung von Armen, Beinen, Händen, Körpern, Pflanzen und Tieren.
Höhere Bildqualität: Reduzierte Pixelartefakte, verbesserte Texturen und Hautdarstellungen sowie optimierte 8-Bit-Retro-Designs.
Detaillierte Bildmerkmale: Präzisere und korrekt dargestellte kleine Bilddetails wie Augen und weit entfernten Hände.
Neue Upscaler: Deutlich bessere Bild- und Texturqualität.
Schnellere Verarbeitung: Etwa 25% schnellere Bearbeitung bei Standardbildern.
Verbesserte Textgenauigkeit: Genaue Darstellung von Texten innerhalb der Bilder.
Neues Personalisierungsmodell: Verbesserte Nuancen, Überraschungseffekte und Genauigkeit bei personalisierten Inhalten.
Personalisierungscode-Versionierung: Nutzung von Personalisierungscodes aus früheren Aufträgen, um deren Modelle und Daten zu verwenden.
Neuer Modus „--q 2“: Fügt manchmal mehr Textur hinzu, reduziert jedoch die Bildkohärenz und benötigt 25% mehr Zeit.
Midjourney V6.1 verspricht ein intelligenteres, schnelleres und klareres Erlebnis für Nutzer und stellt die bislang beste Version des Modells dar.
Elon Musk verklagt OpenAI erneut und erhebt schwere Vorwürfe
Elon Musk hat eine neue Klage gegen OpenAI und CEO Sam Altman eingereicht, in der er schwerwiegende Vorwürfe erhebt: Manipulation und Täuschung beim Übergang des Unternehmens von einer gemeinnützigen zu einer gewinnorientierten Struktur.
Musk behauptet, OpenAI habe gegen die „Gründungsvereinbarung“ verstoßen, die eine KI-Entwicklung zum Wohle der Menschheit garantieren sollte. Die neue Klage wirft zudem Verstöße gegen Gesetze zur Bekämpfung organisierter Kriminalität und „zahlreiche Fälle von Drahtbetrug“ vor.
Musk hatte im Juni eine ähnliche Klage ohne Angabe von Gründen zurückgezogen, die ebenfalls OpenAI vorwarf, gegen die Vereinbarung zur Offenlegung der Technologie verstoßen zu haben.
OpenAI bestreitet die Vorwürfe und verweist auf frühere Aussagen, wonach Musk den Wechsel zum gewinnorientierten Modell unterstützt habe.
Nvidia trainiert Videomodell „Cosmos“ und geht ein hohes Risiko ein
Laut geleakten Dokumenten von 404 Media hat Nvidia täglich Millionen von Videos von YouTube, Netflix und anderen Plattformen heruntergeladen, um sein neues KI-Modell „Cosmos“ zu trainieren.
Nvidias Projekt „Cosmos“ will täglich visuelle Daten im Umfang einer gesamten menschlichen Lebenszeit verarbeiten. Dazu nutzt das Unternehmen Open-Source-Tools und virtuelle Maschinen zum Download von Filmen und Serien. Trotz interner Bedenken zu Urheberrecht und Ethik erhielt Nvidia grünes Licht von der Führungsebene.
Nvidia versichert, dass ihre Vorgehensweise „vollständig im Einklang mit dem Urheberrecht“ sei. Doch mit dem Projekt Cosmos geht der Technologieriese ein großes Risiko ein, da dieser Schritt die Branche aufrütteln könnte – speziell in Zeiten, in denen solche Praktiken genauestens unter die Lupe genommen werden.
Google Gemini 1.5 Pro erobert die KI-Rangliste
Das neue, experimentelle Modell Gemini 1.5 Pro von Google DeepMind steht für Tests zur Verfügung und hat die Spitze der KI-Chatbot-Rangliste errungen. Mit einer beeindruckenden Punktzahl von 1300 übertraf es OpenAIs GPT-4o und Anthropic's Claude-3.5.
Gemini 1.5 Pro (experimentell 0801) sammelte über 12.000 Community-Stimmen in einer Testwoche auf der LMSYS Chatbot Arena und sicherte sich die erste Position in der Gesamtwertung sowie der Vision-Rangliste.
Google DeepMind hält sich mit Details zurück, verspricht aber baldige Updates. Dieser unerwartete Sprung um 14 Punkte könnte bedeuten, dass Google nun unangefochten an der Spitze steht - was die Konkurrenz sicher auf den Plan rufen wird.
Zugriff erhältst du über die Gemini API oder Google AI Studio – beide Plattformen bieten unterschiedliche Anwendungsfälle und Nutzererfahrungen. Die API integriert das Modell in bestehende Anwendungen, während Google AI Studio eine benutzerfreundliche Umgebung zur Erkundung aller Gemini-Modelle bietet.
Enthüllung von Figure 02: Der leistungsstärkste humanoide Roboter auf dem Markt
Das KI-Robotikunternehmen Figure sorgt mit der Enthüllung seines humanoiden Roboters der zweiten Generation, Figure 02, für Aufsehen. Am 6. August 2024 wurde Figure 02 offiziell vorgestellt und beeindruckte mit einem fortschrittlichen Design, robotischen Gelenken und flexiblen Mesh-Elementen.
Gegründet 2022 von Brett Adcock und unterstützt von OpenAI sowie großen Investoren wie Nvidia, Microsoft und Intel Capital, hat Figure AI mit dem ersten Modell “Figure 01” bereits viel erreicht. Ziel ist es, den Arbeitskräftemangel in verschiedenen Bereichen zu lindern und die Sicherheit und Effizienz am Arbeitsplatz zu verbessern. Mit den neuesten KI-Technologien von OpenAI wird Figure 02 den Wettbewerb im Bereich der humanoiden Robotik weiter verschärfen.
🧠 ERKENNTNIS DER WOCHE
EU-KI-Gesetz – Ein Paradebeispiel für Realitätsferne
Der erste und umfassendste Regulierungsrahmen zur Künstlichen Intelligenz ist offiziell in Kraft gesetzt. Der AI Act reguliert die Nutzung und Entwicklung von KI in der EU, um die Grundrechte der Menschen zu wahren und gleichzeitig Innovationen zu fördern.
Allerdings sehen viele die Zukunft und die Wettbewerbsfähigkeit der EU dadurch gefährdet. Alleine der Aufbau des AI Acts lässt vermuten, dass die EU nicht versteht, worum es bei KI geht.
Der Digitalexperte und SPIEGEL-Kolumnist Sascha Lobo wirft der EU-Kommission und dem Europäischen Parlament vor, wirtschaftlichen Fortschritt zu behindern und kritisiert das neue KI-Gesetz als praxisfremd und übermäßig bürokratisch.
Sein Kommentar: „Die EU-Kommission und das Europäische Parlament interessieren sich einen gequirlten Quark für wirtschaftlichen Fortschritt“.
Die EU habe immer Freiheit, Stabilität und Wohlstand versprochen, doch inzwischen sei die politische Bürokratie zur „Verhinderungsverwaltung“ mutiert, so Lobo.
Das KI-Gesetz sieht der Digitalexperte als Paradebeispiel für dieses Versagen. Es gehe völlig an der Realität vorbei, beginnend bei der grundlegenden Unklarheit, was ein KI-System überhaupt sei. „Die ganze Verordnung will regulieren, hat aber nirgendwo sinnvolle Definitionen eingebaut“, kritisiert Lobo und verweist auf zahlreiche Stellen im Gesetz.
Besonders ärgert ihn der immense Aufwand für Unternehmen. „Wer KI unternehmerisch nutzt, muss im Zweifel unfassbar viel dokumentieren, managen, nachweisen und einschätzen“, erklärt Lobo. Das betreffe auch Bereiche, in denen Wissen schlichtweg nicht vorhanden sein könne. Sein Fazit: „Je komplexer eine Regulierung ist, desto mehr Willkür schleicht sich ein.“
🤖 AI-TOOLS
Minduck: Verwandelt die KI-Interaktion durch visuelle Denkwerkzeuge und ersetzt traditionelle Chat-Oberflächen. (Link)
Ollama: Ermöglicht dir müheloses Ausführen und Anpassen von LLMs. (Link)
Flux: Neues hochmoderne KI-Bildgenerierungsmodelle. Mehr dazu oben in den News. (Link)
Attention: Nutze KI-Agenten wie Vertriebsmanager, Datenanalyst und Vertriebsoperationen, um mehr Abschlüsse zu erzielen und deine Umsatzziele zu erreichen. (Link)
Canva Music: Ergänze deine Canva-Designs mit Musik, Soundeffekten oder lade eigene Audiodateien hoch. (Link)
🧑🏫 AI-TUTORIAL DER WOCHE
Steigere deine Arbeitsproduktivität mit diesen 3 ChatGPT-Prompts
Organisiere deinen Tag im Handumdrehen: Lass ChatGPT deine heutige To-do-Liste erstellen. Nenne einfach die Aufgaben [Aufgabe 1], [Aufgabe 2], [Aufgabe 3] und [Aufgabe 4] sowie ihre Deadlines: [Aufgabe 1] bis [Zeit 1], [Aufgabe 3] um [Zeit 2], [Aufgabe 2] bis [Zeit 3] und [Aufgabe 4] für [Zeit 4].
Effektives E-Mail-Management: Verfasse mühelos Antworten auf anspruchsvolle E-Mails. Beispiel: „Hilf mir, eine E-Mail an einen Kunden über [Thema] zu verfassen und einen [Ton]-Ton zu verwenden. Hier ist die Email:“
Meisterhafte Präsentationen: Fasse die wichtigsten Punkte und Maßnahmen aus einem Meetingprotokoll zusammen, um deine Präsentation zu perfektionieren. Beispiel: „Fasse die wesentlichen Punkte und Aktionen aus meinem letzten Meeting zusammen. Hier ist das Transkript: [Link].“
Das war’s für diese Woche. Vielen Dank fürs Lesen!
Dir hat der Newsletter gefallen? Dann freue ich mich, wenn du ihn an deine Freunde weiterleitest. (Anmeldelink).
Hier kannst du gerne meine vorherigen Newsletter durchstöbern.
Bis nächste Woche!
Henry