Bild-KI verstehen: Warum Prompts nur eine Momentaufnahme sind und sich mit der Zeit verändern
18/05/2023OpenAI vor dem US Senat
22/05/2023Der Weg zu einer kommerziell sicheren KI: Adobes KI-Strategie
Diejenigen unter euch, die in der Kreativ- und Medienbranche tätig sind, kennen wahrscheinlich die bedeutende Rolle, die Adobe in diesem Bereich spielt.
Das Unternehmen ist der anerkannte Marktführer bei der Bereitstellung innovativer Werkzeuge. Selbst im Mainstream ist “Photoshopped” zu einem gängigen Begriff für Fotobearbeitung geworden.
Aber Adobe steckt in einem interessanten Dilemma.
Wie der aufkommende Sturm eines Hurrikans, der einen großen Bezirk verwüstet, ist die generative KI dabei, die Grundfesten der kreativen Welt zu erschüttern.
In Anbetracht der Klagen, der Urheberrechtsprobleme und des ungeregelten Chaos sind die Künstler/innen nicht gerade begeistert vom Trainingsprozess für die Datensätze. Währenddessen kämpfen die Unternehmen mit den rechtlichen Folgen.
Adobe, der Unterstützer von Business-Tools, muss also ein heikles Gleichgewicht halten, um mit den neuesten kreativen Tools Schritt zu halten und gleichzeitig das Vertrauen seiner Kunden zu bewahren.
Kommerziell freundliche KI
Adobes neues Firefly-Projekt ist eine Familie von generativen KI-Modellen, die auf Adobe Stock-Bildern, frei lizenzierten Inhalten und Public Domain-Inhalten trainiert wurden, um Inhalte zu generieren, die für die kommerzielle Nutzung sicher sind.
Die KI-Tools werden sowohl als eigenständige Anwendungen verfügbar sein als auch in gängige Adobe-Software integriert werden.
Im Gegensatz zu beliebten KI-Bildumwandlern wie DALL-E, Stable Diffusion und Midjourney erhältst du mit Firefly jedoch keine Bildergebnisse, die auf Eingabeaufforderungen mit Künstlernamen, Berühmtheiten oder berühmten Personen basieren.
Willst du ein Bild von Iron Man oder Scarlett Johannson, das etwas Cooles macht? Wie wäre es mit dem Papst, der eine coole Lederjacke trägt?
Nicht möglich.
Einschränkungen der Adobe KI
Leider hat das kommerzielle Modell auch einige Nachteile.
Adobes Bildarchiv besteht aus über 200 Millionen hochwertigen Bildern (Fotos, Illustrationen und Vektorgrafiken), was sich nach viel anhört, aber bedenke, dass Stable Diffusion auf 2,3 Milliarden Bildern trainiert wurde.
Wenn du dich nur auf kommerzielle Bilder verlässt, kannst du niemals die Vielfalt und Tiefe erreichen, die mit einem Tool wie Midjourney möglich ist.
Obwohl sich Adobes Text-zu-Bild-Tool noch in der Beta-Phase befindet und es wahrscheinlich nicht fair ist, es in diesem Stadium zu kritisieren, möchte ich einige erste Eindrücke teilen.
Im Großen und Ganzen ist es nicht schlecht, aber es sieht ein bisschen wie Stockfotografie aus.
Im Grunde ist es vorhersehbar.
Die Kunst- und Illustrationsausgabe ist in Bezug auf die Kreativität besser.
Aber mir ist aufgefallen, dass es NICHT viel Abwechslung in der Produktion gibt.
Ehrlich gesagt, würde ich sagen, dass die Qualität im Moment in der Größenordnung von Midjourney v3 oder Stable Diffusion 1.5 liegt.
Aber hey… das ist eine Beta-Version, oder? Und sie wird bestimmt noch besser werden, oder?
Mag sein.
Das ist die Herausforderung bei einem kleineren Datensatz: weniger Vielfalt, weniger Tiefe, weniger Risiko und mehr Vorhersehbarkeit.
Es gibt eine clevere Lösung, um einen größeren Datensatz zu trainieren, die Adobe möglicherweise nutzen könnte, wenn sie geschickt genug sind.
Im Grunde genommen sind alle Bilder, die heute von KI-Tools erzeugt werden, NICHT urheberrechtlich geschützt und nach den heutigen Urheberrechtsgesetzen sind sie gemeinfrei.
Allein DALL-E erzeugt mehr als 2 Millionen Bilder pro Tag, und Midjourney wahrscheinlich noch viel mehr. Das bedeutet, dass Adobe möglicherweise auf diese Bilder zurückgreifen könnte, weil sie kommerziell sicher sind.
Ich glaube nur nicht, dass sie es tun würden, weil es nicht zu der Geschichte passt, die sie erzählen wollen.
Die Vorteile
Aber wenn du ein Unternehmen, eine Kreativagentur oder ein Verlag bist und dich vor möglichen Schadenersatzforderungen aufgrund von Klagen wegen missbräuchlich verwendeter Trainingsdaten schützen willst, dann ist das kein Problem.
Oder wenn du ein Künstler oder eine kreative Person bist, die ein gutes Gefühl dabei haben möchte, dass sie nur kommerziell haftende Inhalte verwendet.
Dann ist Adobes Firefly die generative KI-Lösung für dich.
Ich respektiere Adobes Position, fair spielen zu wollen, aber ich frage mich, wie sich das gegenüber der Konkurrenz auswirkt.
Wenn man bedenkt, wie viele robuste Open-Source-Bildwerkzeuge auf dem Weg sind und wie viele davon auf Stable Diffusion XL laufen werden. Wenn man bedenkt, wie umfangreich Midjourney, Leonardo, Stable Diffusion, DALL-E (enhanced) und Blue Willow sind.
Wird Adobes KI-Bildstrategie gut genug sein, um seine Position als führendes Unternehmen in der Kreativbranche zu behaupten?
Oder wird es eine mittelmäßige Version von KI sein, die einfach nur dazu beiträgt, das Niveau von Stockbildern zu erhöhen? Das bleibt abzuwarten.