Die KI-Fähigkeit, die du im Jahr 2023 lernen MUSST
12/03/2023Dein Jobprofil: KI-Prompter
12/03/2023Es wurde einmal gesagt, dass „Software die Welt auffrisst“. Wenn man den letzten Monaten Glauben schenken darf, könnte man meinen, dass die KI sie jetzt neu schreibt, neu malt und generell alle möglichen neuen Versionen davon erzeugt.
Der Start von ChatGPT und das anschließende Wachstum auf 1 Million Nutzer/innen in weniger als einer Woche scheint ein Wendepunkt gewesen zu sein, da das öffentliche Bewusstsein für den aktuellen Stand und die zukünftigen Möglichkeiten von großen Sprachmodellen (LLMs), generativer KI und anderer künstlicher Intelligenz erwacht ist. Es gibt jedoch noch viel mehr zu beachten als den Hype um ein bestimmtes Produkt und die allgemeine Verbreitung von KI.
Mit welchen technologischen Fortschritten und Anwendungen können wir also im kommenden Jahr rechnen?
Haftungsausschluss: Vorhersagen sind schwer (wenn du keine Maschine bist)
Die erste leicht zu treffende Vorhersage ist, dass eine solche Aussage sicherlich auf die gängige Sichtweise von KI passt. In diesem Zusammenhang wird die kurzfristige Überschätzung aus einem Mangel an Verständnis für die Herausforderungen im Zusammenhang mit der Dateninfrastruktur und der Datenqualität resultieren sowie aus der Schwierigkeit, alle Nuancen und die Komplexität beim Einsatz der Technologie in Produkten und Arbeitsabläufen, die von normalen Menschen genutzt werden, zu lösen. Langfristig werden die Auswirkungen des technologischen Fortschritts unterschätzt, weil man sich nicht vorstellen kann, wie sie sich gegenseitig verstärken.
Seit der Gründung von J12 im Jahr 2020 konzentrieren sich die Mitarbeiter von J12 auf die Dateninfrastruktur, die für die Entwicklung intelligenter Produkte erforderlich ist, und auf die Unterstützung von Teams, die verschiedene fortschrittliche KI-Anwendungen entwickeln. Von der Datenqualität (Validio) bis hin zu Anwendungen im Einzelhandel (Dema und Formulate), im Gesundheitswesen (unangekündigt), im Energiesektor (Ostrom), bei DevOpps (Rely.io, Codeball), in der Cybersicherheit (CYBR.ai) und vielen anderen Bereichen haben wir gesehen, wie Teams an der Spitze ihrer Branchen Daten und KI nutzen, um neue Wege zu gehen.
Hier ist, was J12 für das kommende Jahr erwartet und auf welche Bereiche sie besonders gespannt sind.
Mit anderen Worten: Lass uns das kommende Jahr überbewerten…
Ausblick 2023
Umgeben von Modellen
ChatGPT, das auf OpenAIs GPT-3 aufbaut, ist bisher das Modell, das mit dem meisten Ruhm gekrönt wurde. Aber selbst Sam Altman – CEO von OpenAI – hat seine Überraschung darüber ausgedrückt, dass niemand ChatGPT vor ihnen gebaut hat:
„Wir hatten das Modell für ChatGPT 10 Monate lang in der API, bevor wir ChatGPT entwickelt haben… Ich dachte, jemand anderes würde es einfach bauen„.
Das sollte eine deutliche Erinnerung daran sein, dass es derzeit eine Reihe ähnlicher Produkte gibt, die noch nicht entwickelt und veröffentlicht wurden, und dass OpenAI bei weitem nicht allein ist. Die Behauptung, dass ChatGPT und OpenAI die Google-Suche auslöschen werden, ist etwas phantasievoll, auch wenn sie die Frage aufwirft, wie sich die Suche weiterentwickeln wird und was das für das Geschäftsmodell von Google bedeuten könnte. Sowohl Google als auch Meta haben ähnliche Technologien entwickelt und verfügen über das nötige Talent, um dies auch weiterhin zu tun, aber OpenAI hat sich bisher einen Vorteil verschafft, indem es seine Sprachmodelle für die Öffentlichkeit freigibt, damit diese sie nutzen und ihr Feedback geben kann.
Google wird LaMDA wahrscheinlich noch in diesem Jahr vollständig für die Öffentlichkeit freigeben, während Meta wahrscheinlich nicht zurückbleiben wird. Die nächste Generation von OpenAI, GPT-4, wird voraussichtlich Anfang 2023 auf den Markt kommen. Auch wenn sie nicht die viel zitierten 100 Billionen Parameter haben wird – im Vergleich zu den 175 Milliarden von GPT-3 – wird sie einen weiteren Sprung nach vorne bedeuten.
Das Rennen hat gerade erst begonnen.
Und nicht nur Big Tech steht an der Startlinie, sondern auch mehrere Start-ups wie Cohere, Character.AI, Adept und Inflection.AI haben ähnliche Modelle entwickelt, die kurz vor der Veröffentlichung stehen.
Strukturierung einer unstrukturierten Welt
Etwa 80-90% der von Unternehmen erzeugten Daten sind unstrukturiert. Beispiele dafür sind E-Mails, Präsentationen, Telefonaufzeichnungen, Mediendateien, Überwachungsbilder und so weiter. Obwohl diese Datentypen eine Fülle von Informationen enthalten, sind sie in der Regel schwer zu analysieren.
Große Sprachmodelle (Large Language Models, LLMs) können jetzt diese Herausforderungen meistern – sie verstehen große Mengen unstrukturierter Daten und ermöglichen es Unternehmen, verwertbare Erkenntnisse zu gewinnen. Wir können davon ausgehen, dass diese Fähigkeiten in einer Reihe von Geschäftsabläufen eingesetzt werden, um die Suche in Unternehmenssoftware zu verbessern, Regierungen bei der Verbesserung der nationalen Sicherheit zu unterstützen und überall dort, wo die Strukturierung von Daten verborgene Muster aufdecken kann, die zu wissenschaftlichen Durchbrüchen beitragen oder das Kundenerlebnis verbessern können.
Anwendungen, Anwendungen, Anwendungen – aber wer gewinnt?
Während die generative KI-Infrastruktur und die Plattformen allmählich Gestalt annehmen, erleben wir das Entstehen der Anwendungsebene.
Generative KI senkt die Hürden für die Erstellung von Inhalten drastisch – mit leistungsstarken Produkten für geschriebene Inhalte, Text-zu-Bild, Text-zu-Video und 3D-Spielerstellung. Genauso drastisch sind die Produktivitätssteigerungen – mit Lösungen, die die Codegenerierung, die Effizienz des Vertriebsteams
Kundenservice und die automatische Erstellung von Marketingmaterial und Anzeigen bis hin zu juristischen Dokumenten.
Heute ist es schwierig, systemische Gräben in der generativen KI zu erkennen, da sich die Anwendungen aufgrund der Verwendung ähnlicher Modelle nicht voneinander unterscheiden. In naher Zukunft werden sich Unternehmen wahrscheinlich dadurch positionieren, dass sie diese Modelle frühzeitig in verschiedenen Kontexten anwenden und reibungslos funktionierende Produkte für sie entwickeln. Geschäftsverständnis und Design können zwar für eine gewisse Verteidigungsfähigkeit sorgen, sind aber in der Regel nicht die stärksten Hindernisse auf lange Sicht.
Eine Reihe von Anwendungsunternehmen konnte schnell wachsen und erfolgreich Kunden gewinnen, die schnell bereit sind, neue Lösungen auszuprobieren, die ihnen einen Vorteil verschaffen könnten, aber sie haben Schwierigkeiten, ihre Kunden zu halten und sich von anderen zu unterscheiden, wenn neue Anbieter auf den Markt drängen. Im Laufe des kommenden Jahres werden wir mehr darüber erfahren, ob die Kunden bereit sind, für diese Lösungen zu zahlen und sie wirklich in ihre Prozesse zu integrieren. Dabei kann es sich um Daten handeln (z. B. die Nutzung eigener Datensätze auf der Grundlage von Basismodellen), um die Leistung eines Modells (z. B. die Fähigkeit, ein Modell auf einen bestimmten Datensatz zuzuschneiden) oder um eher traditionelle Aspekte (z. B. Vertrieb und Netzwerkeffekte).
Multimodalität?
„Modalität bezieht sich auf die Art und Weise, wie etwas geschieht oder erlebt wird“, und bisher erfüllen die Modelle und Anwendungen, mit denen wir interagieren, Aufgaben mit nur einer Modalität – sie reagieren auf reine Textinteraktion und geben Text aus (im Fall von ChatGPT) oder ein Bild (im Fall von DALL-E).
Multimodal bedeutet die Fähigkeit, das Verständnis verschiedener Datentypen (Text, Bild, Audio, Video, numerische Daten) zu kombinieren und zur Lösung von Aufgaben zu nutzen, die jede Modalität betreffen. Ein solches Modell könnte aus einer Texteingabe ein Video produzieren oder aus einer Bild- und Audioeingabe einen Text. So wie unser Wissen über die Welt aus einer Kombination von visuellen, sprachlichen, akustischen und anderen Sinneseindrücken entsteht, verbessert dies den gesunden Menschenverstand und das kontextbezogene Verständnis der KI erheblich.
Eine vielversprechende Anwendung ist das Gesundheitswesen, wo Diagnosen aus einer multimodalen Analyse von Bildern, beschriebenen Symptomen und Patientendaten erstellt werden könnten.
Sam Altman hat kürzlich erklärt, dass er in naher Zukunft mit einem multimodalen Modell rechnet, obwohl er nicht so weit geht zu sagen, dass GPT-4 dieses Modell sein wird. Wahrscheinlich wird es das nicht sein, aber irgendwann in diesem Jahr werden wir vielleicht einen Blick darauf werfen können, wozu multimodale KI in der Lage ist.
Empfehlungen, von denen du nicht wusstest, dass du sie brauchst
Während generative KI die Schlagzeilen beherrscht, werden viele Produkte weiterhin auf der Verbesserung algorithmischer Empfehlungssysteme aufbauen. In den letzten Jahren hat TikTok mit seinen algorithmisch kuratierten Inhalten die sozialen Medien auf den Kopf gestellt, während im Bereich Mode und Handel der bemerkenswerte Aufstieg von SHEIN zum Teil auf seine Fähigkeit zurückzuführen ist, Kleidung zum Kauf zu empfehlen, und Spotify weiterhin die Welt des Musikstreaming anführt, indem es dir die richtige Musik zur richtigen Zeit liefert.
Rex Woodbury von Index Ventures meint: „Die wichtigsten Anwendungen von KI für Verbraucher werden sich auf ausgefeilte Empfehlungen konzentrieren, die deine Wünsche und Bedürfnisse vorhersehen, bevor du sie überhaupt kennst.„
Kategorien, die in den letzten zehn Jahren von den Anbietern mit den besten digitalen oder mobilen Erlebnissen definiert wurden, könnten in Zukunft von denjenigen neu definiert werden, die leistungsfähige Empfehlungssysteme am besten nutzen können, um den Nutzern die personalisiertesten Inhalte anzubieten. Von Finanzen und Reisen über Jobsuche und Dating bis hin zu allen Bereichen des Handels. Alles, was bisher mit einem persönlichen Berater oder Coach zu tun hatte, steht zur Disposition.
Der Aufstieg der digitalen Zwillinge
Eine neue Art von realitätsnahen digitalen Zwillingen entsteht, da Simulationen von realen Objekten und Umgebungen immer komplexer und nützlicher werden. Beispiele hierfür sind:
- Eine sogenannte industrielle Revolution durch Simulation, bei der alles, was in der realen Welt gebaut wird, zunächst in einer virtuellen Welt simuliert wird (wie von Bob Pette beschrieben). Simulierte Fabriken und Arbeitsplätze ermöglichen die Optimierung von Fertigungsprozessen und die Verbesserung der Arbeitssicherheit, während virtuelle Städte die Möglichkeit bieten, die Stadtplanung auf die nächste Stufe zu heben.
- Digitale Zwillinge können in jedem Maßstab Umgebungen simulieren, in denen hochqualifizierte Fachkräfte ausgebildet werden können. Ob Chirurgen, die in einem virtuellen Operationssaal Operationen proben, oder Arbeiter, die in einer Fabrikhalle mit modernen Maschinen arbeiten.
KI-Cybersecurity vs. KI-Cyberbedrohungen
Der Aufstieg der generativen KI – bei schriftlichen Inhalten, Bildern, Kunst, Videos und Sprache – bedeutet eine Zunahme von Fälschungen, betrügerischen Inhalten, Betrug und Cyber-Sicherheitsbedrohungen.
Phishing-Betrüger haben jetzt viel bessere Möglichkeiten, die menschliche Kommunikation in Texten, E-Mails und Sprachanrufen zu kopieren, um Systeme zu hacken. Generative KI kann aber auch dazu verwendet werden, Passwörter zu synthetisieren oder ähnliche Fingerabdrücke zu erstellen, um die Authentifizierung zu umgehen oder Malware besser zu tarnen. Wir erwarten, dass das Cyber-Bewusstsein zunimmt und Lösungen entstehen, die darauf abzielen, die Rechte, die Privatsphäre und die Sicherheit von Einzelpersonen und Unternehmen zu schützen.
Daten und KI im Kampf gegen den Klimawandel
Am Schnittpunkt der größten Bedrohung dieser Generation und einer der größten technologischen Revolutionen.
Da das Energienetz durch den Anstieg erneuerbarer Energien und dezentraler Energieressourcen immer komplexer wird, brauchen Netzbetreiber bessere Überwachungsinstrumente, während Versorgungsunternehmen KI einsetzen müssen, um die Nachfrageprognose und die Effizienz durch Lastausgleich zu verbessern. Gleichzeitig können Energiedaten genutzt werden, um Unternehmen und Haushalte zu einem nachhaltigeren Energiemix und optimierteren Verbrauchsmustern zu bewegen.
Neue Unternehmen in Hülle und Fülle
Während verschiedene makroökonomische Faktoren dazu führen können, dass einige das Gefühl haben, dass es keine gute Zeit ist, um ein neues Unternehmen zu gründen, gibt es andere positive Faktoren, die den Effekt aufwiegen können.
- Generative KI steht für die Art von technologischem Paradigmenwechsel, der das Potenzial hat, einen Wandel herbeizuführen, der sogar den Aufstieg von Mobile und Cloud vor etwas mehr als einem Jahrzehnt übertrifft.
- Wir sehen jetzt, wie sich die Anwendungsebene entwickelt, wenn neue Produkte in unseren Alltag Einzug halten. Die zunehmende Sichtbarkeit des technischen Potenzials durch die Anwendungen und die Möglichkeit, die Fähigkeiten der zugrundeliegenden Modelle zu erforschen, beflügelt die Fantasie der Erfinder und Erbauer.
- Angesichts des Einstellungsstopps und der Massenentlassungen bei großen Tech-Unternehmen sowie der Aktienoptionen, die nicht mehr im Geld sind und die Mitarbeiter/innen bis zur Unverfallbarkeit binden, wird in diesem Jahr eine noch nie dagewesene Menge an unternehmerischem Talent freigesetzt werden.
- Diese Push- und Pull-Dynamik wird dazu führen, dass eine neue Generation von Talenten die Chance erhält, bahnbrechende Technologien zu nutzen und kategorieprägende Unternehmen aufzubauen.