
Amazons KI-Funktion personalisiert das Einkaufen
31/03/2025
Repli-CEO Amjad Masad : KI wird Programmierer ersetzen
31/03/2025Die heißesten KI-Modelle, was sie tun und wie man sie einsetzt.
KI-Modelle werden in einem schwindelerregenden Tempo entwickelt, von Big-Tech-Unternehmen wie Google bis hin zu Start-ups wie OpenAI und Anthropic. Den Überblick über die neuesten Modelle zu behalten, kann überwältigend sein.
Zur Verwirrung trägt bei, dass KI-Modelle oft auf der Grundlage von Branchen-Benchmarks beworben werden. Diese technischen Kennzahlen sagen jedoch oft wenig darüber aus, wie sie von echten Menschen und Unternehmen tatsächlich genutzt werden.
Um den Überblick zu behalten, hat TechCrunch eine Übersicht der fortschrittlichsten KI-Modelle zusammengestellt, die seit 2024 veröffentlicht wurden, mit Details darüber, wie man sie verwendet und wofür sie am besten geeignet sind. Wir werden diese Liste auch mit den neuesten Veröffentlichungen aktualisieren.
Es gibt buchstäblich über eine Million KI-Modelle : Hugging Face zum Beispiel beherbergt über 1,4 Millionen. Es kann also sein, dass in dieser Liste einige Modelle fehlen, die auf die eine oder andere Weise besser funktionieren.

KI-Modelle, die 2025 veröffentlicht wurden
Google Gemini 2.5
Gemini 2.5 Pro Experimental, ein Argumentationsmodell, ist laut Google hervorragend für die Erstellung von Webanwendungen und Code-Agenten geeignet. Es schneidet jedoch bei einem beliebten Codierungs-Benchmark im Vergleich zu Claude Sonnet 3.7 schlechter ab. Für das Modell ist ein monatliches Gemini Advanced-Abonnement für 20 US-Dollar erforderlich.
ChatGPT-4o-Bildgenerator
OpenAI hat sein bestehendes GPT-4o-Modell aktualisiert, um Bilder und nicht nur Text zu generieren. Das aufgemotzte Modell wurde schnell populär, weil es Bilder in Anime im Studio-Ghibli-Stil verwandeln kann, trotz offensichtlicher Bedenken hinsichtlich des Urheberrechts. Für den Zugriff auf GPT-4o ist mindestens ein ChatGPT-Plus-Abonnement für 20 US-Dollar pro Monat erforderlich.
Stability AI’s Stable Virtual Camera
Das Start-up-Unternehmen für Bilderzeugung Stability AI hat ein Modell auf den Markt gebracht, das nach Angaben des Unternehmens 3D-Szenen und Kamerawinkel aus einem einzigen 2D-Bild erzeugen kann. Allerdings hat es immer noch Probleme mit Szenen, die komplexere Elemente wie Menschen und fließendes Wasser enthalten. Das Modell ist für nicht-kommerzielle Forschungszwecke auf HuggingFace verfügbar.
Cohere’s Aya Vision
Cohere hat ein multimodales Modell namens Aya Vision veröffentlicht, das nach eigenen Angaben in seiner Klasse führend ist, wenn es darum geht, Bilder zu beschriften und Fragen zu Fotos zu beantworten. Im Gegensatz zu anderen Modellen ist es auch in anderen Sprachen als Englisch hervorragend, so Cohere. Es ist kostenlos auf WhatsApp verfügbar.
OpenAI’s GPT 4.5 „Orion“
OpenAI bezeichnet Orion als ihr bisher größtes Modell und wirbt mit seinem ausgeprägten „Weltwissen“ und seiner „emotionalen Intelligenz“. Im Vergleich zu neueren Argumentationsmodellen schneidet es jedoch bei bestimmten Benchmarks schlechter ab. Orion steht Abonnenten des 200-Dollar-Pro-Monat-Tarifs von OpenAI zur Verfügung.
Claude Sonnet 3.7
Anthropic zufolge handelt es sich hierbei um das erste „hybride“ Denkmodell der Branche, da es sowohl schnelle Antworten geben als auch bei Bedarf wirklich gründlich nachdenken kann. Außerdem können Benutzer laut Anthropic festlegen, wie lange das Modell nachdenken darf. Sonnet 3.7 steht allen Claude-Nutzern zur Verfügung, aber intensivere Nutzer benötigen einen Pro-Plan für 20 $ pro Monat.
xAI’s Grok 3
Grok 3 ist das neueste Flaggschiff-Modell des von Elon Musk gegründeten Start-ups xAI. Es soll angeblich andere führende Modelle in den Bereichen Mathematik, Naturwissenschaften und Programmierung übertreffen. Das Modell erfordert X Premium (50 US-Dollar pro Monat). Nachdem eine Studie festgestellt hatte, dass Grok 2 nach links tendierte, versprach Musk, Grok „politisch neutraler“ zu machen, aber es ist noch nicht klar, ob dies erreicht wurde.
OpenAI o3-mini
Dies ist das neueste Argumentationsmodell von OpenAI und ist für MINT-bezogene Aufgaben wie Programmierung, Mathematik und Naturwissenschaften optimiert. Es ist nicht das leistungsstärkste Modell von OpenAI, aber da es kleiner ist, sagt das Unternehmen, dass es deutlich kostengünstiger ist. Es ist kostenlos verfügbar, erfordert aber ein Abonnement für Vielnutzer.
OpenAI Deep Research
OpenAI’s Deep Research wurde für die gründliche Recherche zu einem Thema mit klaren Zitaten entwickelt. Dieser Dienst ist nur mit dem 200-Dollar-Pro-Monat-Pro-Abonnement von ChatGPT verfügbar. OpenAI empfiehlt es für alles von der Wissenschaft bis zur Einkaufsrecherche, aber Vorsicht : Halluzinationen bleiben ein Problem für KI.
Mistral Le Chat
Mistral hat App-Versionen von Le Chat, einem multimodalen persönlichen KI-Assistenten, auf den Markt gebracht. Mistral behauptet, dass Le Chat schneller reagiert als jeder andere Chatbot. Es gibt auch eine kostenpflichtige Version mit aktuellem Journalismus von der AFP. Tests von Le Monde fanden die Leistung von Le Chat beeindruckend, obwohl er mehr Fehler machte als ChatGPT.
OpenAI Operator
OpenAI’s Operator soll ein persönlicher Praktikant sein, der selbstständig Dinge erledigen kann, wie z. B. beim Einkauf von Lebensmitteln helfen. Dafür ist ein ChatGPT Pro-Abonnement für 200 $ pro Monat erforderlich. KI-Agenten sind vielversprechend, aber noch experimentell : Ein Rezensent der Washington Post berichtet, dass Operator eigenständig ein Dutzend Eier für 31 $ bestellt und mit der Kreditkarte des Rezensenten bezahlt hat.
Google Gemini 2.0 Pro Experimental
Das lang erwartete Flaggschiffmodell von Google Gemini soll sich durch seine Fähigkeiten im Bereich Codierung und Verständnis von Allgemeinwissen auszeichnen. Es verfügt außerdem über ein superlanges Kontextfenster mit 2 Millionen Token, das Nutzern hilft, die große Textmengen schnell verarbeiten müssen. Der Dienst erfordert (mindestens) ein Google One AI Premium-Abonnement für 19,99 $ pro Monat.
KI-Modelle, die 2024 veröffentlicht wurden
DeepSeek R1
Dieses chinesische KI-Modell eroberte das Silicon Valley im Sturm. DeepSeek R1 schneidet bei der Codierung und Mathematik gut ab, und da es sich um Open Source handelt, kann es jeder lokal ausführen. Außerdem ist es kostenlos. Allerdings integriert R1 die Zensur der chinesischen Regierung und sieht sich mit zunehmenden Verboten konfrontiert, weil es möglicherweise Benutzerdaten nach China zurücksendet.
Gemini Deep Research
Deep Research fasst die Suchergebnisse von Google in einem einfachen und vielzitierten Dokument zusammen. Der Dienst ist für Studierende und alle anderen, die eine schnelle Zusammenfassung für ihre Recherche benötigen, hilfreich. Die Qualität ist jedoch bei Weitem nicht so gut wie bei einem tatsächlichen, von Experten begutachteten Dokument. Für Deep Research ist ein Google One AI Premium-Abonnement für 19,99 $ erforderlich.
Meta Llama 3.3 70B
Dies ist die neueste und fortschrittlichste Version der Open-Source-Llama-KI-Modelle von Meta. Meta hat diese Version als die bisher günstigste und effizienteste angepriesen, insbesondere für Mathematik, Allgemeinwissen und das Befolgen von Anweisungen. Sie ist kostenlos und Open Source.
OpenAI Sora
Sora ist ein Modell, das realistische Videos auf der Grundlage von Text erstellt. Es kann zwar ganze Szenen statt nur Clips generieren, aber OpenAI gibt zu, dass es oft „unrealistische Physik“ erzeugt. Es ist derzeit nur in kostenpflichtigen Versionen von ChatGPT verfügbar, beginnend mit Plus, das 20 Dollar pro Monat kostet.
Alibaba Qwen QwQ-32B-Preview
Dieses Modell ist eines der wenigen, das in bestimmten Branchen-Benchmarks mit dem o1 von OpenAI konkurrieren kann und in Mathematik und Programmierung hervorragend ist. Ironischerweise hat es für ein „Reasoning-Modell“ „Raum für Verbesserungen beim logischen Denken“, sagt Alibaba. Es enthält auch die Zensur der chinesischen Regierung, wie TechCrunch-Tests zeigen. Es ist kostenlos und Open Source.
Anthropic’s Computer Use
Claude’s Computer Use soll die Kontrolle über deinen Computer übernehmen, um Aufgaben wie das Programmieren oder das Buchen eines Flugtickets zu erledigen, und ist damit ein Vorgänger von OpenAI’s Operator. Computer Use befindet sich jedoch noch in der Beta-Phase. Die Preisgestaltung erfolgt über API : 0,80 $ pro Million Eingabe-Token und 4 $ pro Million Ausgabe-Token.
xAI’s Grok 2
Elon Musks KI-Unternehmen xAI hat eine verbesserte Version seines Flaggschiff-Chatbots Grok 2 auf den Markt gebracht, der nach eigenen Angaben „dreimal schneller“ ist. Nutzer der kostenlosen Version können Grok alle zwei Stunden für 10 Fragen verwenden, während Abonnenten der X‑Pläne Premium und Premium+ höhere Nutzungsbeschränkungen genießen. xAI hat außerdem einen Bildgenerator namens Aurora auf den Markt gebracht, der hochgradig fotorealistische Bilder erzeugt, darunter auch einige grafische oder gewalttätige Inhalte.
OpenAI o1
OpenAI’s o1-Familie soll bessere Antworten liefern, indem sie Antworten durch eine versteckte Argumentationsfunktion „durchdenkt“. Das Modell ist laut OpenAI hervorragend in den Bereichen Kodierung, Mathematik und Sicherheit, hat aber Probleme, wenn es darum geht, Menschen zu täuschen. Für die Nutzung von o1 ist ein Abonnement von ChatGPT Plus erforderlich, das 20 US-Dollar pro Monat kostet.
Anthropic’s Claude Sonnet 3.5
Claude Sonnet 3.5 ist ein Modell, das Anthropic als das beste seiner Klasse bezeichnet. Es ist für seine Programmierfähigkeiten bekannt und gilt als Chatbot der Wahl für Tech-Insider.Das Modell kann kostenlos auf Claude aufgerufen werden, obwohl Vielnutzer ein Pro-Abonnement für 20 $ pro Monat benötigen. Es kann zwar Bilder verstehen, aber nicht selbst erstellen.
OpenAI GPT 4o-mini
OpenAI hat GPT 4o-mini als sein bisher erschwinglichstes und schnellstes Modell angepriesen, dank seiner geringen Größe. Es soll eine breite Palette von Aufgaben ermöglichen, wie z. B. die Unterstützung von Chatbots im Kundenservice. Das Modell ist auf der kostenlosen Stufe von ChatGPT verfügbar. Es eignet sich besser für einfache Aufgaben mit hohem Volumen als für komplexere.
Cohere Command R+
Das Command R+ Modell von Cohere eignet sich hervorragend für komplexe RAG-Anwendungen (Retrieval-Augmented Generation) für Unternehmen. Das bedeutet, dass es bestimmte Informationen sehr gut finden und zitieren kann. (Der Erfinder von RAG arbeitet tatsächlich bei Cohere.) Dennoch löst RAG das Halluzinationsproblem der KI nicht vollständig.