Sam Altman: „Künstliche Intelligenz-Hardware ist langsam.“
01/07/2025Gemma 3n von Google hat eine KI
01/07/2025Nach Jahren, in denen Baidu sein Ernie-KI-Modell unter Verschluss gehalten hat, hat das Unternehmen beschlossen, die Türen zu öffnen und es mit allen zu teilen. Ab dem 30. Juni 2025 kann jeder kostenlos auf Ernie AI zugreifen und es nutzen. Dies markiert einen großen Wandel für den chinesischen Technologieriesen, der seine KI-Technologie früher vor der Öffentlichkeit verborgen hielt.
Warum der plötzliche Sinneswandel? Die Antwort liegt in der harten Konkurrenz. Andere Akteure in Chinas KI-Szene haben mit ihren eigenen Open-Source-Modellen für Aufsehen gesorgt. DeepSeek, ein Startup, das weltweite Aufmerksamkeit erregte, bietet leistungsstarke KI-Tools an, die sogar mit OpenAIs besten Modellen konkurrieren können. Sie haben 34% des Entwicklermarktanteils erobert und Baidus Ernie mit nur 18% hinter sich gelassen.
Die Zahlen erzählen eine schwierige Geschichte für Baidu. Ihr Ernie Bot Chatbot hat etwa 13 Millionen monatliche Nutzer, was beeindruckend klingt, bis man es mit ByteDances Duobao Chatbot mit seinen 78,6 Millionen Nutzern vergleicht. Das ist mehr als dreimal Baidus Nutzerbasis. Eindeutig musste sich etwas ändern.
Robin Li, Baidus CEO, hat lange daran geglaubt, KI-Technologie eng zu hüten. Aber selbst er konnte nicht ignorieren, was um ihn herum geschah. Open-Source-Modelle bewiesen, dass sie mit teuren, geschlossenen Systemen konkurrieren konnten. Nutzer strömten zu kostenlosen und zugänglichen Optionen und ließen Premium-Dienste hinter sich.
Der Wandel geht über das bloße Öffnen des Codes hinaus. Baidu machte seinen Ernie Bot ab dem 1. April 2025 auch völlig kostenlos. Keine Premium-Preispläne oder Abonnementgebühren mehr. Dieser Schritt zielt darauf ab, Nutzer zurückzugewinnen, die zu anderen Plattformen gewechselt sind.
DeepSeeks Erfolg erzeugte Welleneffekte in Chinas KI-Umfeld. Ihre Modelle funktionieren genauso gut wie internationale Spitzenoptionen, aber sie stehen auch vor Herausforderungen. US-Sanktionen machen es ihnen schwer, die leistungsstarken Computerchips zu bekommen, die für das Training von KI-Modellen benötigt werden. Baidu sieht dies als Gelegenheit, Boden zu gewinnen, während ihr Konkurrent mit Lieferproblemen kämpft.
Der breitere chinesische KI-Markt summt vor Aktivität. Unternehmen wie Alibaba, Tencent und neuere Akteure wie Zhipu AI und MiniMax konkurrieren alle um Aufmerksamkeit. Einige chinesische Firmen haben sogar Modelle entwickelt, die OpenAIs Benchmarks übertreffen. Baidu arbeitet auch an Ernie 5, das für Ende 2025 geplant ist.
Diese Veränderung spiegelt einen größeren Trend in der KI-Welt wider. Open-Source-Ansätze gewinnen Vertrauen und beweisen ihren Wert. Baidus Entscheidung zeigt, dass selbst etablierte Unternehmen sich anpassen müssen oder riskieren, in der sich schnell entwickelnden Umgebung der künstlichen Intelligenz zurückgelassen zu werden.
Technische Implementierungsdetails
Was sind die wichtigsten technischen Merkmale von Ernie 4.5?
Ernie 4.5 verfügt über native multimodale Fähigkeiten, die es ermöglichen, Text-, Bild-, Audio- und Videoinhalte kollaborativ zu verarbeiten. Das Modell verfügt über fortschrittliche Sprachverständnis- und Generierungsfähigkeiten sowie ein hohes kontextuelles Bewusstsein, das es ihm ermöglicht, Internet-Memes und satirische Cartoons zu verstehen. Es nutzt FlashMask Dynamic Attention Masking, um sich auf relevante Eingabedaten zu konzentrieren, und verwendet eine Heterogeneous Multimodal Mixture-of-Experts-Architektur, um verschiedene Komponenten für die Handhabung verschiedener Informationstypen zu spezialisieren.
Wie funktioniert FlashMask Dynamic Attention Masking in Ernie 4.5?
FlashMask Dynamic Attention Masking ist eine Technik, die Ernie 4.5 dabei hilft, sich auf wichtige Teile der Eingabedaten zu konzentrieren und gleichzeitig den Rechenaufwand zu reduzieren. Diese Methode maskiert oder hebt dynamisch bestimmte Teile der Eingabe hervor, wodurch das Modell die Aufmerksamkeit effizienter zuteilen kann. Durch die Konzentration der Rechenleistung auf die wichtigsten Elemente verbessert FlashMask sowohl die Leistung als auch die Recheneffizienz, wodurch das Modell kostengünstiger zu betreiben ist und gleichzeitig hochwertige Ausgaben gewährleistet werden.
Welche Entwicklungstechnologien wurden zur Erstellung von Ernie 4.5 verwendet?
Ernie 4.5 wurde unter Verwendung mehrerer fortschrittlicher Technologien entwickelt, einschließlich Supervised Fine-Tuning (SFT) zur aufgabenspezifischen Leistungsverfeinerung und Reinforcement Learning with Human Feedback zur Verbesserung des Lernens aus Nutzerinteraktionen. Der Entwicklungsprozess umfasste auch Prompt Learning für ein besseres Verständnis verschiedener Prompts, Wissensverbesserung zur Einbeziehung von Informationen aus verschiedenen Quellen und Retrieval Enhancement zur Verbesserung der Fähigkeit des Modells, wichtige Informationen für spezifische Aufgaben abzurufen.
Wie profitiert das Modell von der Heterogeneous Multimodal Mixture-of-Experts-Architektur?
Die Heterogeneous Multimodal Mixture-of-Experts-Architektur ermöglicht es Ernie 4.5, verschiedene Informationstypen effizient zu handhaben, indem verschiedene Komponenten für spezifische Aufgaben spezialisiert werden. Dieser Ansatz ermöglicht es dem Modell, Text-, Bild-, Audio- und Videoinhalte effektiver zu verarbeiten, indem verschiedene Datentypen an spezialisierte Expertenmodule weitergeleitet werden. Diese Spezialisierung verbessert die Gesamtleistung bei gleichzeitiger Aufrechterhaltung der Recheneffizienz, da sich jeder Experte auf das konzentriert, was er am besten kann, anstatt einen einheitlichen Ansatz zu verwenden.
Was macht Ernie 4.5 im Vergleich zu anderen Modellen rechnerisch effizient?
Ernie 4.5 bietet verbesserte Leistung bei niedrigeren Betriebskosten durch mehrere Effizienz-Mechanismen. Die FlashMask-Technik reduziert den Rechenaufwand, indem sie die Verarbeitung auf relevante Eingabeteile konzentriert, während die Heterogeneous Multimodal Mixture-of-Experts-Architektur die Arbeitsbelastung effizient auf spezialisierte Komponenten verteilt. Zusätzlich nutzt das Modell Kompressionstechniken wie Low-Rank Adaptation (LoRA) zur Reduzierung der Modellgröße und verwendet optimierte Trainingsmethoden einschließlich überwachtem Fine-Tuning für effiziente Verfeinerung. Dieser Effizienzvorteil ist besonders wichtig, da er die niedrigeren Betriebskosten widerspiegelt, die konkurrierende Modelle wie DeepSeek für Nutzer attraktiv gemacht haben.
Welche Modellserie beeinflusste die Entwicklung von Ernie 4.5?
Ernie 4.5 wurde auf Basis der ERNIE- und PLATO-Serien entwickelt und nutzte deren Stärken in der Dialoggenerierung und Wissenseinbindung. Diese grundlegenden Modellserien lieferten die architektonischen Innovationen und Fähigkeiten, die in Ernie 4.5 erweitert und ausgebaut wurden. Das Entwicklungsteam baute auf dem bewährten Erfolg dieser früheren Modelle auf und integrierte neue multimodale Fähigkeiten und fortschrittliche Techniken wie FlashMask und die Mixture-of-Experts-Architektur.
Wie handhabt Ernie 4.5 die gemeinsame Modellierung mehrerer Datentypen?
Ernie 4.5 ermöglicht kollaborative Optimierung über verschiedene Datenformen hinweg durch seine gemeinsamen Modellierungsfähigkeiten. Das bedeutet, dass das Modell gleichzeitig Beziehungen zwischen Text-, Bild-, Audio- und Videoinhalten innerhalb eines einzigen Frameworks verarbeiten und verstehen kann. Der gemeinsame Modellierungsansatz ermöglicht ein anspruchsvolleres Verständnis komplexer, multimodaler Eingaben, bei denen sich verschiedene Datentypen ergänzen und gegenseitig informieren, was zu genaueren und angemessen kontextuellen Antworten führt.
Welche Plattformen unterstützen die Integration von Ernie 4.5?
Ernie 4.5 ist zur Integration auf mehreren großen KI-Plattformen verfügbar, einschließlich GitHub, Hugging Face und Baidu AI Studio. Diese Plattformen bieten Entwicklern Zugang zum Modell für verschiedene Anwendungen und Anwendungsfälle. Die Verfügbarkeit auf mehreren Plattformen gewährleistet eine breitere Zugänglichkeit und ermöglicht es Entwicklern, die Umgebung zu wählen, die am besten zu ihren spezifischen Bedürfnissen und Workflow-Präferenzen für die Implementierung von Ernie 4.5 in ihren Projekten passt.
Wann wird Ernie 4.5 Open-Source und was bedeutet das für Entwickler?
Ernie 4.5 wird ab dem 30. Juni 2025 als Open-Source-Modell verfügbar sein, was breiteren Entwicklerzugang und Innovationsmöglichkeiten ermöglicht. Diese Open-Source-Veröffentlichung bedeutet, dass Entwickler vollen Zugang zum Code, zur Architektur und zu den Trainingsmethoden des Modells haben werden, was Anpassung, Modifikation und Integration in verschiedene Anwendungen ermöglicht. Die Open-Source-Verfügbarkeit soll Innovationen beschleunigen und die Anwendungen des Modells in verschiedenen Branchen und Anwendungsfällen erweitern.
Welche Kompressionstechniken verwendet Ernie 4.5 zur Verbesserung der Effizienz?
Ernie 4.5 nutzt Modellkompressionstechniken, insbesondere Low-Rank Adaptation (LoRA), um die Modellgröße zu reduzieren und gleichzeitig die Leistungsqualität beizubehalten. LoRA ist eine parametereffiziente Fine-Tuning-Methode, die die Anzahl der trainierbaren Parameter erheblich reduziert und das Modell effizienter für Deployment und Betrieb macht. Diese Kompressionsfähigkeiten sind für das Modelltraining verfügbar und helfen Organisationen dabei, das Modell mit geringeren Rechenanforderungen und reduzierten Betriebskosten zu implementieren.
Auswirkungen des Marktwettbewerbs
Als Baidu entschied, sein Ernie AI-Modell als Open Source zu veröffentlichen, sandte dies Schockwellen durch die gesamte Tech-Industrie. Dieser mutige Schritt setzt amerikanische Giganten wie OpenAI unter enormen Druck, die hohe Gebühren für ihre geschlossenen Systeme verlangen. Indem Baidu Ernie kostenlos und offen macht, stellt es den ganzen „Pay-to-Play“-Ansatz in Frage, der die KI-Welt dominiert.
Der Wandel schafft aufregende Möglichkeiten für kleinere Akteure und Start-ups. Sie können nun auf mächtige KI-Tools zugreifen, ohne ihr Budget zu sprengen. Dies ebnet das Spielfeld auf eine Weise, wie wir es zuvor nicht gesehen haben.
Baidus Strategie intensiviert auch die Konkurrenz im eigenen Land. Chinesische Rivalen wie Alibaba und Tencent müssen nun ihre eigenen Ansätze überdenken. Da Ernie derzeit bei den Nutzerzahlen hinter der Konkurrenz zurückliegt, könnte dieser Open-Source-Coup genau das sein, was Baidu braucht, um aufzuholen. Der Schritt kommt, während Baidus AI Cloud-Umsätze starkes Wachstum gezeigt haben, mit einem Anstieg von 42% im Jahresvergleich und einem Anteil von nun 26% an den Baidu Core-Umsätzen.
References
- https://www.techi.com/baidu-open-sources-ernie-ai-model/
- https://siliconangle.com/2025/06/29/chinas-baidu-declares-war-openai-others-open-sourcing-ernie-chatbot/
- https://economictimes.com/tech/artificial-intelligence/baidu-to-make-ernie-ai-model-open-source-from-end-of-june/articleshow/118231667.cms
- https://en.wikipedia.org/wiki/Ernie_Bot
- https://www.techtarget.com/searchenterpriseai/news/366626838/Baidu-makes-foundation-model-Ernie-45-open-source
- https://research.baidu.com/Blog/index-view?id=183
- https://technologymagazine.com/articles/baidus-ernie-4-5-x1-redefining-ai-with-multimodal-power
- https://yiyan.baidu.com/blog/posts/ernie4.5/
- https://www.nasdaq.com/articles/baidus-ai-push-gains-momentum-ernie-enough-power-ambitions
- https://www.indiatoday.in/technology/news/story/after-deepseek-china-baidu-to-open-source-its-ernie-ai-chatbot-2748296-2025-06-30