Wie sich Hollywood KI in den 50ern vorstellte
07/05/2025Hugging Faces kostenloser KI-Agent, der (langsam) im Internet surft
08/05/2025KI-Nachrichten aktuell
Mit Rekordleistungen und großer Aufmerksamkeit ist Gemini 2.5 Pro vor Googles I/O‑Event an die Spitze der globalen KI-Ranglisten geschossen. Das erst vor wenigen Tagen veröffentlichte Kraftpaket beweist seine Überlegenheit gegenüber den Konkurrenten GPT‑5 und DeepSeek R2, insbesondere bei Benchmark-Tests in Mathematik, Naturwissenschaften und Programmierung. Mit seiner herausragenden Leistung in den GPQA- und AIME 2025-Tests definiert Googles neuestes Modell nicht nur die Grenzen der künstlichen Intelligenz neu. Die kostenlose Zugänglichkeit der Plattform macht ihre bahnbrechenden Fähigkeiten für Entwickler weltweit verfügbar.
Beeindruckende Benchmark-Testergebnisse
Googles neuestes Modell hat in wichtigen Testkategorien Spitzenpositionen erreicht und setzt neue Maßstäbe in technischen Bewertungen. Mit einem Ergebnis von 84% beim GPQA Diamond Assessment und führenden Positionen bei mathematischen Herausforderungen wie AIME 2024 (92%) und 2025 (86,7%) demonstriert das System außergewöhnliche Fähigkeiten.
Das Modell überzeugt besonders bei wissenschaftlichen Denkaufgaben und übertrifft dabei Konkurrenten wie Grok 3 Beta und o3-mini. In multimodalen Verständnistests erreichte es 81,7%, während es bei Auswertungen großer Kontexte 91,5% erzielte und damit GPT‑4.5 übertraf. Die mehrstufigen Verarbeitungsfähigkeiten des Systems ermöglichen es, komplexe Dokumente zu analysieren und anspruchsvolle Programmieraufgaben nahtlos auszuführen.
Zu den bemerkenswerten Eigenschaften gehören ein gewaltiges Kontextfenster von 1 Million Tokens und eine Ausgabegeschwindigkeit von 153,5 Tokens pro Sekunde. Obwohl das System eine höhere Latenzzeit von 38,38 Sekunden bis zum ersten Token aufweist, scheint dieser Kompromiss die Genauigkeit bei komplexen Problemlösungsszenarien zu verbessern.
Mit 3,44 Dollar pro Million Tokens behält das Modell wettbewerbsfähige Preise bei, während es überlegene Ergebnisse in verschiedenen Testkategorien liefert. Der MMLU-Score von 0,858 bestätigt zusätzlich seine fortgeschrittenen Fähigkeiten bei der Bewältigung anspruchsvoller Aufgaben.
Die einzige nennenswerte Einschränkung zeigt sich in spezifischen Software-Engineering-Benchmarks, wo Claude 3.7 einen Vorsprung behält. Dennoch etabliert Gemini 2.5 Pros konstante Leistung in mathematischen, wissenschaftlichen und kontextbezogenen Verständnistests seine Position als führende technische Errungenschaft.
Quellenangabe
- https://www.androidpolice.com/google-gemini-pro-special-edition-io-2025/
- https://www.techtarget.com/whatis/feature/Google-Gemini-25-Pro-explained-Everything-you-need-to-know
- https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2–5‑pro
- https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/
- https://www.therundown.ai/p/googles-gemini-update-climbs-the-leaderboard
- https://www.datacamp.com/blog/gemini‑2–5‑pro
- https://artificialanalysis.ai/models/gemini‑2–5‑pro
- https://www.rdworldonline.com/googles-gemini‑2–5‑pro-model-tops-lmarena-by-40-points-outperforms-competitors-in-scientific-reasoning/
- https://wandb.ai/byyoung3/Generative-AI/reports/Evaluating-the-new-Gemini‑2–5‑Pro-Experimental-model–VmlldzoxMjAyNDMyOA