Google's Gemini 3 Deep Think großes Upgrade: Schluss mit Opus 4.6, GPT-5.2 in Sachen Denkfähigkeit, um die „intelligenteste KI für wissenschaftliche Forschung“ zu werden

動區BlockTempo

2026-02-13 03:05:30

BTC-2,01%

Google veröffentlicht bedeutendes Update für Gemini 3 Deep Think, erreicht im ARC-AGI-2-Test 84,6 % und übertrifft damit deutlich Claude Opus 4.6 (68,8 %) und GPT-5.2 (52,9 %), während es gleichzeitig den „Legendären Meister“-Status bei Codeforces erreicht.
（Vorgeschichte: Die Lernmodi von ChatGPT: Das Abendrot der Nachhilfe oder der Morgengrauen einer goldenen Bildungszeit?）
（Hintergrund: Google bringt offiziell „Gemini 3“ heraus! Was sind die Highlights, um den weltweit klügsten KI-Modell an die Spitze zu setzen?）

Inhaltsverzeichnis

Nicht nur Prüfungen bestehen, sondern auch menschliche Fehler erkennen
Veränderungen im Marktanteil
Auswirkungen auf die Kryptoindustrie
Der wissenschaftliche Wettstreit hat gerade erst begonnen

Google hat heute (13.) ein bedeutendes Upgrade für Gemini 3 Deep Think veröffentlicht. Im ARC-AGI-2-Test, einem speziell entwickelten logischen Test, der darauf abzielt, KI-Modelle vor das Problem der Hintertür-Tests zu stellen (bei dem es nicht um Wissen, sondern um das Erkennen von Regeln anhand mehrerer Beispiele geht), erreichte Gemini 3 Deep Think 84,6 %.

Zum Vergleich: Claude Opus 4.6 (Thinking Max-Modus) erzielte 68,8 %, GPT-5.2 (Thinking xhigh-Modus) 52,9 %, während der menschliche Durchschnitt bei etwa 60 % liegt.

Noch beeindruckender ist, dass Deep Think auf der ursprünglichen Version ARC-AGI-1 eine Punktzahl von 96 % erreichte, was im Grunde die Grenze dieses als „einer der schwierigsten KI-Tests“ geltenden Benchmark-Tests darstellt.

Derzeit ist Deep Think für Google AI Ultra-Abonnenten zugänglich, die API befindet sich im frühen Zugang für Unternehmen.

Nicht nur Prüfungen bestehen, sondern auch menschliche Fehler erkennen

Neben den Testergebnissen erwähnte Google in der Ankündigung ein Detail: Deep Think konnte bei der Überprüfung eines von menschlichen Experten begutachteten mathematischen Papiers eine zuvor von allen Gutachtern übersehene logische Schwachstelle aufdecken. Dieses Papier wurde von Mathematikern der Rutgers University bestätigt.

Die Bedeutung dieses Beispiels liegt darin, dass es nicht nur um die Leistung im Standardtest geht, sondern um die Fähigkeit, in echten, offenen wissenschaftlichen Szenarien Mehrwert zu schaffen. Peer-Review ist das zentrale Qualitätssicherungssystem in der Wissenschaft. Wenn KI in diesem Bereich zuverlässig wertvolle Unterstützung leisten kann, wird die Beschleunigung der wissenschaftlichen Forschung weit über die bloßen Testergebnisse hinausgehen.

Deep Think erreichte außerdem bei den schriftlichen Prüfungen der Internationalen Physik- und Chemie-Olympiaden 2025 Goldmedaillen, und im Codeforces-Elo-Ranking liegt es bei 3455 Punkten, was dem „Legendären Meister“-Level entspricht – nur sehr wenige menschliche Programmierer weltweit erreichen dieses Niveau.

Beim „Letzten Test der Menschheit“ (Humanity’s Last Exam), einem von Experten verschiedener Fachrichtungen entwickelten Benchmark, der absichtlich schwer für KI gestaltet wurde, erzielte Deep Think 48,4 % (ohne Hilfsmittel) und stellte damit einen neuen Rekord auf.

Veränderungen im Marktanteil

Der technologische Wettkampf der drei KI-Giganten verändert die Marktlandschaft. Der Marktanteil von ChatGPT ist von seinem Höchststand bei 87 % auf etwa 68 % gefallen, während Gemini von unter 5 % auf über 18 % gestiegen ist, und Anthropic’s Claude gewinnt kontinuierlich im Unternehmenssegment.

Google’s einzigartiger Vorteil in diesem Wettbewerb ist die Verbreitungskraft. Gemini ist in Android, Chrome, Google Workspace und der Suchmaschine integriert, was bedeutet, dass Google selbst bei gleichwertiger Modellfähigkeit durch seine Kanäle mehr Nutzer gewinnen kann.

Doch die Verteilungsfähigkeit ist eine zweischneidige Sache. Wenn die Nutzererfahrung von Gemini nicht gut ist, könnte Google schneller als alle Wettbewerber das Vertrauen der Nutzer verlieren, da diese „passiv konsumieren“ und nicht „aktiv wählen“. OpenAI-Nutzer sind zahlende Nutzer, mit höherer Toleranz und Bindung.

Auswirkungen auf die Kryptoindustrie

Jede Aufrüstung im KI-Wettrennen erhöht die Nachfrage nach Recheninfrastruktur. Die Kosten für das Training eines hochentwickelten Modells sind von mehreren Hundert Millionen Dollar im Jahr 2024 auf mehrere Milliarden Dollar im Jahr 2026 gestiegen. Das beeinflusst direkt zwei Dinge:

Erstens: Die Transformation der Bitcoin-Miner. Wenn die Gewinnmargen durch sinkende Mining-Renditen (JPM schätzt diese Woche die BTC-Produktionkosten auf 77.000 USD, während der Kurs bei etwa 66.000 USD liegt) gedrückt werden, beschleunigen Miner mit großen Rechenzentren den Übergang zu KI-Rechenleistungen.

Große Mining-Unternehmen „steigen nicht aus“, sondern „wechseln den Bereich“: vom Bitcoin-Mining zu Verträgen für KI-Rechenkapazitäten.

Zweitens: Die Narrative um KI-Token. Wenn Google, OpenAI oder Anthropic bedeutende Upgrades veröffentlichen, kommt es oft zu kurzfristigen Spekulationen bei auf KI bezogenen Tokens (wie dezentralisierte Rechenprotokolle).

Doch die fundamentalen Probleme dieser Tokens bleiben bestehen: Dezentrale Rechenleistung ist in Latenz und Durchsatz noch weit von den Anforderungen des Unternehmens-KI-Trainings entfernt. Die Erzählung kann schnell laufen, die Infrastruktur holt mit der Geschwindigkeit der Erzählung jedoch nicht Schritt.

Der wissenschaftliche Wettstreit hat gerade erst begonnen

Das Upgrade von Deep Think bringt Google wieder an die Spitze des KI-Wettbewerbs, zumindest im Bereich der Logik und Wissenschaft. Doch bei genauer Betrachtung der Ankündigung fällt eine subtile Verschiebung auf: Es wird nicht mehr primär auf „den klügsten allgemeinen KI“ gesetzt, sondern wiederholt der Fokus auf „für die Wissenschaft gemacht“.

Wenn die Benchmarks für allgemeine KI immer dichter werden und Differenzierung zunehmend schwerfällt, ist die Aussage „Mein KI kann dir bei wissenschaftlicher Forschung helfen“ eine überzeugendere Wert proposition als „Mein KI erzielt die höchsten Punktzahlen“. Wenn Deep Think wirklich zuverlässig Peer-Reviews unterstützt, die Medikamentenentwicklung beschleunigt oder in physikalischen Simulationen Lösungen findet, die Menschen übersehen haben, ist das bedeutungsvoller als jede Rangliste.

Das Problem ist: Der Sprung von „hohe Punktzahlen in Benchmarks“ zu „verlässliche Unterstützung in echten wissenschaftlichen Szenarien“ ist möglicherweise größer, als Google andeutet. Benchmarks haben klare Antworten, Wissenschaft nicht.

Original anzeigen

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

ETH kurzfristig um 0,99 % gestiegen: Strukturelle Erholung durch Zuflüsse von Riesenwalen und externe Kapitalbewegungen

ethereum news Market Analysis Price Volatility Monetary Policy Global Markets On-Chain Data

Im Zeitraum vom 06.03.2026 01:30 bis 01:45 (UTC) erzielte ETH innerhalb von 15 Minuten eine Rendite von +0,99 %, mit einem Preisspann von 2065,42 bis 2088,57 USDT und einer Amplitude von 1,12 %. Die Schwankungen in diesem Zeitraum waren deutlich höher als der tägliche Durchschnitt, was die kurzfristige Marktbeobachtung erhöhte. Die Liquidität war gering, und einige große Transaktionen trieben das Handelsvolumen nach oben. Die Haupttreiber dieser Abweichung waren die konzentrierten Zuflüsse von Großinvestoren in dezentrale Börsen sowie große Überweisungen. On-Chain-Überwachung ergab mehrere große ETH-Zuflüsse in DeFi-Protokolle und Handelsplattformen, was effektiv den Handel antrieb.

GateNews13M her

Kapitalzufluss in Bitcoin-ETFs: Nach dem Konflikt zwischen den USA und dem Iran ersetzt BTC Gold als sicheren Hafen?

bitcoin news Price Volatility Capital Flow Global Markets

Bitcoin-Spot-ETF zieht nach den Konflikten zwischen den USA und Iran weiterhin Kapital an. Bloomberg-Analysten weisen darauf hin, dass Bitcoin seit dem Vorfall um 12 % gestiegen ist, während Gold gefallen ist, was die Frage nach seiner Rolle als sicherer Hafen aufwirft. Die Analysten betonen, dass kurzfristige Preisschwankungen nicht überinterpretiert werden sollten, da sie möglicherweise die Marktstimmung und Gewinnmitnahmen widerspiegeln.

ChainNewsAbmedia16M her

Tether baut globale Zahlungslandschaft auf, investiert in Axiym, um 140 Länder-Abwicklungskorridore zu verbinden

Partnerships & Ecosystem Global Markets

Tether tätigt eine strategische Investition in das Fintech-Unternehmen Axiym mit dem Ziel, USDT in das regulierte Zahlungssystem von Axiym zu integrieren und den grenzüberschreitenden Zahlungsprozess zu verbessern. Axiym verfügt über eine dezentrale Abrechnungsinfrastruktur in 140 Ländern, die die Kapitalflüsse effizienter gestaltet und das Zahlungserlebnis optimiert. Diese Investition markiert den Wandel von Tether vom reinen Stablecoin-Emittenten zu einem Akteur im breiteren Zahlungsinfrastrukturbereich und fördert die globale Finanzbeteiligung.

MarketWhisper25M her

WAR (WAR) ist in den letzten 24 Stunden um 61,98 % gestiegen

solana news Daily Crypto News Price Volatility Global Markets Geopolitics

Gate News Bot Nachrichten, 6. März, laut CoinMarketCap-Kurs, beträgt der aktuelle Kurs von WAR (WAR) 0,04 USD, ein Anstieg von 61,98 % innerhalb von 24 Stunden, mit einem Höchststand von 0,05 USD und einem Tiefststand von 0,01 USD. Das 24-Stunden-Handelsvolumen beträgt 21,6 Millionen USD. Die aktuelle Marktkapitalisierung liegt bei etwa 37,6 Millionen USD, ein Anstieg von 1,44 Millionen USD im Vergleich zum Vortag. WAR ist ein community-gesteuertes Kryptowährungsprojekt, das sich zum Ziel gesetzt hat, eine aktive Handels- und Community-Engagement-Plattform im Solana-Ökosystem aufzubauen. ## Wichtige Neuigkeiten zu WAR in letzter Zeit: 1️⃣ **Steigende Popularität von Prognosemärkten und Handelsaktivitäten** Geopolitische Ereignisse haben in Prognosemärkten erhebliches Interesse geweckt, was zu einem erheblichen Zufluss von Mitteln und Teilnehmern in die entsprechenden Handelsbereiche geführt hat. Diese Marktaktivität ist

GateNews36M her

Die Federal Reserve erklärt „Technologie-Neutralität“: Tokenisierte Wertpapiere und Kapitalregeln gleichen traditionellen Wertpapieren

Project Progress Monetary Policy Global Markets

Die Federal Reserve veröffentlicht Richtlinien, die vorschreiben, dass bei der Berechnung der aufsichtsrechtlichen Kapitalausstattung tokenisierte Wertpapiere gleich behandelt werden sollen wie traditionelle Wertpapiere, wobei der Grundsatz der Technologieneutralität betont wird. Es ist keine spezielle Gesetzgebung erforderlich; Banken können im Rahmen des bestehenden Rahmens operieren. Dieser Schritt bietet eine stabile politische Grundlage für tokenisierte Geschäfte, fördert das Marktwachstum und senkt die Compliance-Kosten.

MarketWhisper54M her

Warum fällt Bitcoin heute? Die USA kündigen einen Bodeneinsatz im Iran an, Trump fordert die Führung des nächsten obersten Führers.

Market Analysis Global Markets Geopolitics

Der Bitcoin-Preis schwankt aufgrund der Verschärfung der geopolitischen Lage und fiel am 6. März von 72.000 USD auf 70.000 USD. Trumps harte Rhetorik zum Iran, die Weigerung Irans, eine Feuerpause einzulegen, und die Ankündigung der verstärkten US-Militärschläge haben die Flucht in sichere Anlagen erhöht. Die Marktstimmung ist uneinheitlich: Einige prognostizieren, dass Bitcoin 80.000 USD erreichen wird, während andere Analysten skeptisch gegenüber einer Erholung sind. 72.000 USD ist eine wichtige technische Marke; ein Scheitern beim Durchbruch könnte zu einem Rückgang auf 64.000 USD führen.

MarketWhisper1Std her

Kommentieren

0/400

Keine Kommentare