Laut Nvidias neuester Blog-Analyse kosten Blackwell-GPUs pro Stunde nahezu das Doppelte im Vergleich zur Hopper-Generation, senken aber die Inferenzkosten pro Token um den Faktor 35. Mit DeepSeek-R1 als Testmodell wird Blackwell (GB300 NVL72) für 2,65 US-Dollar pro GPU und Stunde angemietet, gegenüber 1,41 US-Dollar für Hopper. Gleichzeitig steigt der Single-GPU-Durchsatz von 90 auf 6.000 Tokens pro Sekunde. Dieser Zuwachs um 65x senkt die Kosten pro Million Token von 4,20 US-Dollar auf 0,12 US-Dollar.
Der Wert von 0,12 US-Dollar setzt eine vollständige Software-Optimierung voraus, einschließlich FP4-Low-Precision-Inferenz und Multi-Token Prediction (MTP). Ohne MTP erreichen die Kosten pro Million Token etwa 2,35 US-Dollar; mit aktivem MTP sinken sie auf 0,11 US-Dollar. Damit zeigt sich allein durch diese Funktion eine Optimierungswirkung von 21x.
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
Accel führt $60M Series A im Wert von $500M für den israelischen E-Commerce-KI-Startup ZyG im Wert von
Laut Calcalist hat der israelische E-Commerce-KI-Startup ZyG in einer Series-A-Runde 60 Millionen US-Dollar aufgebracht. Die Runde wurde von Accel angeführt, bei einer Bewertung von 500 Millionen US-Dollar. Die Finanzierung bringt das insgesamt von ZyG aufgebrachte Kapital auf 118 Millionen US-Dollar; beteiligt waren Lightspeed, Viola, Bessemer, Access Industries sowie der Wiz-CEO Assaf.
GateNews10M her
Chrome-Stille-Installation von 4 GB Gemini-Nano-Modell: Forscher decken eine mögliche Verletzung der EU-Datenschutzgesetze ohne Zustimmung auf
Chrome hat zwischen 20.04.2026 und 29.04.2026 ohne Zustimmung des Nutzers im Hintergrund auf dem Gerät etwa 4 GB Gemini-Nano-Modelle installiert (weights.bin, OptGuideOnDeviceModel), ohne Opt-in/Opt-out. Nach dem Löschen wird es mit Updates automatisch erneut heruntergeladen, was mehr als 1 Milliarde Nutzer betrifft. Gemini Nano ist ein LLM für das Endgerät; der AI Mode ist jedoch in Wahrheit ein Cloud-Zugang und kein lokales Modell, was leicht zu Missverständnissen über Datenschutz führen kann. Dies könnte gegen EU ePrivacy 5(3) verstoßen und mit Bußgeldern sowie Kosten für CO₂-Emissionen geahndet werden. Dagegen kann über Enterprise-Management-Tools vorgegangen werden.
ChainNewsAbmedia25M her
AMD prognostiziert einen Umsatz im zweiten Quartal von 11,2 Milliarden US-Dollar, über den Schätzungen bei steigender Nachfrage nach KI
Laut Reuters sagte Advanced Micro Devices einen Umsatz für das zweite Quartal von etwa 11,2 Milliarden US-Dollar voraus, zuzüglich oder abzüglich 300 Millionen US-Dollar, und lag damit über den Schätzungen von 10,52 Milliarden US-Dollar der Wall Street – angetrieben durch eine starke Nachfrage nach KI-Infrastruktur. Die Aktien des Chip-Herstellers stiegen nach der Bekanntgabe um 12%. Im ersten Quartal
GateNews30M her
KI treibt den Bedarf an Halbleitern: Samsung steigt um 12% und erreicht eine Marktkapitalisierung von über 1 Billion US-Dollar
Unter der von der Nachfrage nach KI-Basisinfrastruktur getriebenen Entwicklung hat Samsung seine Marktkapitalisierung auf über 1 Billion US-Dollar ausgeweitet; der Kurs ist im vergangenen Jahr deutlich gestiegen. Die Speicher-Nachfrage ist stark, die Preise für NAND/DRAM ziehen an; bis 2027 wird mit einem noch engeren Angebot-Nachfrage-Verhältnis gerechnet. Apple erwägt, bei US-amerikanischen Auftragsfertigern in Chips für den Kernbereich einzusteigen; sollte dies gelingen, würde sich die Lieferkette weiter diversifizieren. Angesichts von Kosten- und Arbeitsrisiken im Zusammenhang mit Smartphones und Displays liegt das Forward P/E bei etwa 5,3. Analysten schätzen für die nächsten 12 Monate ein Aufwärtspotenzial von rund 30%.
ChainNewsAbmedia37M her