Gate News Mitteilung, 24. April — OpenAI-Ingenieur Clive Chan hat detaillierte Einwände gegen das Kapitel mit den Hardware-Empfehlungen im technischen V4-Bericht erhoben und es im Vergleich zur vielgepriesenen V3-Version als “überraschend mittelmäßig und fehleranfällig” bezeichnet. Die Hardware-Anleitung von V3, die Q&A-Sessions umfasste, die zum beliebtesten Diskussionsthema auf der ISCA-Fachkonferenz wurden, bot spezifische Empfehlungen, die mit den Industriestandards für Interconnects übereinstimmen. V4 hingegen ist weitaus unbestimmter.

Chan stellte systematisch drei zentrale Empfehlungen infrage. Zum Stromverbrauch schlägt der Bericht vor, dass Software-Optimierungen es ermöglichen, dass Chips Rechnen, Speicher und Kommunikation gleichzeitig in voller Kapazität betreiben, und empfiehlt, dass Chiphersteller zusätzlichen Strom-Headroom einplanen. Chan argumentiert, dass das kontraproduktiv ist: Die gesamte Chip-Leistung ist durch physikalische Prozessgrenzen begrenzt, sodass das Zurückhalten von mehr Leistungsreserve nur die Betriebsfrequenz verringert und letztlich die Rechenleistung senkt. In Bezug auf den GPU-zu-GPU-Datentransfer befürwortet der Bericht ein Pull-Modell — bei dem GPUs Daten aktiv abrufen — statt eines Push-Modells und verweist auf den hohen Benachrichtigungsaufwand bei Push-Operationen. Chan bestreitet dies und führt aus, dass Pull tatsächlich langsamer sei und dass verbesserte Fähigkeiten der Netzwerkadapter vorzuziehen wären. Allerdings könnten sich die beiden über unterschiedliche Ebenen des Problems unterhalten: Der Bericht behandelt den Overhead des Benachrichtigungsmechanismus, während Chan sich auf die Übertragungsverzögerung selbst bezieht.

Bei Aktivierungsfunktionen empfiehlt der Bericht, SwiGLU durch einfachere Funktionen zu ersetzen, um die Rechenlast zu reduzieren. Chan sieht darin keinen Nutzen und weist darauf hin, dass Sonic MoE bereits mit SwiGLU die optimale Leistung gezeigt hat. Chan vermutet, dass DeepSeek diesen Abschnitt “absichtlich abgeschwächt” haben könnte.

View Source

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Indische Cybersicherheitsunternehmen nutzen KI, um das Testen von Schwachstellen auf Stunden zu verkürzen

AI Agent AI Industry News

Indische Cybersicherheitsfirmen einschließlich Indusface und Astra Security setzen KI-Agenten, die auf großen Sprachmodellen basieren, ein, um Software-Schwachstellentests von Tagen oder Wochen auf Stunden zu beschleunigen, laut The Economic Times. Der Wandel spiegelt die zunehmende Geschwindigkeit der Angreifer und die wachsende Fähigkeit von KI-Tools wider

CryptoFrontier2M her

KI-Wirrwarr entkräften! BlackRocks CEO: Der Mangel an Rechenleistung wird einen „Rechenleistungs-Futures-Markt“ hervorbringen

Commodities AI Industry News

Der weltweite Bedarf an KI und Rechenleistung steigt rasant. BlackRock-CEO Fink weist eine KI-Blase zurück und sagt, die Knappheit an Rechenleistung werde eine neue Anlageklasse namens „Rechenleistungs-Futures“ hervorbringen. Um dem Trend gerecht zu werden, investiert BlackRock gemeinsam mit Microsoft, Nvidia und MGX in die Errichtung von Rechenzentren und Energieinfrastruktur in Höhe von mehreren Dutzend Milliarden US-Dollar. GIP übernimmt Aligned Data Centers für rund 40 Milliarden US-Dollar und geht zudem mit 10,7 Milliarden US-Dollar zusammen mit EQT auf die Übernahme von AES. Fink und andere wie Brookfield sind der Ansicht, dass dies eine langfristig solide Möglichkeit für Zinseszins-Strategien ist; die Rendite könne sich über Jahrzehnte nachhaltig fortsetzen.

ChainNewsAbmedia10M her

Tether-CEO kündigt einen Durchbruch in der KI-Forschung an, der diese Woche bevorsteht

USDT news Project Progress AI Industry News

Laut Cointelegraph kündigte Tethers Chief Executive Officer Paolo Ardoino am 6. Mai an, dass das KI-Forschungsteam des Unternehmens diese Woche noch einen weiteren Durchbruch bei lokaler KI veröffentlichen wird.

GateNews10M her

Anthropic bringt 10 Finanz-KI-Agenten heraus und integriert sie, um Finanzaufgaben mit Microsoft 365 problemlos zu erledigen

AI Agent AI Industry News

Anthropic bringt 10 Vorlagen für Finanz-KI-Agenten auf den Markt, die Daten-Partner wie Microsoft 365, Moody’s, D&B und weitere integrieren und als Plugin oder für automatische Planung verwendet werden können. Die Vorlagen werden in zwei Kategorien unterteilt: Forschung/Kundenbetreuung und Finanz-Workflows. Sie decken u. a. Investment Research, Finanzmodelle, KYC ab und beinhalten Moody’s-Ratings. Claude Opus 4.7 belegt bei Benchmarks für Finanzagenten den ersten Platz und zeigt, dass Fachkräfte im Finanzsektor und die regulatorische Landschaft davon beeinflusst werden könnten.

ChainNewsAbmedia14M her

Der CEO von Xbox beendet die Entwicklung des KI-Copilots für die Konsole und stellt die mobilen Dienste schrittweise ein

AI Industry News

Der Xbox-CEO Asha Sharma gab am 6. Mai auf der X-Plattform bekannt, dass Xbox die Entwicklung von AI Copilot auf der Konsole einstellen und den Copilot-Dienst auf mobilen Endgeräten schrittweise beenden wird. Laut IGN schickte Sharma am selben Tag eine interne Mitteilung an Xbox-Mitarbeiter, in der sie erläuterte, dass das Xbox-Team gerade einen großen Wandel durchführt, und kündigte die Ernennung neuer Führungskräfte an, um die Umsetzung zu beschleunigen.

MarketWhisper26M her

Kommentieren

0/400

Keine Kommentare