据 动察 Beating 監測、英偉達が Cosmos-Reason2-32B モデルの重みを公開。Cosmos Reason 2 は英偉達が昨年末にリリースした物理 AI 推論ビジョン言語モデル(VLM、画像、動画、文字を同時に処理するモデル)であり、ロボットや自動運転システムに空間、時間、基礎物理法則の理解を教えるためのものです。当時は 20 億と 80 億パラメータの小型バージョンの重みのみ公開されており、320 億パラメータのフラッグシップ版は今回初めて公開されました。ベースは通义千問 Qwen3-VL-32B-Instruct で、NVIDIA Open Model License により商用利用可能です。
車載映像を与えると、リアルタイムで推論し右折の安全性を判断できる;倉庫の写真を与えると、各貨物の 2D/3D 座標と境界ボックスを示すことができる。主な用途は三つの方向:都市や工業現場の映像ストリームの分析、センサー データのバッチラベリング、人型ロボットや自動運転車の計画脳としての利用。前世代と比べて、目標検出と時間スタンプの正確な位置特定を追加し、コンテキストウィンドウを 256K トークンに拡大。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
フォアフロント・テックが $100M のIPO価格設定を完了、NasdaqはコードFTHAUのもと上場
ChainCatcherによると、特別目的買収会社(SPAC)のForefront Techは4月30日に1億ドル規模のIPOの価格決定を完了し、ティッカーシンボルFTHAUのもとでNasdaqに上場する予定です。同社は、調達資金を用いてブロックチェーン、フィンテック、人工知能分野における合併・買収(M&A)の機会を追求する考えです。
GateNews44分前
Anthropic Claude Code は請求バグによりユーザーに200.98ドルを過剰請求し、当初は返金を拒否したが最終的には全額補償されることになった
Beatingによる監視では、AnthropicのClaude Codeサービスにおける請求の不具合により、最大20倍の加入者が追加の利用料金として200.98ドルを過剰請求されていたことが判明した。同加入者は月間クォータの13%しか使用していなかった。ユーザーのgitリポジトリのコミット履歴に大文字の
GateNews1時間前
DeepSeekは4月30日にマルチモーダル推論を強化するために視覚プリミティブ方式を導入
DeepSeekの技術レポートによると、4月30日、同社はVisual Primitives(ビジュアル・プリミティブ)を導入しました。これは、マルチモーダル課題におけるReference Gap問題に対処するために、点やバウンディングボックスなどの基本的な視覚要素を推論チェーンに埋め込む手法です。この方法は画像トークンの消費を削減します
GateNews1時間前
NVIDIA、フラッグシップモデル「Cosmos-Reason2-32B」の重みを提供開始し、コンテキストウィンドウを256Kトークンに拡張
Beatingによると、NVIDIAは物理AI推論のビジョン-言語モデル(VLM)であるCosmos-Reason2-32Bの重みをリリースした。これは、ロボットや自動運転システムが空間的・時間的・物理的な原理を理解するのを助けることを目的とした同社の旗艦モデルだ。320億パラメータのモデル、
GateNews1時間前
OpenAI が Codex をなぜ「ゴブリン」という禁句で扱うのかを暴く:オタク人格の報酬が制御不能に
OpenAIは公式ブログで、Codexが禁談哥布林などの生物について説明しているのは、書き手タイプの人格訓練における報酬シグナルが生物の比喩を好むことで、人格をまたいだ汚染やRLHFの誤導が起きたためだと説明している。Barron Rothがシステム指令を暴露した後、OpenAIは短期のハードコードと長期の報酬シグナルの除去という2つの戦略を採用し、報酬設計の脆弱性を警告した。追加の後訓練に向けた監査は、より精密であるべきだ。
ChainNewsAbmedia2時間前
アリババのQwenがQwen-Scopeの解釈可能性モジュールをオープンソース化、4月30日に7モデルをカバー
PANewsによると、4月30日にAlibabaのQwenは、Qwen3およびQwen3.5シリーズのモデルで学習された解釈可能性モジュール「Qwen-Scope」のオープンソース化を発表した。リリースでは、dense型およびmixture-of-experts型のバリアントにまたがる7つの大規模言語モデルを対象としており、疎なオートエンコーダーの14セットが含まれている
GateNews3時間前