広場
最新
注目
ニュース
プロフィール
ポスト
Legendaryry
2026-04-23 18:35:15
フォロー
Asked GPT Image 2.0 to create a benchmark table of opus 4.7 vs gpt 5.5.
その画像モデルは非常に良くなった。
GPT-5.5がヘッドラインのスコアボードで勝利した。でもよく見てみて。
OSWorld 78.7対78.0。GDPval 84.9対80.3。Toolathlon 55.6対54.6 (オーバー5.4、Opusではなく)。
OpusはまだSWE-Bench Pro、MCP Atlas、GPQA Diamond、HLE no-toolsを使用している。
OpenAIはオールラウンドのベルトを獲得。Anthropicはコーディングの王冠を維持。紙の上では。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
Gate13thAnniversaryLive
1.25M 人気度
#
WCTCTradingChallengeShare8MUSDT
807.1K 人気度
#
BitcoinBouncesBack
184.58K 人気度
#
IsraelStrikesIranBTCPlunges
30.72K 人気度
#
EthereumMemeSeasonReturns
2.01M 人気度
ピン
サイトマップ
Asked GPT Image 2.0 to create a benchmark table of opus 4.7 vs gpt 5.5.
その画像モデルは非常に良くなった。
GPT-5.5がヘッドラインのスコアボードで勝利した。でもよく見てみて。
OSWorld 78.7対78.0。GDPval 84.9対80.3。Toolathlon 55.6対54.6 (オーバー5.4、Opusではなく)。
OpusはまだSWE-Bench Pro、MCP Atlas、GPQA Diamond、HLE no-toolsを使用している。
OpenAIはオールラウンドのベルトを獲得。Anthropicはコーディングの王冠を維持。紙の上では。