OpenAI、ネイティブのコンピューター利用を備えたGPT-5.5 AIモデルをリリース

CryptoFrontier

OpenAIは2026年4月23日に、実世界のアプリケーションにおけるネイティブなコンピュータ操作能力によってユーザーの意図を理解するよう設計された新しいAIモデル「GPT-5.5」を公式にリリースしました。OpenAIの発表によると、このモデルは汎用目的のネイティブ能力を備えており、デスクトップアプリケーションをナビゲートし、ボタンをクリックし、複数ステップのワークフローのためにテキストを入力できます。

GPT-5.5は、ネイティブなコンピュータ利用と高度な推論を組み合わせ、ハイレベルなプロフェッショナル業務に必要なソフトウェアツールを自律的にナビゲートします。このモデルの約110万トークンのコンテキストウィンドウにより、従来は手作業でチャンク分割が必要だった巨大な金融データセットを処理できます。OpenAIの金融チームはGPT-5.5を使って24,771件のK-1税務書類 (71,637ページ)をレビューし、前年度より2週間早くタスクを完了しました。

パフォーマンス・ベンチマーク

GPT-5.5は、社内の投資銀行モデリング課題で88.5%、FinancialAgent v1.1ベンチマークで60%を獲得し、GPT-5.4を4ポイント上回りました。このモデルはGDPvalで84.9%を達成し、44の職業にまたがってエージェントが特定のナレッジワークを生み出す能力をテストします。OSWorld-Verified(モデルの自律的な実コンピュータ操作を測定)では78.7%に到達しました。GPT-5.5はTau2-benchのTelecomで98%を獲得しました。これは極めて難しいカスタマーサービスのワークフローをテストするものです。

Go-to-Marketチームの従業員は、週次の業務レポートを自動化することで、毎週の手作業が約5〜10時間節約できると確認しました。

コード生成とシステム最適化

OpenAIは、GPT-5.5が自社の提供(サービング)インフラのためにコードを書くのを支援するために使われたと報告しています。このモデルは、本番トラフィックのパターンを分析してカスタムの負荷分散ヒューリスティックを書き、自己の「System-Level Optimization(システムレベル最適化)」を達成することで、自身のトークン生成速度を20%向上させました。

開発者テストでは、モデルに「マークダウンエディタを再アーキテクトして」と依頼され、最小限の人間による修正で、ほぼ完成した12-diffのスタックを返しました。OpenAIは、新しいモデルがGPT-5.4と比べて、より少ないターンで正しい回答に到達し、同じCodexのタスクに対して40%少ないトークンを使うと述べています。

Everyの創業者兼CEOであるDan Shipperは、GPT-5.5を「深刻な概念的な明晰さ(serious conceptual clarity)」を備えた最初のコーディングモデルだと表現しました。Shipperは、彼と最良のエンジニアが、リリース後の問題のデバッグに数日を費やした後、GPT-5.5をテストしました。Shipperによれば、GPT-5.5はGPT-5.4ができなかったことを達成しました。つまり、壊れたコードを精査し、最終的にエンジニアが採用した書き直し案を生成したのです。このモデルは「記憶」して、情報の全ライブラリを参照し直しても位置を失わないことができ、以前のバージョンを悩ませていた「ハルシネーション」を減らします。

自律的な能力と自己修正

OpenAIは、GPT-5.5が「自己修正(self-correction)」と自律性のために最適化されていると主張しています。あいまいな指示を解釈し、コンピュータ・インターフェース (clicking, typing, browsing)を使って、人間の介入なしに目的を達成するのが得意です。エージェントが必要になって、ソフトウェアを操作したり、ターミナル中心のワークフローを管理したり、あるいはコードベース全体 (500K+ tokens)にわたって高いリトリーバル精度で推論したりする場合に、モデルは特に有用になります。

GPT-5.5 Thinking機能

ChatGPTでは、OpenAIが「GPT-5.5 Thinking」を導入しました。これは同社によれば、より難しい問題に対してより速い支援を可能にします。この機能は、ユーザーが複雑なタスクをより効率的に完了できるよう、より賢く、より簡潔な回答を提供します。情報の統合や分析、コーディング、そしてリサーチなどのドキュメント量の多いタスクのようなプロフェッショナル業務において特に力を発揮します。特にプラグインを使用する場合に強みがあります。

初期のGPT-5.5 Proテスターは、ChatGPTが引き受けられる仕事の品質と難易度の両方が大幅に改善したと報告しています。応答のレイテンシが低いため、GPT-5.4 Proよりも要求の厳しいタスクに対して実用的です。GPT-5.5 Proの回答は、よく構造化されており、関連性があり、有用で正確であり、とりわけ法律、データサイエンス、ビジネス、教育で特に高いパフォーマンスを示します。

料金と利用可能性

基本版は利用可能ですが、最も高機能なバージョン (GPT-5.5 Pro)は個人加入者向けに月額100ドルです。企業向けでは、出力トークンあたりのコストはGPT-5.4の約2倍であり、40%高いトークン効率があってもその水準です。大規模なエージェント型導入における総支出は大きくなり得ます。最高位の推論が、潤沢な資金を持つ企業だけが利用できる「贅沢品」になるのではないか、という懸念が高まっており、その結果、大企業と小規模スタートアップの間で生産性格差が拡大する可能性があります。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
AprDaydreamvip
· 2時間前
希望公式提供一个可审计的行动日志/回放机制,否则出现问题时很难追责,尤其是自动操作资产类账户。
原文表示返信0
PaperHandsProvip
· 3時間前
現実の応用における「意図の理解」こそが難点であり、もう二度とあなたが航空券を予約したいのに履歴書を修正されるという恥ずかしい事態が起きないことを願います。
原文表示返信0
Half-SectionedSucculentvip
· 3時間前
少し期待している一方で、少し怖い:マウスをクリックできることは、多くの「人間のクリック」でしかできないことができることと同じであり、リスク管理と反不正行為対策の強化が必要になる。
原文表示返信0
ACalmnessWithAHintOfPomelovip
· 3時間前
この波はWeb3にも影響を与えるでしょう。自動化されたオンチェーン操作、署名プロセス、ウォレットのインタラクションがシームレスに行えるようになれば、製品の形態は変わるでしょう。
原文表示返信0
StarsInTheGlassDomevip
· 3時間前
APIと価格は急がず、まず複雑なデスクトップ環境でポップアップ、マルチウィンドウ、ネットワークのジッターに耐えられるかどうかを見てみましょう。
原文表示返信0
GateUser-b665e41cvip
· 3時間前
「話せて書ける」から「できて納品できる」へ進化するのを感じている。次のステップは、より良い記憶とタスク管理を提供することだ。
原文表示返信0
LintCollectorvip
· 3時間前
もし本当にアプリ間の連携が可能になれば:ブラウザで資料を検索→Excelで処理→PPTでプレゼン資料作成→メールで送信、これがオフィスの全工程のクローズド・ループとなる。
原文表示返信0
DegenWithNotebookvip
· 3時間前
ついにデスクトップネイティブ操作が登場したのか?これで本当に「デジタルインターン生」になるぞ。
原文表示返信0