OpenAI CodexチームがOpenClawの認証バグを修正、エージェント挙動を大幅に改善

Gate Newsメッセージ、4月23日— OpenAI Codexチームは、OpenClawにおけるOpenAIモデル体験の最適化に注力しており、CodexのエンジニアリングリードであるTibo SottiauxがOpenClawの作成者Peter Steinbergerと連携しています。CodexプロダクトリードのNik Pashは、重要な認証の不具合を発見しました。OpenClawがOpenAIモデルでCodexハーネスを使用するように設定されていた場合、認証プロセスが失敗し、システムがPiハーネスへサイレントにフォールバックしたため、ユーザーはCodexハーネスが正常に動作していると誤って信じることになりました。

Pashはこの問題に対処するために2つのプルリクエストを提出しました。1つは認証ブリッジを修正し、もう1つはサイレントなフォールバックを防ぐものです。改善の根本は、OpenClawがモデルAPIとどのように通信するかを司る基盤の実行時アダプタ (harness)を切り替えたことにすべて起因しており、エージェントのプロンプトや上位レベルのワークフローのロジックは変更されていません。

修正前後で、エージェントの挙動には明確な違いが見られました。Piハーネスでは、エージェントは各ハートビートごとに浅いポーリングを実行しました。ハートビートファイルを読み取り、Discordを確認し、HEARTBEAT_OKを返して、その他の指示は無視します。オペレーションを推測して実行することもありましたが、ツールコールを発行できませんでした。Codexハーネスへ切り替えた後、エージェントは完全な作業ループに入りました。ワークスペースのコンテキストを読み取り、タスクリストを解析し、リポジトリを確認し、編集を実行し、検証を試みます。以降のハートビートでは、作業を繰り返すのではなく、進捗を再開できるようになりました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

GoogleのCEO:2026年の設備投資は1850億、AIエージェント時代の投資を強化

GoogleのCEOであるスンダー・ピチャイは、4月22日にラスベガスで開催されたGoogle Cloud Nextで、Googleが2026年に1,750億〜1,850億ドルの資本支出を行い、自律型人工知能エージェント(AI Agent)の構築に必要なインフラを整備する計画であると発表した。これは、2022年の310億ドルから増加している。

MarketWhisper33分前

Google Jules が新版候補者リストを公開し、エンドツーエンドの製品開発プラットフォームとして再定義します

Google Julesチームの公式発表によると、4月23日の公告で、Julesのプロダクトの位置づけは「非同期コーディング・エージェント」から「エンドツーエンドのエージェント型プロダクト開発プラットフォーム」へとアップグレードされました。新バージョンは、完全なプロダクトのコンテキストを読み取り、自律的に次に構築する方向性を判断し、そしてPRを提出できるとのことです。公式は同時に、新バージョンの候補者名簿の募集開始も発表しました。

MarketWhisper39分前

Google Jules、エンドツーエンドのエージェント型プロダクト開発プラットフォームとして再ブランディング、新バージョンのウェイリストを開設

Gate News メッセージ、4月23日 — GoogleのJulesチームは、製品の新バージョンに関するウェイリストの開設を発表し、Julesを非同期のコーディングエージェントからエンドツーエンドのエージェント型プロダクト開発プラットフォームへと再配置しました。公式の説明によれば、アップグレードされたプラットフォームはエンティ

GateNews1時間前

PerplexityがWeb検索エージェントのポストトレーニング手法を公開;Qwen3.5ベースのモデルが精度とコストでGPT-5.4を上回る

Perplexityは、Qwen3.5モデルを用いたSFTの後にRLを行います。マルチホップQAデータセットとルーブリック(評価基準)チェックを活用して、検索の精度と効率を高め、FRAMESにおいて業界最高水準の性能を達成しています。 要旨:PerplexityのWeb検索エージェント向けポストトレーニングのワークフローは、命令追従と言語の一貫性を強制するための教師あり微調整 (SFT) と、GRPOアルゴリズムによるオンライン強化学習 (RL) を組み合わせています。RL段階では、SFTのドリフトを防ぐために、独自のマルチホップ検証可能QAデータセットと、ルーブリックに基づく対話データを使用し、報酬ゲーティングと同一グループ内の効率ペナルティを採用します。評価の結果、Qwen3.5-397B-SFT-RLがトップのFRAMES性能を達成し、単一ツール呼び出しで57.3%の精度、4回の呼び出しで73.9%の精度を、1クエリあたり$0.02で実現しています。これにより、これらの指標においてGPT-5.4およびClaude Sonnet 4.6を上回ります。料金はAPIベースで、キャッシュは除外されます。

GateNews1時間前

OpenAI が ChatGPT Workspace Agents を公開:Codex による駆動、チーム共有、Slack 連携

OpenAIは4月22日にChatGPT Business/Enterprise/Edu/TeachersでWorkspace Agentsを提供開始し、Codexを駆動に、クラウドでの長時間稼働、チームでの共有、オフライン実行に対応します。Slack上で主導的に応答し、請求書発行、複数ステップのワークフローの実行ができ、スケジューリングにも対応しています。研究プレビューは5月6日まで無料で、その後はcredit-basedでの課金となり、価格は未発表です。Google Gemini Enterprise Agent Platform、Anthropic Claude Coworkと同じ土俵で競合しており、3社はいずれも企業向けのエージェントに注力していますが、位置付けはそれぞれ異なります。

ChainNewsAbmedia3時間前

Google Cloud Next 2026:Gemini エンタープライズ・エージェント・プラットフォームを提供、7億5,000万ドルでコンサルの導入を後押し

Google Cloud が Cloud Next 2026 で Gemini Enterprise Agent Platform を発表し、モデルの選択、エージェントの構築、DevOps、オーケストレーション、企業向けのセキュリティ統制を統合するとともに、McKinsey、Accenture、Deloitte が企業エージェントを導入するための 7.5 億ドルの基金を提供した。プラットフォームは Ironwood TPU、A2A、MCP と組み合わせて自社のフルスタックおよびコンサルティング流通網を構築し、OpenAI Operator および Anthropic Claude の企業版に対抗する。

ChainNewsAbmedia3時間前
コメント
0/400
コメントなし