Cursorの最近の開示によると、同社はComposerモデルシリーズ向けの「autoinstall」と呼ばれる学習手法を公開し、次世代の強化学習のために実行可能な環境を自動的にセットアップするために、前世代のモデルを使用するとしています。Composer 2のトレーニングでは、このタスクを完了するためにCursorはComposer 1.5を使用しました。この手法は2つのステップで動作します。まず、エージェントがコードリポジトリのドキュメントと設定を読み取り、期待される出力を伴う検証コマンドを10個生成します。次に、別のエージェントがそれらのうち3つのコマンドを使って、コマンドが正常に実行されるまで、環境をゼロから構成します。最大5回のリトライ試行が行われます。Composer 2は、環境セットアップ能力を測定するベンチマーク「Terminal-Bench」で61.7%のスコアを達成し、Composer 1.5の47.9%と比べて14ポイントの改善となりました。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
EUは5月7日にAI生成ディープフェイクのポルノを禁止
新華社によると、5月7日、EU議会の議員と加盟国は、人工知能システムがディープフェイクのポルノコンテンツを生成することを禁止することで合意に達した。この禁止は、2024年の人工知能法の改正案に盛り込まれる予定だ。欧州議会
GateNews9分前
テザーがQVAC MedPsyの医療AIモデルをリリースし、17Bパラメータ版で62.62のスコアを達成
Odailyによると、Tether AI Research Groupは、クラウドに依存せずにスマートフォンやウェアラブル端末上でローカル実行することを目的とした医療AIモデル「QVAC MedPsy」をリリースした。17億パラメータ版は7つの医療ベンチマークで62.62を獲得し、GoogleのMedGemma-1.5-4Bを11.42 poi上回った。
GateNews29分前
B.AI API、OpenAIのリリースから48時間以内にGPT-5.5 Instantを含む4つの新モデルを発表
B.AI APIは、新しい4つのモデルを発表しました。GPT-5.5 Instant、DeepSeek-v3.2、MiniMax-M2.7、そしてGLM-5.1です。GPT-5.5 Instantは、OpenAIのリリースから48時間以内に基盤となる適応とインターフェース統合を完了し、遅延ゼロでのアクセスを可能にしました。
GateNews34分前
テザーの17億ドル規模の医療AIモデルが、今日16倍の規模の競合他社を上回る
TetherのAI研究チームによると、同社は本日、クラウドへの依存なしにスマートフォンやウェアラブルでローカル展開できる、QVAC MedPsyシリーズの医療用言語モデルを公開しました。1.7Bパラメータ版は7つの医療ベンチマークで62.62を記録し、Google MedGemma-4Bを上回りました
GateNews45分前
AnthropicのプレIPOバリュエーションが1.2兆ドルに到達し、OpenAIを20%上回る
Odailyによると、ブロックチェーンを基盤としたプレIPO市場におけるAnthropicの推定評価額は12兆ドルに達し、OpenAIを約20%上回りました。この企業がこの評価額で上場した場合、市場総額で世界的に上場している企業として第11位にランクインし、Appleの後に続きます。
GateNews50分前
韓国の株式ラリーはAIブームで世界市場を上回る
韓国の株式市場は、人工知能関連の半導体銘柄がけん引する類を見ない上昇を経験しており、KOSPI指数は今年78%上昇して、Axiosの分析で引用されたFinancial Modeling Prepのデータによれば、世界の他の主要市場すべてを上回っています。
AI
CryptoFrontier58分前