ゲートニュースによると、3月20日にAIプログラミングツールCursorは第3世代の自社開発プログラミングモデルComposer 2をリリースしました。スタンダード版の価格は、入力100万トークンあたり0.50ドル、出力2.50ドルで、前世代のComposer 1.5より約86%値下げされています。同時に高速版(入力100万トークンあたり1.50ドル、出力7.50ドル)も発売され、これをデフォルトの選択肢としています。
Cursorが公開したベンチマークテストによると、Composer 2はプログラミングエージェントのベンチマークTerminal-Bench 2.0で61.7%のスコアを記録し、Opus 4.6の58.0%を上回っていますが、GPT-5.4の75.1%には及びません。ソフトウェアエンジニアリングのベンチマークSWE-bench Multilingualでは73.7%(前世代は65.9%)、Cursorが自社開発したCursorBenchでは61.3%(前世代は44.2%)のスコアを獲得しています。
Cursorは、性能向上の要因として、基盤モデルに対する継続的な事前学習(continued pretraining)と、強化学習を用いた長時間のプログラミングタスク(数百ステップの操作を必要とする)を完遂できるよう訓練したことを挙げています。このモデルはCursor内でのみ利用可能で、外部にAPIとして提供されることはありません。Cursorの親会社であるAnysphereの評価額は現在293億ドルです。