Cursor розкриває метод тренування для автозапуску, підвищує продуктивність Composer 2 на 14 процентних пунктів

Згідно з недавнім розкриттям Cursor, компанія представила навчальну техніку під назвою autoinstall для серії моделей Composer: використання моделі попереднього покоління для автоматичного налаштування виконуваних середовищ для підкріплювального навчання наступного покоління. Під час тренування Composer 2 Cursor використав Composer 1.5, щоб виконати це завдання. Метод працює у два кроки: спочатку агент зчитує документацію та конфігурації репозиторію коду, щоб згенерувати 10 команд перевірки із очікуваними результатами; потім інший агент використовує 3 з цих команд, щоб з нуля налаштувати середовище, доки команди не запустяться успішно, з максимально 5 спробами повтору. Composer 2 досяг 61,7% на Terminal-Bench, бенчмарку, що вимірює здатність налаштовувати середовища, тоді як Composer 1.5 — 47,9%, що відповідає покращенню на 14 відсоткових пунктів.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Tether випускає медичну AI-модель QVAC MedPsy та досягає оцінки 62,62 на версії з 17 млрд параметрів

За даними Odaily, Tether AI Research Group випустила QVAC MedPsy — медичну AI-модель, призначену для локального запуску на смартфонах і носимих пристроях без залежності від хмари. Версія на 1,7 мільярда параметрів набрала 62,62 на семи медичних бенчмарках, випередивши MedGemma-1.5-4B від Google на 11,42 poi

GateNews20хв. тому

B.AI запускає чотири нові моделі, зокрема GPT-5.5 Instant, протягом 48 годин після релізу OpenAI

B.AI API запустив чотири нові моделі: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 і GLM-5.1. GPT-5.5 Instant завершив базову адаптацію та інтеграцію інтерфейсу протягом 48 годин після релізу OpenAI, забезпечивши доступ без затримок до

GateNews25хв. тому

Модель медичної AI від Tether на 1,7 млрд перевершила сьогодні конкурента у 16 разів більшого розміру

За даними AI-дослідницької команди Tether, сьогодні компанія запустила медичні мовні моделі серії QVAC MedPsy, створені для локального розгортання на смартфонах і носимих пристроях без залежності від хмари. Версія з 1,7 млрд параметрів набрала 62,62 на семи медичних бенчмарках, перевершивши Google MedGemma-4B

GateNews36хв. тому

Оцінка Anthropic під час передпублічного розміщення (Pre-IPO) досягла $1,2 трильйона, перевищивши OpenAI на 20%

За даними Odaily, опосередкована оцінка Anthropic на блокчейн-ринку перед IPO досягла 1,2 трильйона доларів, обігнавши OpenAI приблизно на 20%. Якщо компанія вийде на біржу за цією оцінкою, вона посідатиме 11-те місце серед найбільших публічних компаній у світі за ринковою капіталізацією, поступаючись Apple,

GateNews41хв. тому

Фондове ралі в Південній Кореї випереджає глобальні ринки на тлі буму ШІ

Фондовий ринок Південної Кореї демонструє безпрецедентні зростання завдяки акціям напівпровідників, пов’язаним із штучним інтелектом: індекс KOSPI зріс на 78% цього року, випередивши всі інші ключові ринки у світі, згідно з даними Financial Modeling Prep, на які посилається аналіз Axios. AI

CryptoFrontier49хв. тому
Прокоментувати
0/400
Немає коментарів