Perplexity розкриває метод пост-тренування агента веб-пошуку; модель на базі Qwen3.5 перевершує GPT-5.4 за точністю та вартістю

Gate News message, 23 квітня — Дослідницька команда Perplexity опублікувала технічну статтю, яка детально описує її методологію пост-тренування для агентів веб-пошуку. Підхід використовує дві моделі Qwen3.5 із відкритим кодом (Qwen3.5-122B-A10B та Qwen3.5-397B-A17B) і застосовує конвеєр у два етапи: контрольоване донавчання (SFT) для формування дотримання інструкцій і мовної узгодженості, а потім онлайн підкріплювальне навчання (RL) для оптимізації точності пошуку та ефективності використання інструментів.

Фаза RL використовує алгоритм GRPO із двома джерелами даних: власним багатокроковим верифікованим набором запитань-відповідей, зібраним із внутрішніх стартових запитів, що вимагають 2–4 кроків міркування з верифікацією за допомогою кількох розв’язувачів, та розмовними даними загального призначення на основі рубрики, які перетворюють вимоги розгортання на об’єктивно перевірювані атомарні умови, щоб запобігти деградації поведінки SFT.

Дизайн винагород використовує gated aggregation — лише коли досягнуто базової правильності (відповідність питання-відповіді або коли виконано всі критерії рубрики), бали преференцій додаються, запобігаючи тому, щоб сигнали високої преференції маскували фактичні помилки. Штрафи за ефективність використовують прив’язку в межах групи, застосовуючи згладжені штрафи до викликів інструментів і довжини генерації, що перевищує базовий рівень правильних відповідей у тій самій групі.

Оцінювання показує, що Qwen3.5-397B-SFT-RL досягає результатів найвищого класу на пошукових бенчмарках. На FRAMES він досягає 57,3% точності за одного виклику інструмента, випереджаючи GPT-5.4 на 5,7 відсоткового пункта та Claude Sonnet 4.6 на 4,7 відсоткового пункта. За помірного бюджету (чотири виклики інструментів) він досягає 73,9% точності при $0,02 за запит, порівняно з 67,8% точності GPT-5.4 при $0,085 за запит і 62,4% точності Sonnet 4.6 при $0,153 за запит. Показники вартості базуються на публічному ціноутворенні кожного провайдера через API та виключають оптимізації кешування.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Злом безпеки Vercel розширився до сотень користувачів; AI-розробники наражені на більший ризик

Повідомлення Gate News від 23 квітня — Vercel повідомила 19 квітня, що її інцидент безпеки, спочатку описаний як такий, що вплинув на «обмежену підмножину клієнтів», розширився до значно ширшої спільноти розробників, зокрема тих, хто створює робочі процеси для AI-агентів. Атака може зачепити сотні користувачів

GateNews24хв. тому

OpenAI 推 GPT-5.5:12M контекст, AA індекс на першому місці, Terminal-Bench 82.7% переписує агентський бенчмарк

OpenAI опублікувала GPT-5.5, з акцентом на агентську роботу та обробку корпоративних знань, і одночасно запустила її в ChatGPT та Codex. Основні моменти: контекстне вікно 1200 млн token, AA Intelligence Index 60, випередження Claude Opus 4.7, Gemini 3.1 Pro; ціна становить 5 доларів за кожен мільйон token на вхід і 30 доларів на вихід, кількість вихідних token зменшується приблизно на 40%, а фактична вартість зростає приблизно на 20%.

ChainNewsAbmedia1год тому

MagicBlock запускає Mirage — інструмент конфіденційних платежів із командного рядка для Solana

Повідомлення Gate News, 23 квітня — MagicBlock випустила Mirage, інструмент конфіденційних платежів із командного рядка, розроблений для мережі Solana. Інструмент дозволяє користувачам створювати гаманці, поповнювати кошти та надсилати приватні транзакції за допомогою команд термінала, ботів або AI-агентів. Mirage створено на базі Private

GateNews5год тому

OpenClaw 2026.4.22 уніфікує життєвий цикл плагіна для harness Codex і Pi, скорочуючи час завантаження плагіна до 90%

Повідомлення Gate News, 23 квітня — OpenClaw, платформа з відкритим кодом для AI-агентів, випустила версію 2026.4.22 22 квітня, і її найбільша зміна — узгодження життєвих циклів harness Codex та Pi. Раніше плагіни поводилися непослідовно в обох шляхах harness: деякі хуки були відсутні в певних середовищах. Нова версія об’єднує критичні хуки, зокрема before_prompt_build, before_compaction/after_compaction, after_tool_call, before_message_write та llm_input/llm_output/agent_end, усуваючи потребу для розробників підтримувати окремі реалізації для кожного шляху. Оновлення також додає підтримку асинхронного middleware для tool_result для розширень плагінів з боку Codex. Покращення продуктивності суттєві: завантаження плагінів тепер використовує нативний Jiti, скорочуючи час старту на 82% до 90%, тоді як doctor --non-interactive runtime зменшився приблизно на 74%. Типовий рівень мислення для моделей виведення підвищено з off/low до medium, тож виведення міркувань за замовчуванням доступне для незмінених конфігурацій. Додаткові виправлення включають те, що багатокадрові виклики агента Kimi K2.6 більше не перериваються через корупцію tool_call ID, покращене керування пам’яттю Linux у підпроцесах із автоматичним коригуванням oom_score_adj та нову систему відновлення конфігурації з останнього відомого робочого стану, щоб запобігти збоям Gateway через випадкові перезаписи конфігурацій. Нові інтеграції провайдерів включають можливості генерації зображень xAI grok-imagine-image та grok-imagine-image-pro, TTS і STT; Tencent Cloud як офіційний плагін-провайдер із прев’ю-моделями Hy3 та ціноутворенням; а також нативний інструмент web_search від OpenAI, який замінює керований канал пошуку OpenClaw, коли ввімкнено вебпошук.

GateNews6год тому

Google Cloud і CVC об’єднуються, щоб прискорити трансформацію AI-агентів для компаній портфеля

Повідомлення Gate News, 23 квітня — Google Cloud і великий приватний інвестфонд CVC оголосили про стратегічне партнерство, щоб прискорити трансформацію AI-агентів для CVC та сотень компаній у межах його інвестиційного портфеля. Співпраця використовуватиме платформу штучного інтелекту Google Cloud та модель Gemini, щоб сприяти впровадженню інтелектуальних агентів у всьому портфелі.

GateNews8год тому
Прокоментувати
0/400
Немає коментарів