Откройте для себя SCENE
Всего через несколько недель после последнего крупного релиза OpenAI активно переводит свой флагманский ChatGPT с потребительского новшества на незаменимую корпоративную мощь.
В четверг компания выпустила GPT-5.2 — новую крупную языковую модель, которая, по их утверждениям, быстрее, более надежна и предназначена для обработки сложных профессиональных рабочих процессов.
Обновление свидетельствует о том, что OpenAI выходит за рамки помощи с домашними заданиями и общих запросов, стремясь встроить свою технологию как важный ежедневный инструмент в бизнес-мире, что подтверждается выгодными сделками с правительством США и Disney.
«Мы разработали GPT‑5.2, чтобы открыть еще больше экономической ценности для людей», — заявил OpenAI в утверждении. «Она лучше создает таблицы, строит презентации, пишет код, воспринимает изображения, понимает длинные контексты, использует инструменты и справляется со сложными многозадачными проектами.»
Говоря о производительности GPT-5.2, компания представила собственный оценочный бенчмарк GDPval, моделирующий задачи в 44 профессиях.
GPT-5.2 достигла или превзошла показатели человеческих работников примерно в 71% сравнений, утверждает компания.
«На GDPval модель мышления побеждает или сравнивается с экспертами в 70,9% типичных профессиональных задач, таких как создание таблиц, презентаций и документов», — написал в X CEO OpenAI по приложениям, Фиджи Симбо. «Она также лучше в области общего интеллекта, написания кода, вызова инструментов, визуального восприятия и понимания длинных контекстов, что позволяет ей открывать еще больше экономической ценности для людей.»
Неясно, прошел ли бенчмарк внешнюю проверку, оставляя отраслевых экспертов ждать независимой верификации утверждений.
GPT-5.2 стал доступен в рамках платных подписок в четверг, а доступ к API был открыт в тот же день. Разработчики теперь могут выбирать из трех различных версий, каждая из которых оптимизирована для различных профессиональных потребностей.
Цены на API установлены в размере $1.75 за миллион входных токенов и $14 за миллион выходных токенов.
Помимо бенчмарка GDPval, GPT-5.2 показала улучшенные результаты на известных технических тестах, набрав более высокие оценки на GPQA Diamond и FrontierMath. Также, по сообщениям, она продемонстрировала более надежные результаты в сложных задачах, таких как кодирование, анализ данных и проектирование экспериментов.
В объявлении компания представила несколько положительных отзывов от ранних тестировщиков.
Релиз более компетентного AI для работы приходится на уже напряженную рабочую среду.
Корпоративные руководители в основном настроены оптимистично, о чем свидетельствует недавний опрос Just Capital, показывающий, что 93% бизнес-лидеров считают AI положительным фактором. Однако тот же опрос выявил, что почти половина американцев ожидает, что технология уничтожит рабочие места, что, по сообщениям, меньше тревожит руководителей.