Згідно з OpenAI, компанія визначила першопричину проблеми «goblin», яка переслідувала моделі GPT починаючи з GPT-5.1. Сигнал винагороди, який використовували для підкріплення риси характеру «Nerdy», заохочував виходи з посиланнями на фантастичних істот, причому 76,2% навчального датасету демонстрували цей ухил. Риса характеру Nerdy становила лише 2,5% відповідей ChatGPT, але спричинила 66,7% згадок про goblin; при цьому кількість згадок зросла на 3 881% з GPT-5.2 до GPT-5.4.

У березні OpenAI прибрала персональність Nerdy, усунула упереджений сигнал винагороди та відфільтрувала навчальні дані. Компанія також додала інструкції із подавлення в developer prompts для GPT-5.5 у Codex. Розслідування призвело до розробки нових інструментів аудиту поведінки моделей.

Переглянути джерело

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

OpenAI запустила GPT-5.5-Cyber: протистояння з Anthropic Mythos

Новини індустрії ШІ

OpenAI оголосила про запуск GPT-5.5-Cyber, спеціально створеного для кібербезпеки. Він буде розгорнутий у «найближчі кілька днів» через механізм довіреного доступу з урядовою координацією для ключових оборонних підрозділів, а не для відкритого продажу. Це контрастує з відкритим шляхом Anthropic Mythos: Білому дому не подобається розширення до 70 компаній. Preparedness Framework оцінив ситуацію як High (але не critical), водночас посилюючи захист кібербезпеки. Надалі стежитимуть за переліком під час розгортання, можливим включенням CISA та розбіжностями в обох сторін щодо стандартів безпеки.

ChainNewsAbmedia17хв. тому

Виручка Schneider Electric у І кварталі досягла 9,8 млрд євро, зросла на 11,2% завдяки попиту на AI дата-центри

Акції Новини індустрії ШІ

За повідомленням Reuters, Schneider Electric повідомила про дохід у першому кварталі на рівні 9,8 млрд євро (11,4 млрд доларів США) 30 квітня, а органічне зростання піднялося до 11,2% на тлі попиту на AI-ЦОД. Французький постачальник обладнання для електроживлення та охолодження заявив, що результат був трохи вищим за консенсус-оцінки та

GateNews24хв. тому

Protum залучає 2 мільйони доларів у посівний раунд для платформи AI-управління, плануючи закриття угоди в червні 2026 року

Новини індустрії ШІ

Згідно з TechCrunch Startup Spotlight, Protum — AI-стартап із корпоративного управління — залучає seed-раунд на суму 2 мільйони доларів, який планує закрити до червня 2026 року. Заснований Сандіпом J., що має 25 років досвіду трансформації великих компаній, Protum надає платформу, створену для того, щоб давати підприємствам безперервний

GateNews54хв. тому

Сплеск звільнень у бізнесі може призвести до глухого кута «роботодавець—працівники», вважають дослідники: слід запровадити податок на автоматизацію за допомогою ШІ

Новини індустрії ШІ

Дослідження вказує на зовнішні ефекти скорочень працівників через використання ШІ: витрати на звільнення є вигодою, яку отримує лише компанія, але втрата купівельної спроможності лягає на весь ринок. Чим більше звільнень, тим слабший попит — і обидві сторони програють. Пропонується запровадити збір «податку на автоматизацію за допомогою ШІ», щоб інтегрувати зовнішні витрати в ринкові розрахунки, а також фінансувати перепідготовку через податкові надходження, щоб відновити попит і стабілізувати економіку.

ChainNewsAbmedia58хв. тому

Claude стягуватиме мовний податок? Дослідження: переклад китайського, японського та корейського контенту споживає найбільше токенів — майже втричі більше

Новини індустрії ШІ

Дослідник Komatsuzaki у дописі в X зазначив, що в токенізаторах основних LLM існує «податок на неангломовність». Під час перекладу тестів із книги «The Bitter Lesson» Claude має приріст кількості токенів для гінді, арабської, російської та китайської приблизно 3,24×, 2,86×, 2,04× і 1,71× відповідно — це помітно більше, ніж у OpenAI. Китайські локальні моделі краще пристосовані до китайської, що свідчить про зумовлену англомовними тренувальними даними нерівність витрат і стає перешкодою для поширення.

ChainNewsAbmedia1год тому

Microsoft AI для бізнесу збільшується вдвічі до $370B ARR; планує $190B Capex на 2026 рік

Акції Новини індустрії ШІ

29 квітня Microsoft повідомила про результати третього кварталу фінансового 2026 року за період, що завершився 31 березня, перевершивши ринкові очікування. Дохід у Q3 досяг $82,886 млрд, що на 18% більше в річному обчисленні та вище від прогнозованих $81,4 млрд; прибуток за GAAP зріс на 23% до $31,778 млрд; неконсолідований розбавлений прибуток на

GateNews1год тому

Прокоментувати

0/400

Немає коментарів