Anthropic запроваджує виборчі запобіжники для Claude перед проміжними виборами 2026 року

Anthropic оголосила в п’ятницю набір заходів для цілісності виборів, розроблених, щоб не допустити, аби її чат-бот Claude був використаний як зброя для поширення дезінформації або маніпулювання виборцями напередодні проміжних виборів у США у 2026 році та інших великих змагань по всьому світу в цьому році. Компанія з Сан-Франциско описала багатосторонній підхід, який включає автоматизовані системи виявлення, стрес-тестування проти операцій впливу та партнерство з непартійною організацією, що надає ресурси виборцям — заходи, які відображають зростаючий тиск на розробників ШІ щодо того, як їхні інструменти застосовуються під час виборчих сезонів.

Політики використання під час виборів

Політики використання Anthropric забороняють Claude використовувати для ведення оманливих політичних кампаній, створення фейкового цифрового контенту, призначеного для впливу на політичний дискурс, для вчинення виборчого шахрайства, втручання в інфраструктуру голосування або поширення оманливої інформації про процес голосування.

Результати тестування на відповідність

Щоб забезпечити виконання своїх виборчих політик, Anthropic протестувала свої найновіші моделі, використавши 600 запитів — 300 шкідливих запитів у парі з 300 законними — щоб оцінити, наскільки надійно Claude виконував належні запити та відмовляв у проблемних. Claude Opus 4.7 і Claude Sonnet 4.6 відповідали коректно в 100% і 99,8% випадків відповідно.

Компанія також протестувала свої моделі проти більш витончених тактик маніпуляцій. Використовуючи багатокрокові змодельовані розмови, створені для імітації покрокових методів, які можуть застосовувати недобросовісні актори, Sonnet 4.6 і Opus 4.7 відповідали коректно в 90% і 94% випадків відповідно, коли їх тестували на сценаріях операцій впливу.

Anthropric додатково перевірила, чи можуть її моделі автономно виконувати операції впливу — планувати й реалізовувати багатокрокову кампанію end-to-end без підказок людини. За наявності запобіжників її найновіші моделі відмовляли майже в кожному завданні, повідомила компанія.

Оцінка політичної нейтральності

Щодо питання політичної нейтральності Anthropic проводить оцінювання перед кожним запуском моделі, щоб виміряти, наскільки послідовно та неупереджено Claude взаємодіє з промптами, що висловлюють погляди з усього політичного спектра. Opus 4.7 і Sonnet 4.6 показали 95% і 96% відповідно.

Банери з інформацією про вибори

Для користувачів, які шукають інформацію про голосування, Claude покаже банер про вибори, який спрямовуватиме їх на TurboVote — непартійний ресурс від Democracy Works, що надає надійну інформацію в режимі реального часу про реєстрацію виборців, місця для голосування, дати виборів і деталі бюлетеня. Подібний банер планується для виборів у Бразилії пізніше цього року.

Постійний моніторинг

Anthropric заявила, що планує продовжувати моніторинг своїх систем і вдосконалювати свої захисти в міру того, як розгортатиметься виборчий цикл.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Публічна компанія придбала AI-інвестиційну платформу Treasury App, щоб розширити криптовалютну торгівлю

Згідно з ChainCatcher, Public оголосила про придбання платформи AI-інвестиційних сервісів Treasury App, щоб посилити свій брокерський бізнес, керований ШІ. Суму угоди не розкрили. Наразі Public підтримує торгівлю акціями, облігаціями та криптовалютами, зокрема Bitcoin, Ethereum, a

GateNews1год тому

Blitzy завершила раунд фінансування $200M під керівництвом Northzone

За даними ChainCatcher, Blitzy — компанія з розробки коду за допомогою ШІ, співзасновником якої є колишній архітектор Nvidia Сід Пардеші, — завершила раунд фінансування на $200 мільйонів, який очолила Northzone. Battery Ventures, Jump Capital і Morgan Creek Digital також взяли участь у раунді. Платформа може аналізувати складні системи з

GateNews2год тому

ЄС забороняє порнографію з дипфейками, створеними за допомогою ШІ, 7 травня

За повідомленням агентства Xinhua News Agency, 7 травня члени Європейського парламенту та держави-члени досягли консенсусу щодо заборони системам штучного інтелекту створювати порно-контент із використанням deepfake. Заборону буде включено до поправок до Закону ЄС про штучний інтелект 2024 року. Європейський парламент

GateNews2год тому

Tether випускає медичну AI-модель QVAC MedPsy та досягає оцінки 62,62 на версії з 17 млрд параметрів

За даними Odaily, Tether AI Research Group випустила QVAC MedPsy — медичну AI-модель, призначену для локального запуску на смартфонах і носимих пристроях без залежності від хмари. Версія на 1,7 мільярда параметрів набрала 62,62 на семи медичних бенчмарках, випередивши MedGemma-1.5-4B від Google на 11,42 poi

GateNews2год тому

B.AI запускає чотири нові моделі, зокрема GPT-5.5 Instant, протягом 48 годин після релізу OpenAI

B.AI API запустив чотири нові моделі: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 і GLM-5.1. GPT-5.5 Instant завершив базову адаптацію та інтеграцію інтерфейсу протягом 48 годин після релізу OpenAI, забезпечивши доступ без затримок до

GateNews2год тому

Модель медичної AI від Tether на 1,7 млрд перевершила сьогодні конкурента у 16 разів більшого розміру

За даними AI-дослідницької команди Tether, сьогодні компанія запустила медичні мовні моделі серії QVAC MedPsy, створені для локального розгортання на смартфонах і носимих пристроях без залежності від хмари. Версія з 1,7 млрд параметрів набрала 62,62 на семи медичних бенчмарках, перевершивши Google MedGemma-4B

GateNews3год тому
Прокоментувати
0/400
Немає коментарів