Исследователи предложили технологию DPN-LE: возможность напрямую редактировать «личностные нейроны» больших моделей, обеспечивая тонкую настройку характера ИИ.

robot
Генерация тезисов в процессе

BlockBeats Новости, 3 мая, исследователь ИИ Брайан Роэммел сообщил, что его «Компания без человека (Zero-Human Company)» начала внедрять технологию редактирования личности крупной модели под названием DPN-LE (Dual Personality Neuron Localization and Editing), предназначенную для точной настройки поведенческих характеристик AI-агента.

По его словам, DPN-LE с помощью локализации «личностных нейронов» в слоях MLP крупной модели может целенаправленно усиливать или ослаблять такие характеристики, как «честность, креативность, осторожность, сотрудничество». Исследование показывает, что для этого достаточно отредактировать около 0,5% нейронов, что позволяет без повторного обучения модели осуществлять «хирургическую» корректировку характера AI, при этом минимизируя ущерб основным способностям рассуждения.

Роэммел отметил, что его компания в настоящее время состоит из более чем 100 AI-агентов, и их ежедневная деятельность практически полностью автоматизирована, поэтому «последовательность личности» становится ключевым вопросом. Например:

Стратегические агенты усиливают «долгосрочную согласованность» и «аналитическую честность»
Финансовые и риск-менеджмент агенты усиливают «осторожность» и «точность»
Контент-агенты повышают «эмпатию» и «креативность»
Многослойный уровень сотрудничества агентов усиливает «кооперативность»

Он заявил, что поскольку DPN-LE относится к легковесным модификациям на этапе рассуждения, компания может за несколько минут массово «переформировать личности» и развернуть множество AI-агентов, значительно снизив затраты на выравнивание (Alignment). Рынок считает, что эта технология «программируемой личности» означает, что AI-агенты переходят от простого конкурирования способностей к более глубокому контролю поведения и управлению организацией.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить