PANews сообщил 27 февраля, что, согласно Cointelegraph, открытая лаборатория ИИ Sentient объявила о запуске Arena — тестовой среды производственного уровня для оценки эффективности AI-агентов в корпоративных рабочих процессах. Подразделения цифровых активов Pantera Capital и Franklin Templeton присоединились к первому тестовому набору Arena.
Sentient отметил, что Arena — это не статический тест, а тестирует агента ИИ на стандартизированной задаче, моделируя корпоративные условия с помощью длинных документов, неполной информации и противоречивых источников. Платформа отслеживает категории отказов, такие как галлюцинации, отсутствующие доказательства, ошибки цитирования и уязвимости рассуждения, чтобы помочь разработчикам диагностировать проблемы. Arena планирует публиковать сравнительные показатели производительности через публичные таблицы лидеров и публиковать отчёты по тестам, обобщающие распространённые паттерны отказов и исправления.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Renaiss发布BETA 2.0路线图,推出AI子品牌Auranaiss Intelligence并启动Hackathon
Renaiss Protocol выпустил 3 марта дорожную карту BETA 2.0, объявил о полном обновлении, запуске AI-лаборатории Auranaiss Intelligence и модуля открытых возможностей. В апреле состоится Hackathon для привлечения разработчиков, первый экологический проект What's Your References уже начал тестирование, а также совместно с Collector Crypt запустил совместный пакет карт, в настоящее время накоплено 220 000 пользователей и объем торгов в 4 миллиона долларов.
GateNews1ч назад
Обновление сообщества Shiba Inu: Запуск нового навыка ShibClaw с предупреждением — U.Today
Навык ShibClaw направлен на развитие экосистемы Shiba Inu путем внедрения AI-агентов, автоматизирующих задачи в блокчейне Shibarium. Он подчеркивает важность сотрудничества сообщества и включает необходимые инструменты для взаимодействия с сетью, одновременно призывая пользователей быть осторожными в отношении мошенничества.
UToday2ч назад
Инструмент восстановления токенов BNB Beacon Chain переходит в финальную фазу: что должны знать держатели BEP2
Инструмент восстановления токенов BNB Beacon Chain сейчас находится в первой фазе своего завершения, и обработка за 7 дней будет доступна только до 30 апреля.
Восстановлению подлежат только зеркальные токены BEP2; держатели незеркальных активов рискуют навсегда их потерять.
BNB Chain начал поэтапное отключение BNB Beacon
CryptoNewsFlash3ч назад
Платформа Spark для кредитования запускает программу выкупа токенов SPK, уже выкуплено 1,84 миллиона монет
Согласно мониторингу аналитика блокчейна Юйцзиня, платформа кредитования Spark 5 марта перевела на новый мультиподписной кошелек 570 000 USDS, запустив программу выкупа токенов SPK. Уже выкуплено 1,84 миллиона SPK на сумму примерно 36 000 долларов США. План выкупа рассчитан на 12 месяцев, с ежемесячным выделением 10% средств для выкупа.
GateNews3ч назад