Соревнование моделей ИИ: кто сможет выиграть битву за безопасность смарт-контрактов Web3?

robot
Генерация тезисов в процессе

2026 год приближается, и область безопасности ИИ также принесла серьёзное испытание — LISABench объявила о запуске масштабной оценки в первом квартале. На этот раз это не упражнение, а реальный тест того, какие модели ИИ лучше всего обнаруживают уязвимости в смарт-контрактах Web3.

Если посмотреть на этот список участников, это просто «команда мечты» в глобальной сфере ИИ: KIMI K2, DeepSeek V3.2, QWen 3, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5 и семь передовых моделей соревнуются на одной сцене. От отечественных Moonshot, Deep Search, Alibaba и Zhipu до зарубежных OpenAI, Google и Anthropic — освещение этого обзора роскошное.

Самое интересное — LISABench также играет с взаимодействием с сообществом. Открывается канал голосования прогнозов, позволяющий пользователям заранее делать ставки на победителя. В то же время стандартная кодовая база оценки является открытой, что позволяет разработчикам самостоятельно проверять результаты, что считается серьёзным в отрасли.

Для тех, кто обеспокоен безопасностью Web3 и прогрессом в области ИИ, результаты оценки могут дать вопросы о том, какие модели подходят для роли судебно-медицинских экспертов по смарт-контрактам. Результаты первого квартала скоро станут ясны.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 10
  • Репост
  • Поделиться
комментарий
0/400
GasDevourervip
· 01-08 04:15
Глубокий поиск действительно пришел с полным размахом, сможет ли V3.2 превзойти GPT-5.2? DeepSeek снова собирается встряхнуть рынок, и это именно тот ритм, который мне нравится. Аудит контрактов — отечественные модели действительно нельзя недооценивать, это интересно. Все семь участвуют, посмотрим, кто будет наиболее устойчивым, ощущается, что будет очень кроваво. Если в этот раз DeepSeek победит в тестировании, OpenAI будет очень неловко. LISABench на этот раз серьезно, ждем сцен с провалом. Возможность для отечественных моделей подняться и гордиться, обязательно нужно следить.
Посмотреть ОригиналОтветить0
BakedCatFanboyvip
· 01-07 20:18
DeepSeek сможет ли на этот раз изменить свою судьбу, кажется, его слишком сильно расхваливали
Посмотреть ОригиналОтветить0
NftRegretMachinevip
· 01-07 11:05
Опять конкурс моделей AI, неужели на этот раз действительно можно понять, кто надежнее? Получится ли DeepSeek на этот раз переломить ситуацию? Состав отечественных моделей неплох, только неясно, как они работают на практике Подождем результатов, оценок и так достаточно В сфере проверки умных контрактов все же нужно смотреть на реальный послужной список безопасности Сможет ли GLM превзойти Claude? Я готов поспорить на пять юаней, что нет Если честно, все большие языковые модели хвастаются, а по-настоящему работающих единицы Из этих семи моделей две я даже не знал, Web3 сообщество действительно прогрессирует?
Посмотреть ОригиналОтветить0
WenMoon42vip
· 01-07 08:34
Эм, DeepSeek, на этот раз сможешь победить? Кажется, в стране модели в последнее время набирают обороты.
Посмотреть ОригиналОтветить0
ChainSpyvip
· 01-05 04:50
DeepSeek в этот раз сможет ли свергнуть GPT, кажется, что отечественные модели за эти два года действительно выросли
Посмотреть ОригиналОтветить0
MetaMaximalistvip
· 01-05 04:50
Честно говоря, это именно тот показатель устойчивости протокола, который нам нужен был уже много лет... но давайте будем честными, большинство из этих моделей, вероятно, столкнутся с тонкими векторами атак, которые понимают только ранние пользователи.
Посмотреть ОригиналОтветить0
UncleWhalevip
· 01-05 04:34
DeepSeek снова здесь, чтобы что-то сделать, сможет ли это действительно сработать на этот раз? --- Обнаружение уязвимостей контракта? Говоря прямо, всё зависит от того, чья модель умнее — сможет ли DeepSeek перевернуть эту волну, ха-ха? --- Семь больших моделей перекатываются друг в друга, я просто хочу увидеть, кто в итоге будет раскрыт... --- Постойте, можно ли сравнивать отечественные модели с GPT5? Эта временная линия довольно быстрая --- Это ещё одна гонка вооружений, и в итоге именно команды занимаются безопасностью --- Вопрос в том, что DeepSeek — самый стабильный вариант, и все остальные сопровождаются --- Безопасность Web3 недостаточна только ИИ — для надёжности необходима человеческая проверка --- Сколько нам ещё придётся ждать, пока выйдет результат оценки... Можешь поторопиться, я спешу.»
Посмотреть ОригиналОтветить0
bridge_anxietyvip
· 01-05 04:26
deepseek в этот раз сможет ли придумать что-нибудь новенькое
Посмотреть ОригиналОтветить0
MetaverseMortgagevip
· 01-05 04:25
DeepSeek снова появился, на этот раз посмотрим, сможет ли он действительно решить проблему уязвимостей контрактов Этот состав действительно довольно мощный, но как он покажет себя на практике, еще предстоит увидеть по данным Наконец-то кто-то решился провести настоящий стресс-тест этих моделей, жду результатов Честно говоря, в области безопасности Web3 эти AI-модели пока что не очень надежны, буду ждать посмеяться Битва между KIMI и Claude должна быть интересной, поставлю пять долларов, что Claude сломается А это... семь моделей одновременно, ощущение как в большой битве, немного хаотично Безопасность контрактов — полагаться только на AI для обнаружения недостатков недостаточно, нужен ручной аудит в качестве страховки Отечественные модели наконец-то могут соревноваться в этом сегменте, немного интересно Правда? Уже вышел GPT-5.2? Почему я ничего не слышал? LISABench хорошо прорекламировали, популярность обеспечена
Посмотреть ОригиналОтветить0
Подробнее
  • Закрепить