AIモデル対決：誰がWeb3スマートコントラクトのセキュリティ戦争に勝つのか？

Question

2026年がやって来る中、AIセキュリティ分野も大きな試練を迎えました。LISABenchは第1四半期に大規模な評価を開始すると発表しました。今回は単なる演習ではなく、どのAIモデルがWeb3スマートコントラクトの脆弱性検出に最も優れているかを実際に試すテストです。

このエントリーリストを見ると、グローバルAI分野の「ドリームチーム」と言えるでしょう。KIMI K2、DeepSeek V3.2、QWen 3、GLM 4.6、GPT-5.2、Gemini-3-pro-preview、Claude 4.5、そして7つの最先端モデルが同じステージで競い合っています。国内のMoonshot、Deep Search、Alibaba、Zhipuから海外のOpenAI、Google、Anthropicまで、このレビューの報道は豪華です。

最も興味深いのは、LISABenchがコミュニティとの交流にも取り組んでいることです。予測投票チャンネルが開放され、ユーザーは事前に誰が勝つか賭けることができます。同時に、評価標準のコードベースはオープンソース化されており、開発者自身が結果を検証できることは業界で重要な課題とされています。

Web3のセキュリティやAIの進歩に懸念がある方にとって、この評価結果はどのモデルがスマートコントラクトの「検死官」として適しているかについていくつかの疑問を示唆しています。第1四半期の結果はまもなく明らかになるはずです。

GasDevourer · Accepted Answer

DeepSeekが今回は本当に勢いよく来ているね、V3.2がGPT-5.2に対抗できるのか？

DeepSeekがまた波乱を起こそうとしている、これが私が好む流れだ

スマートコントラクト監査のこの分野で、国内モデルは本当に侮れない、なかなか面白い

7つ全部投入して、誰が最も耐久性があるかを見る、かなり激しい戦いになりそう

今回の評価でDeepSeekが勝ったら、OpenAIは面目丸つぶれだ

LISABenchは今回本気を出した、転落の名場面を待ち構えている

国内モデルが面目を施す機会が来た、必ず注視しなければならない

BakedCatFanboy · Answer

DeepSeekこの次は巻き返せるかどうか、ちょっと煽りすぎた感じがしますね

NftRegretMachine · Answer

また、AIモデルの決闘大会ですな。今回は本当に誰が信頼できるか見分けられますかね？

DeepSeekこの回は逆転できるんでしょうか？

国産モデルのこのラインアップはまあまあですが、実際のところどうなのか分からないですね

結果が出るまで待ちましょう。評価はいくらでもありますからね

スマートコントラクト検出に関しては、実際の金を使ったセキュリティ記録を見る必要がありますね

GLMはClaudeを超えられるんでしょうか。私は5ドル賭けて無理だと思います

本当のところ、大規模言語モデルはみんな大げさに言ってるし、実際に使えるものはほとんどないですね

この7つのモデルの中で2つは聞いたことがないし、Web3圏は本当に進歩したんでしょうか

WenMoon42 · Answer

呃DeepSeekこの次は勝てるかな、最近国内のモデルが勢いを増している気がするね

ChainSpy · Answer

DeepSeekは今回GPTを倒せるかどうか、国内のモデルはこの2年で本当に成長したと感じます

MetaMaximalist · Answer

ngl これは私たちが何年も必要としていたまさにそのようなプロトコルの持続可能性ベンチマークです... でも正直に言うと、これらのモデルのほとんどは、最初の採用者だけが理解している微妙な攻撃ベクトルに苦労すると思います。

UncleWhale · Answer

DeepSeekは再び何かをやってきましたが、今回は本当にうまくいくのでしょうか?

---

契約の脆弱性検出? 率直に言えば、どちらのモデルが賢いかによりますが、DeepSeekはこの波を乗り越えられるのでしょうか(笑)。

---

7人の大型モデルがお互いにロールし合う、最後に誰が露出するか見たいだけだ...

---

待って、家庭用モデルもGPT5と比較できるのでしょうか? このタイムラインは少し早いですね

---

これはまた別の軍拡競争であり、最終的に本当にセキュリティを担うのはチームです

---

問題は、DeepSeekが最も安定していて、他のすべてが同行していることです

---

Web3のセキュリティだけでAIだけでは十分ではなく、信頼できるためには人間の審査が必要です

---

この評価結果が出るまでどれくらい待てばいいんだ... 急いでくれない?急いでるんだ。」

bridge_anxiety · Answer

deepseekこの機会に何か工夫を見せてくれませんか

MetaverseMortgage · Answer

DeepSeekは再び登場し、今回は本当に契約の脆弱性を解決できるかどうかを試しています

このラインナップはかなり冷酷ですが、実際の運営方法はデータによります

ついに、誰かがこれらのモデルに対して本格的なストレステストを行い、結果を期待しました

正直なところ、Web3のセキュリティに関するAIモデルはまだ信頼性に欠けており、ジョークを待っている状態です

KIMIとクロードの対戦は面白いはずだ。クロードが覆すのに5ドル賭けてみよう

ああ... 7人のモデルが一緒になると、まるで大きな乱闘のようで、少し散らかっている感じがします

契約のセキュリティだけではAI検知に頼るには不十分で、それでも手作業で監査してふいごをバラストする必要があります

国内モデルもついにこのコースで同じステージに立つことができ、楽しみにしています

GPT-5.2はもう使えないというのは本当ですか、それとも間違いでしょうか? なぜ聞いたことがないのか?

LISABenchはこのマーケティングの波で良い仕事をしており、その人気も相応しいです

AIモデル対決：誰がWeb3スマートコントラクトのセキュリティ戦争に勝つのか？

人気の話題

GateFun马勒戈币Surges1251.09%

GateSquareCreatorNewYearIncentives

NonfarmPayrollsComing

DailyMarketOverview

IstheMarketBottoming?

人気の Gate Fun

WCNMB

卧槽尼马币

芝麻管理员

芝麻管理员

一马当仙

一马当仙

sbb

煞笔币

强势出击

强势出击

ピン