AIモデル対決:誰がWeb3スマートコントラクトのセキュリティ戦争に勝つのか?

robot
概要作成中

2026年がやって来る中、AIセキュリティ分野も大きな試練を迎えました。LISABenchは第1四半期に大規模な評価を開始すると発表しました。 今回は単なる演習ではなく、どのAIモデルがWeb3スマートコントラクトの脆弱性検出に最も優れているかを実際に試すテストです。

このエントリーリストを見ると、グローバルAI分野の「ドリームチーム」と言えるでしょう。KIMI K2、DeepSeek V3.2、QWen 3、GLM 4.6、GPT-5.2、Gemini-3-pro-preview、Claude 4.5、そして7つの最先端モデルが同じステージで競い合っています。 国内のMoonshot、Deep Search、Alibaba、Zhipuから海外のOpenAI、Google、Anthropicまで、このレビューの報道は豪華です。

最も興味深いのは、LISABenchがコミュニティとの交流にも取り組んでいることです。 予測投票チャンネルが開放され、ユーザーは事前に誰が勝つか賭けることができます。 同時に、評価標準のコードベースはオープンソース化されており、開発者自身が結果を検証できることは業界で重要な課題とされています。

Web3のセキュリティやAIの進歩に懸念がある方にとって、この評価結果はどのモデルがスマートコントラクトの「検死官」として適しているかについていくつかの疑問を示唆しています。 第1四半期の結果はまもなく明らかになるはずです。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 10
  • リポスト
  • 共有
コメント
0/400
GasDevourervip
· 01-08 04:15
DeepSeekが今回は本当に勢いよく来ているね、V3.2がGPT-5.2に対抗できるのか? DeepSeekがまた波乱を起こそうとしている、これが私が好む流れだ スマートコントラクト監査のこの分野で、国内モデルは本当に侮れない、なかなか面白い 7つ全部投入して、誰が最も耐久性があるかを見る、かなり激しい戦いになりそう 今回の評価でDeepSeekが勝ったら、OpenAIは面目丸つぶれだ LISABenchは今回本気を出した、転落の名場面を待ち構えている 国内モデルが面目を施す機会が来た、必ず注視しなければならない
原文表示返信0
BakedCatFanboyvip
· 01-07 20:18
DeepSeekこの次は巻き返せるかどうか、ちょっと煽りすぎた感じがしますね
原文表示返信0
NftRegretMachinevip
· 01-07 11:05
また、AIモデルの決闘大会ですな。今回は本当に誰が信頼できるか見分けられますかね? DeepSeekこの回は逆転できるんでしょうか? 国産モデルのこのラインアップはまあまあですが、実際のところどうなのか分からないですね 結果が出るまで待ちましょう。評価はいくらでもありますからね スマートコントラクト検出に関しては、実際の金を使ったセキュリティ記録を見る必要がありますね GLMはClaudeを超えられるんでしょうか。私は5ドル賭けて無理だと思います 本当のところ、大規模言語モデルはみんな大げさに言ってるし、実際に使えるものはほとんどないですね この7つのモデルの中で2つは聞いたことがないし、Web3圏は本当に進歩したんでしょうか
原文表示返信0
WenMoon42vip
· 01-07 08:34
呃DeepSeekこの次は勝てるかな、最近国内のモデルが勢いを増している気がするね
原文表示返信0
ChainSpyvip
· 01-05 04:50
DeepSeekは今回GPTを倒せるかどうか、国内のモデルはこの2年で本当に成長したと感じます
原文表示返信0
MetaMaximalistvip
· 01-05 04:50
ngl これは私たちが何年も必要としていたまさにそのようなプロトコルの持続可能性ベンチマークです... でも正直に言うと、これらのモデルのほとんどは、最初の採用者だけが理解している微妙な攻撃ベクトルに苦労すると思います。
原文表示返信0
UncleWhalevip
· 01-05 04:34
DeepSeekは再び何かをやってきましたが、今回は本当にうまくいくのでしょうか? --- 契約の脆弱性検出? 率直に言えば、どちらのモデルが賢いかによりますが、DeepSeekはこの波を乗り越えられるのでしょうか(笑)。 --- 7人の大型モデルがお互いにロールし合う、最後に誰が露出するか見たいだけだ... --- 待って、家庭用モデルもGPT5と比較できるのでしょうか? このタイムラインは少し早いですね --- これはまた別の軍拡競争であり、最終的に本当にセキュリティを担うのはチームです --- 問題は、DeepSeekが最も安定していて、他のすべてが同行していることです --- Web3のセキュリティだけでAIだけでは十分ではなく、信頼できるためには人間の審査が必要です --- この評価結果が出るまでどれくらい待てばいいんだ... 急いでくれない?急いでるんだ。」
原文表示返信0
bridge_anxietyvip
· 01-05 04:26
deepseekこの機会に何か工夫を見せてくれませんか
原文表示返信0
MetaverseMortgagevip
· 01-05 04:25
DeepSeekは再び登場し、今回は本当に契約の脆弱性を解決できるかどうかを試しています このラインナップはかなり冷酷ですが、実際の運営方法はデータによります ついに、誰かがこれらのモデルに対して本格的なストレステストを行い、結果を期待しました 正直なところ、Web3のセキュリティに関するAIモデルはまだ信頼性に欠けており、ジョークを待っている状態です KIMIとクロードの対戦は面白いはずだ。クロードが覆すのに5ドル賭けてみよう ああ... 7人のモデルが一緒になると、まるで大きな乱闘のようで、少し散らかっている感じがします 契約のセキュリティだけではAI検知に頼るには不十分で、それでも手作業で監査してふいごをバラストする必要があります 国内モデルもついにこのコースで同じステージに立つことができ、楽しみにしています GPT-5.2はもう使えないというのは本当ですか、それとも間違いでしょうか? なぜ聞いたことがないのか? LISABenchはこのマーケティングの波で良い仕事をしており、その人気も相応しいです
原文表示返信0
もっと見る
  • ピン