عام 2026 قادم، وقد شهد مجال أمن الذكاء الاصطناعي أيضا اختبارا كبيرا - حيث أعلنت LISABench عن إطلاق تقييم ضخم في الربع الأول. هذه المرة ليست مجرد تمرين، بل اختبار حقيقي لنماذج الذكاء الاصطناعي التي هي الأفضل في اكتشاف الثغرات في عقود الويب 3 الذكية.
عند النظر إلى هذه القائمة من المشاركين، تجد أنه ببساطة “فريق أحلام” في مجال الذكاء الاصطناعي العالمي: KIMI K2، DeepSeek V3.2، QWen 3، GLM 4.6، GPT-5.2، Gemini-3-pro-preview، Claude 4.5، وسبعة نماذج متقدمة تتنافس على نفس المنصة. من Moonshot المحلية، Deep Search، Alibaba، وZhipu إلى OpenAI وGoogle وAnthropic في الخارج، فإن تغطية هذه المراجعة فاخرة.
الأمر الأكثر إثارة للاهتمام هو أن LISABench تلعب أيضا مع التفاعل المجتمعي. يتم فتح قناة التصويت التنبؤية، مما يسمح للمستخدمين بالمراهنة مسبقا على من سيفوز. وفي الوقت نفسه، فإن قاعدة الشيفرة القياسية للتقييم مفتوحة المصدر، مما يسمح للمطورين بالتحقق من النتائج بأنفسهم، وهو أمر يعتبر أمرا جديا في الصناعة.
بالنسبة لأولئك المهتمين بتقدم أمان الويب 3 والذكاء الذكاء الاصطناعي، يمكن أن تطرح نتائج هذا التقييم بعض الأسئلة حول النماذج المناسبة لتكون “فاحصين طبيين” للعقود الذكية. يجب أن تكون نتائج الربع الأول واضحة قريبا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 13
أعجبني
13
10
إعادة النشر
مشاركة
تعليق
0/400
GasDevourer
· 01-08 04:15
عمق البحث هذه المرة حقًا جاء بقوة، هل يمكن لـ V3.2 أن يتفوق على GPT-5.2؟
DeepSeek على وشك إحداث ضجة مرة أخرى، هذا هو الإيقاع الذي أفضله
في مجال تدقيق العقود، النماذج المحلية حقًا لا يمكن الاستهانة بها، هناك شيء مثير للاهتمام
جميعها السبعة، لنرى من سيكون الأكثر مقاومة، يبدو أنه سيكون دمويًا جدًا
إذا فاز DeepSeek في هذا التقييم، فإن OpenAI ستشعر بالإحراج الشديد
LISABench هذه المرة ستلعب بجدية، انتظروا لرؤية مشاهد الانهيار
فرصة النهوض بالنماذج المحلية قد حانت، يجب الانتباه
شاهد النسخة الأصليةرد0
BakedCatFanboy
· 01-07 20:18
هل يمكن لـ DeepSeek أن يحقق انتصارًا هذه المرة؟ أشعر أنه تم المبالغة في تقديره بعض الشيء
شاهد النسخة الأصليةرد0
NftRegretMachine
· 01-07 11:05
إنها مباراة نماذج ذكية أخرى مرة أخرى، هل يمكننا حقاً أن نرى من هو موثوق به هذه المرة؟
هل يمكن لـ DeepSeek أن يعود هذه المرة؟
الترتيب الوطني للنماذج جيد، لكن لا أعرف كيف سيكون الأداء الفعلي
دعنا ننتظر النتائج، هناك الكثير من التقييمات بالفعل
في مجال كشف العقود الذكية، يجب أن ننظر إلى سجل الأمان الفعلي
هل يمكن لـ GLM أن يتجاوز Claude؟ أراهن بخمسة دولارات على أنه لن يتمكن
بصراحة، جميع النماذج الكبيرة تتفاخر، والقليل جداً منها قابل للاستخدام فعلاً
في هذه المجموعة السبع، هناك نموذجان لم أسمع عنهما من قبل، هل تقدمت دائرة Web3 حقاً؟
شاهد النسخة الأصليةرد0
WenMoon42
· 01-07 08:34
هل يمكن لـ DeepSeek هذه المرة أن ينجح، أعتقد أن النموذج المحلي يحقق نجاحًا مؤخرًا
شاهد النسخة الأصليةرد0
ChainSpy
· 01-05 04:50
هل يمكن لـ DeepSeek هذه المرة أن يطيح بـ GPT، أشعر أن النماذج المحلية قد تطورت حقًا خلال العامين الماضيين
شاهد النسخة الأصليةرد0
MetaMaximalist
· 01-05 04:50
صراحة، هذا هو بالضبط نوع معيار استدامة البروتوكول الذي كنا بحاجة إليه لسنوات... لكن دعني أكون صريحًا، معظم هذه النماذج على الأرجح ستواجه صعوبة مع أساليب الهجوم الدقيقة التي يفهمها فقط المستخدمون الأوائل.
شاهد النسخة الأصليةرد0
UncleWhale
· 01-05 04:34
DeepSeek又来搞事情了,这次真的能行吗?
---
عقد الثغرات الأمنية؟ بصراحة، الأمر يعتمد على من يمتلك النموذج الأذكى، هل ستتمكن DeepSeek من الانتصار هذه المرة؟ هاها
---
سبعة نماذج كبيرة تتنافس مع بعضها البعض، وأنا فقط أريد أن أرى من سيتم الكشف عن وجود مشكلة فيه في النهاية...
---
انتظر، هل يمكن لنماذج محلية أن تتنافس مع GPT5؟ هذا الجدول الزمني سريع جدًا
---
مرة أخرى، إنها سباق تسلح، والمستفيد الأخير هو تلك الفرق التي تعمل على الأمان حقًا، أليس كذلك؟
---
السؤال هو أن DeepSeek هو الأكثر استقرارًا، والبقية مجرد مرافقة
---
الأمان في Web3 لا يكفي فقط بالذكاء الاصطناعي، بل يحتاج أيضًا إلى مراجعة بشرية ليكون موثوقًا
---
كم من الوقت سيستغرق ظهور نتائج هذا التقييم... هل يمكن أن يكون أسرع؟ أنا متوتر جدًا
شاهد النسخة الأصليةرد0
bridge_anxiety
· 01-05 04:26
هل يمكن لـ deepseek أن يقدم شيئًا جديدًا هذه المرة؟
شاهد النسخة الأصليةرد0
MetaverseMortgage
· 01-05 04:25
ديب سيك هنا مرة أخرى، هذه المرة ليرى ما إذا كان بإمكانه حقا حل ثغرة العقد
هذه التشكيلة قاسية بعض الشيء، لكن كيف تعمل فعليا تعتمد على البيانات
أخيرا، تجرأ أحدهم على إجراء اختبار ضغط حقيقي على هذه النماذج، متوقعا نتائج
بصراحة، نموذج الذكاء الاصطناعي لأمن الويب 3 لا يزال غير موثوق، ينتظر رؤية النكتة
كيمي وكلود يجب أن يكونا مثيرين للقتال، راهن بخمسة دولارات على أن يقلب كلود
آه... سبعة نماذج معا، يشعرني الأمر وكأنه شجار كبير، وفوضوي بعض الشيء
أمان العقود ليس كافيا للاعتماد على اكتشاف الذكاء الاصطناعي، بل يجب تدقيقه يدويا لوضع النفاخ
يمكن للعارضات المحليات أخيرا أن يكونوا على نفس المسرح في هذا المسار، وأنا متحمس لذلك
هل هذا صحيح أم خطأ، GPT-5.2 خارج اللعبة؟ لماذا لم أسمع عنها؟
لقد قامت LISABench بعمل جيد في هذه الموجة التسويقية، والشعبية بالفعل
مواجهة نماذج الذكاء الاصطناعي: من سيفوز بمعركة أمان العقود الذكية في Web3؟
عام 2026 قادم، وقد شهد مجال أمن الذكاء الاصطناعي أيضا اختبارا كبيرا - حيث أعلنت LISABench عن إطلاق تقييم ضخم في الربع الأول. هذه المرة ليست مجرد تمرين، بل اختبار حقيقي لنماذج الذكاء الاصطناعي التي هي الأفضل في اكتشاف الثغرات في عقود الويب 3 الذكية.
عند النظر إلى هذه القائمة من المشاركين، تجد أنه ببساطة “فريق أحلام” في مجال الذكاء الاصطناعي العالمي: KIMI K2، DeepSeek V3.2، QWen 3، GLM 4.6، GPT-5.2، Gemini-3-pro-preview، Claude 4.5، وسبعة نماذج متقدمة تتنافس على نفس المنصة. من Moonshot المحلية، Deep Search، Alibaba، وZhipu إلى OpenAI وGoogle وAnthropic في الخارج، فإن تغطية هذه المراجعة فاخرة.
الأمر الأكثر إثارة للاهتمام هو أن LISABench تلعب أيضا مع التفاعل المجتمعي. يتم فتح قناة التصويت التنبؤية، مما يسمح للمستخدمين بالمراهنة مسبقا على من سيفوز. وفي الوقت نفسه، فإن قاعدة الشيفرة القياسية للتقييم مفتوحة المصدر، مما يسمح للمطورين بالتحقق من النتائج بأنفسهم، وهو أمر يعتبر أمرا جديا في الصناعة.
بالنسبة لأولئك المهتمين بتقدم أمان الويب 3 والذكاء الذكاء الاصطناعي، يمكن أن تطرح نتائج هذا التقييم بعض الأسئلة حول النماذج المناسبة لتكون “فاحصين طبيين” للعقود الذكية. يجب أن تكون نتائج الربع الأول واضحة قريبا.