عند تصفح مجتمعات التواصل غالبًا ما أرى مناقشات حول الذكاء الاصطناعي على السلسلة، لكن معظم المشاركات تركز على مدى تقدم النماذج وسرعة الاستنتاج. بصراحة، هذه الآراء تخرج عن الموضوع.
المشكلة الحقيقية في الذكاء الاصطناعي على السلسلة ليست في الخوارزميات أو الأجهزة، بل في مكان وكيفية تخزين البيانات. تخيل: عندما يعمل تطبيق ذكاء اصطناعي على السلسلة، أين يجب أن تُخزن النتائج الوسيطة، وسجلات الاستنتاج، ومجموعات بيانات التدريب؟ كيف نضمن أن البيانات يمكن استدعاؤها في أي وقت، وأنها لا تُعدّل أو تُفقد؟ هذه هي النقطة الحاسمة التي تحدد نجاح أو فشل المشروع بأكمله.
مؤخرًا، اطلعت على بعض الحلول التقنية لمشاريع ناشئة، ووجدت شيئًا مثيرًا للاهتمام. أحد المشاريع يتبع نهجًا وهو — عند تخزين أي ملف، يتم تلقائيًا تقسيمه إلى أكثر من 10 أجزاء من البيانات، وتُخزن هذه الأجزاء موزعة على عقد مختلفة. قد يبدو هذا الرقم عشوائيًا، لكنه في الواقع محسوب بعناية: مما يعني أن فشل نقطة واحدة يكاد يكون غير مؤثر على النظام.
بالنسبة لتطبيقات الذكاء الاصطناعي على السلسلة، هذه الآلية مهمة جدًا. البيانات المؤقتة الضخمة الناتجة أثناء تدريب النماذج (وغالبًا تكون بحجم تيرابايتات)، إذا كانت مخزنة على خادم مركزي تقليدي، فإن فشل الخادم يعني كارثة حتمية. لكن باستخدام هذا الهيكل الموزع، تكون البيانات مدمجة بشكل طبيعي في الشبكة بأكملها، مما يمنحها قدرة مقاومة للمخاطر بشكل فطري. من حيث المفهوم، يشبه الأمر بنية تحتية مخصصة لتمكين تشغيل طويل الأمد للذكاء الاصطناعي على السلسلة.
البيانات الإحصائية الفعلية تظهر الأمر بشكل أوضح. تظهر بيانات التخزين الأخيرة أن أكثر من 30% من الطلبات ليست صورًا أو فيديوهات، بل مجموعات بيانات منظمة، وملفات نقاط النموذج، وحتى سجلات تنفيذ الاستنتاجات. هذا التغير في بنية البيانات يؤكد أن الذكاء الاصطناعي على السلسلة أصبح أحد التطبيقات الأساسية لبعض المشاريع. من يستطيع أن يجعل بنية تخزين البيانات أكثر استقرارًا وكفاءة، سيكون من المحتمل أن يتصدر هذا المسار غير المرئي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 18
أعجبني
18
9
إعادة النشر
مشاركة
تعليق
0/400
FOMOmonster
· منذ 1 س
أخيراً قال شخص ما شيئاً صحيحاً، تعبت حقاً من سماع هراء حول نماذج الضخ وقوة الحسابات. التخزين هو نقطة الضعف، كان يجب إعطاء هذا الأهمية منذ وقت طويل.
---
هذا نظام التخزين اللامركزي مذهل فعلاً، لكن المشكلة هل هناك فعلاً مشاريع يمكنها تحقيق التشغيل المستقر؟ لم أر حالات قابلة للدفاع بشكل خاص.
---
انتظر، 30% من الطلبات عبارة عن مجموعات بيانات وسجلات؟ من أين جاءت هذه البيانات، هل لديك مصدر؟ يبدو الأمر غريباً بعض الشيء.
---
أنت محق لكنني أشعر أنه لا يزال مثالياً جداً، المشاريع الفعلية لا تعمل بسلاسة بهذه الطريقة.
---
يبدو رائعاً تخزين بيانات بحجم TB موزعة، لكن هل يمكن فعلاً قبول التأخير والتكلفة؟ أم أنها حل نظري مثالي آخر.
---
الاختناق الحقيقي للذكاء الاصطناعي على السلسلة بالفعل ليس السرعة، هذا المنظور جديد جداً، يستحق البحث العميق.
---
10 شظايا موزعة للحفظ... أفهم هذه المنطق، لكن كفاءة الاستعادة؟ هل فكرت فقط في الكوارث ولم تفكر في سرعة الاستعلام الفعلية؟
شاهد النسخة الأصليةرد0
PrivacyMaximalist
· منذ 19 س
قول صحيح، الجميع يتحدث عن حجم معلمات النموذج وما إلى ذلك، لكنهم في الواقع لم يركزوا على النقطة الأساسية. التخزين وموثوقية البيانات هما المفتاح للبقاء حتى العام المقبل.
شاهد النسخة الأصليةرد0
OnChainArchaeologist
· 01-07 17:53
أخيرًا قال أحدهم ذلك بوضوح، بعد كل هذا الوقت لا تزال المسألة تتعلق بسرعة النموذج، إنه أمر مضحك
تفصيل تخزين 10 أجزاء بشكل موزع مذهل، هو حقًا فكرة البنية التحتية
30% من الطلبات هي مجموعات البيانات والسجلات، هذا الرقم يوضح كل شيء، من يحقق الاستقرار هو الذي يربح
شاهد النسخة الأصليةرد0
UnluckyLemur
· 01-07 17:51
في جوهر الأمر، التخزين هو الحصن الحقيقي للذكاء الاصطناعي على السلسلة، وكل من يبالغ في النماذج أو القدرة الحاسوبية يلهو فقط بنفسه
شاهد النسخة الأصليةرد0
PositionPhobia
· 01-07 17:51
إيه يا، تخزين البيانات فعلاً هو نقطة الألم التي تم تجاهلها، كلامك صحيح
في الواقع، لقد سئمت من تلك الأحاديث الفارغة عن النماذج والقدرات الحسابية، المفتاح هو ما إذا كانت البنية التحتية تستطيع تحمل الأمر
10+ منطق التخزين المشتت الموزع فعلاً ممتاز، فشل نقطة واحدة يجعل النظام غير فعال... هذا النهج في التصميم هو الفارق الحقيقي في التميز في المجال
30% من الحركة تتجه من الصور إلى مجموعات البيانات ونقاط فحص النماذج، والكلام عن البيانات فعلاً قوي
منافسة البنية التحتية للتخزين > منافسة الخوارزميات، وأنا أوافق على هذا الحكم
شاهد النسخة الأصليةرد0
ZenZKPlayer
· 01-07 17:48
صحيح، في البداية كنت أيضاً منحرفاً عن نقاشات معاملات النموذج وسرعة الاستدلال، والآن فقط أدركت أن التخزين هو الملك الحقيقي
منطق التخزين اللامركزي فعلاً عبقري، تفصيل الـ 10 أجزاء موزعة على العُقد فكرة مدروسة جداً، مما يلغي تماماً مشكلة نقطة الفشل الواحدة
البيانات هي نقطة ضعف الذكاء الاصطناعي على السلسلة، لم أكن أتوقع أن يصل 30% من الطلبات بالفعل إلى البيانات المنظمة، السرعة المتسارعة للنمو مثيرة للاهتمام فعلاً
هل قد يكون توقيت دخول مسار التخزين الآن متأخراً جداً...؟
شاهد النسخة الأصليةرد0
ponzi_poet
· 01-07 17:36
أوه أخيرًا قال أحدهم النقطة الأساسية، التخزين هو فعلاً نقطة الضعف الحقيقية
التخزين الموزع فعلاً قوي، تصميم توزيع 10 أجزاء على عقدة منفصلة يستحق الإعجاب
عندما يتعطل الخادم المركزي لبيانات بحجم تيرابايت، يكون الأمر كارثيًا، هذا الخطر كبير جدًا
30% من الطلبات هي مجموعات البيانات الهيكلية وملفات النماذج، هذه البيانات تشرح كل شيء
المشاريع التي تبني أساس التخزين بأكثر استقرار وكفاءة لديها فرصة للتفوق في منحنى الانعطاف
شاهد النسخة الأصليةرد0
ReverseTradingGuru
· 01-07 17:34
تم الإمساك به، تخزين البيانات هو العقبة الحقيقية، أولئك الذين يروجون لسرعة النموذج يخلقون ضجيجًا.
شاهد النسخة الأصليةرد0
GateUser-6bc33122
· 01-07 17:29
حسنًا، أخيرًا هناك من يلمس النقطة الحساسة. الجميع يتحدث عن مدى روعة النموذج، لكنهم لا يدركون أن التخزين هو حقًا نقطة الضعف الحقيقية.
تقنية تخزين 10 أجزاء موزعة هي الأفضل، فهي تتجنب الأعطال المفردة بشكل كامل، ويمكنها استيعاب بيانات بحجم تيرابايت بسهولة.
30% من الطلبات هي بيانات منظمة، وهذا يدل على أن الذكاء الاصطناعي على السلسلة بدأ يأخذ الأمور على محمل الجد، ولم يعد مجرد مشروع عرض تقديمي.
من يثبت بنية تحتية للتخزين بشكل مستقر، هو الفائز النهائي.
عند تصفح مجتمعات التواصل غالبًا ما أرى مناقشات حول الذكاء الاصطناعي على السلسلة، لكن معظم المشاركات تركز على مدى تقدم النماذج وسرعة الاستنتاج. بصراحة، هذه الآراء تخرج عن الموضوع.
المشكلة الحقيقية في الذكاء الاصطناعي على السلسلة ليست في الخوارزميات أو الأجهزة، بل في مكان وكيفية تخزين البيانات. تخيل: عندما يعمل تطبيق ذكاء اصطناعي على السلسلة، أين يجب أن تُخزن النتائج الوسيطة، وسجلات الاستنتاج، ومجموعات بيانات التدريب؟ كيف نضمن أن البيانات يمكن استدعاؤها في أي وقت، وأنها لا تُعدّل أو تُفقد؟ هذه هي النقطة الحاسمة التي تحدد نجاح أو فشل المشروع بأكمله.
مؤخرًا، اطلعت على بعض الحلول التقنية لمشاريع ناشئة، ووجدت شيئًا مثيرًا للاهتمام. أحد المشاريع يتبع نهجًا وهو — عند تخزين أي ملف، يتم تلقائيًا تقسيمه إلى أكثر من 10 أجزاء من البيانات، وتُخزن هذه الأجزاء موزعة على عقد مختلفة. قد يبدو هذا الرقم عشوائيًا، لكنه في الواقع محسوب بعناية: مما يعني أن فشل نقطة واحدة يكاد يكون غير مؤثر على النظام.
بالنسبة لتطبيقات الذكاء الاصطناعي على السلسلة، هذه الآلية مهمة جدًا. البيانات المؤقتة الضخمة الناتجة أثناء تدريب النماذج (وغالبًا تكون بحجم تيرابايتات)، إذا كانت مخزنة على خادم مركزي تقليدي، فإن فشل الخادم يعني كارثة حتمية. لكن باستخدام هذا الهيكل الموزع، تكون البيانات مدمجة بشكل طبيعي في الشبكة بأكملها، مما يمنحها قدرة مقاومة للمخاطر بشكل فطري. من حيث المفهوم، يشبه الأمر بنية تحتية مخصصة لتمكين تشغيل طويل الأمد للذكاء الاصطناعي على السلسلة.
البيانات الإحصائية الفعلية تظهر الأمر بشكل أوضح. تظهر بيانات التخزين الأخيرة أن أكثر من 30% من الطلبات ليست صورًا أو فيديوهات، بل مجموعات بيانات منظمة، وملفات نقاط النموذج، وحتى سجلات تنفيذ الاستنتاجات. هذا التغير في بنية البيانات يؤكد أن الذكاء الاصطناعي على السلسلة أصبح أحد التطبيقات الأساسية لبعض المشاريع. من يستطيع أن يجعل بنية تخزين البيانات أكثر استقرارًا وكفاءة، سيكون من المحتمل أن يتصدر هذا المسار غير المرئي.