22 ديسمبر 2025 – أعلنت قسم أبحاث الذكاء الاصطناعي في بيانات تيثر، QVAC، اليوم عن إصدار QVAC Genesis II، وهو توسعة كبيرة لأكبر مجموعة بيانات تعليمية صناعية متاحة علنًا للتدريب المسبق على الذكاء الاصطناعي. مع إضافة 107 مليار رمز جديد، أصبح إجمالي مجموعة بيانات QVAC Genesis الآن 148 مليار رمز عبر 19 مجالًا تعليميًا، مما يوسع بشكل كبير من حجم وعمق وجودة التفكير في بيانات التدريب المفتوحة للذكاء الاصطناعي. يبني QVAC Genesis II مباشرة على الأساس الذي وضعه QVAC Genesis I، الذي قدم مجموعة بيانات صناعية تعليمية مركزة تم التحقق من صحتها وتغطي تخصصات STEM الأساسية. يوسع الإصدار الثاني التغطية إلى 10 مجالات جديدة، بما في ذلك الكيمياء، علوم الحاسوب، الإحصاء، التعلم الآلي، الفلك، الجغرافيا، الاقتصاد القياسي، والهندسة الكهربائية، مع إعادة توليد الفيزياء على مستوى الكلية باستخدام منهجية محسنة. معًا، يشكل Genesis I وII أكبر مجموعة بيانات تعليمية صناعية شاملة تم إصدارها للجمهور على الإطلاق. في جوهر هذا الإصدار، توجد طريقة جديدة لتوليد البيانات تسمى Reasoning على مستوى الخيار، مصممة لاستخراج التفكير المنظم ليس فقط من إخفاقات النموذج، ولكن أيضًا من الإجابات الصحيحة. بدلاً من اعتبار الإجابات الصحيحة كمخرجات منتهية، تحلل هذه الطريقة بشكل منهجي كل خيار في سؤال الاختيار من متعدد، معززًا التفكير الصحيح ومعالجًا بشكل صريح المفاهيم الخاطئة الشائعة. النتيجة هي بيانات تدريب تركز على الوضوح، والسببية، واتخاذ القرار، وليس فقط الصحة السطحية. تكمل هذه الطريقة الجديدة طريقة تحليل الإخفاقات الأصلية التي تم تقديمها في Genesis I، مكونة خط أنابيب ذو طريقتين يضمن أن كل سؤال يتم توليده يضيف قيمة تعليمية. تظهر التقييمات المستقلة أن النماذج المدربة على بيانات Genesis II تظهر دقة تفكير أعلى بشكل كبير وتنتج إجابات واضحة وغير غامضة بشكل أكثر اتساقًا من النماذج المدربة على مجموعات البيانات الصناعية السابقة. أكثر من مجرد زيادة في الحجم، يعكس هذا الإصدار تحولًا متعمدًا في كيفية بناء بيانات الذكاء الاصطناعي التعليمية. بينما يركز الكثير من الصناعة على جمع وتكديس كميات أكبر من النصوص، فإن نهج QVAC مصمم لتعليم النماذج كيف تفكر، وتستدل، وتشرح، معتمدًا على الفهم بدلاً من التقليد. قال باولو أردوينو، الرئيس التنفيذي لشركة تيثر: “مع هذا الإصدار، ندفع إلى ما بعد الحجم نحو الهيكل، والتفكير، والوضوح. يجب أن يُبنى الذكاء على فهم سبب صحة شيء معين، وليس فقط التنبؤ بما يبدو صحيحًا. من خلال جعل مجموعة البيانات هذه مفتوحة، نمنح الباحثين والمطورين الأدوات لتطوير ذكاء اصطناعي أكثر موثوقية، وأكثر قابلية للتفسير، وفي النهاية أكثر فائدة للمجتمع.” كما هو الحال مع Genesis I، يتم إصدار مجموعة البيانات الموسعة بشكل مفتوح لدعم الباحثين والمؤسسات الأكاديمية والمطورين المستقلين الذين يعملون خارج الأنظمة المغلقة والملكية. وهي متاحة بموجب ترخيص Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0)، مما يعزز التزام QVAC بالبحث المفتوح والمجتمعي في مجال الذكاء الاصطناعي. يواصل الإصدار مهمة QVAC الأوسع لتعزيز الذكاء المحلي واللامركزي، حيث يمكن تدريب نماذج الذكاء الاصطناعي، وتحسينها، ونشرها دون الاعتماد على منصات السحابة المركزية. من خلال تقوية الأسس المفتوحة لبيانات تدريب الذكاء الاصطناعي، تهدف بيانات تيثر إلى تقليل الحواجز الهيكلية أمام الابتكار وضمان بقاء الذكاء عالي الجودة متاحًا للمجتمع البحثي العالمي. يتوفر الآن التحليل الفني الكامل لمجموعة البيانات، بعنوان “QVAC Genesis II: Expanding the Largest and Highest-Quality Multi-domain Educational Synthetic Dataset for Pre-training”، عبر مدونة أبحاث QVAC، بالإضافة إلى الوصول إلى مجموعة البيانات والنماذج على Hugging Face. لمزيد من المعلومات، بما في ذلك قسم الأسئلة الشائعة المفصل، يمكن زيارة موقع QVAC الإلكتروني.
تم نشر هذا المقال أصلاً بعنوان تيثر تصدر QVAC Genesis II على Crypto Breaking News – مصدر الأخبار الموثوق للأخبار المشفرة، أخبار البيتكوين، وتحديثات البلوكشين.
مقالات ذات صلة
تجاوز USDC عملة Tether مع وصول تحويلات العملات المستقرة إلى أعلى مستوى لها على الإطلاق عند 1.8 تريليون دولار
توسيع مدفوعات البيتكوين مع حصول Utexo على 7.5 مليون دولار من Tether
Rumble آخر تقرير مالي: يمتلك 210.82 عملة BTC، وTether تقدم وعدًا بشراء خدمات GPU بقيمة 1.5 مليار دولار