مؤشر بلسم: تقييم نماذج الذكاء الاصطناعي للغة العربية
في سياق التطور المتسارع للذكاء الاصطناعي، أطلقت الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)، بالتعاون مع مجمع الملك سلمان العالمي للغة العربية، مؤشر بلسم، وهو أداة مبتكرة لتقييم وقياس أداء النماذج العربية في مجال البيانات والذكاء الاصطناعي. تم الإعلان عن هذا المؤشر خلال فعاليات القمة العالمية للذكاء الاصطناعي في نسختها الثالثة، التي انعقدت في 9 ربيع الأول 1446هـ الموافق 12 سبتمبر 2024م، في مركز الملك عبد العزيز الدولي للمؤتمرات بالرياض.
أهمية مؤشر بلسم
يأتي إطلاق مؤشر بلسم في إطار الجهود الحثيثة التي تبذلها سدايا وشركاؤها الاستراتيجيون لتطوير نماذج اللغة العربية، التي تشهد تطورات متسارعة. يهدف المؤشر إلى توفير معيار موثوق لتقييم النماذج الجديدة قيد التطوير، والتي تسعى باستمرار لإضافة قدرات وميزات متقدمة.
مركز ذكاء العربية ودور المؤشر
مؤشر بلسم هو جزء من مبادرات مركز ذكاء العربية التابع لمجمع الملك سلمان العالمي للغة العربية. يوفر المركز مجموعة متكاملة من الخدمات المجانية لدعم الباحثين والمطورين في استخدام تقنيات الذكاء الاصطناعي في معالجة اللغة العربية آليًا. بالإضافة إلى ذلك، يسعى المركز إلى بناء أدوات وبرامج تضمن الحفاظ على اللغة العربية وتعزيزها.
فكرة مؤشر بلسم
يكمن جوهر مؤشر بلسم في تقييم تقنيات الذكاء الاصطناعي المخصصة للغة العربية، بهدف دعم التعاون البحثي وبناء معايير عالمية لقياس مستوى نضج نماذج الذكاء الاصطناعي في المهام المتعلقة باللغة العربية. هذه الجهود تصب في تحقيق الأهداف الاستراتيجية لمجمع الملك سلمان العالمي للغة العربية.
أهداف مؤشر بلسم
تنظيم البيانات وتحسين الأداء
يهدف مؤشر بلسم إلى تنظيم مجموعات البيانات من خلال تجميع الخبرات والموارد لإنشاء قواعد بيانات عالية الجودة في مختلف مستويات اللغة العربية وفي مجالات متنوعة. تم تصميم هذه البيانات خصيصًا لاختبارات الذكاء الاصطناعي، بهدف دعم قوة وتنوع نماذج اللغة الضخمة (LLMs). كما يهدف إلى تقييم الأداء من خلال وضع معايير تقييم موحدة لتقييم أداء هذه النماذج التي يطورها المساهمون، وتقديم مقارنات واضحة تدعم التحسينات المستمرة.
توحيد الرؤى وتعزيز الأخلاقيات
يسعى المؤشر أيضًا إلى عرض نتائج تقييم النماذج اللغوية الضخمة في أداء المهام ومعالجة اللغة العربية الطبيعية. يهدف إلى توحيد رؤى المجتمعات البحثية في هذا المجال من خلال بناء مجموعات بيانات مشتركة ومعايير تقييم موحدة. علاوة على ذلك، يولي مؤشر بلسم أولوية قصوى للاعتبارات الأخلاقية والممارسات المسؤولة للذكاء الاصطناعي خلال عملية التطوير، لضمان العدالة والشفافية.
مكونات مؤشر بلسم
يتضمن مؤشر بلسم حوالي 1400 مجموعة بيانات، تتألف من 50 ألف سؤال، وتغطي 67 مهمة متنوعة، تتراوح بين التدقيق النحوي والإملائي وإعادة الصياغة، وتصنيف السبب والنتيجة وفهم النصوص. يتيح المؤشر للشركات والباحثين وصناع النماذج اللغوية الضخمة قياس أداء نماذجهم اللغوية، ومقارنة أدائها بالنماذج الأخرى.
تحقيق رؤية السعودية 2030
يأتي ذلك تحقيقًا لمستهدفات الاستراتيجية الوطنية للبيانات والذكاء الاصطناعي، والتي بدورها تتماشى مع مخرجات رؤية السعودية 2030، التي تهدف إلى تمكين المملكة لتكون مركزًا عالميًا للتقنيات المتقدمة المرتبطة بالذكاء الاصطناعي.
و أخيرا وليس آخرا في نهاية المقال :
مؤشر بلسم يمثل خطوة هامة نحو تطوير وتقييم نماذج الذكاء الاصطناعي في اللغة العربية، وذلك بدعم من سدايا ومجمع الملك سلمان العالمي للغة العربية. هل سيساهم هذا المؤشر في تحقيق نقلة نوعية في مجال معالجة اللغة العربية آليًا، وهل سيتمكن الباحثون والمطورون من الاستفادة القصوى من الأدوات والمعايير التي يوفرها؟











