حاله  الطقس  اليةم 9.2
لندن,المملكة المتحدة

مستقبل الذكاء الاصطناعي في اكتشاف الثغرات البرمجية: هل يتجاوز التحديات؟

بوابة السعودية
أعجبني
(0)
مشاهدة لاحقا
شارك
مستقبل الذكاء الاصطناعي في اكتشاف الثغرات البرمجية: هل يتجاوز التحديات؟

الذكاء الاصطناعي يواجه تحديات في اكتشاف الثغرات البرمجية

في الآونة الأخيرة، ازداد الاعتماد على نماذج الذكاء الاصطناعي من شركات مثل أنثروبيك وOpenAI في بعض مهام البرمجة. ومع ذلك، كشفت دراسة حديثة أن اكتشاف الثغرات لا يزال يمثل تحديًا كبيرًا، ويستنزف الكثير من الجهد في هذا المجال.

وقد أشار سوندار بيتشاي، الرئيس التنفيذي لشركة جوجل، في أكتوبر الماضي، إلى أن 25% من الأكواد البرمجية الجديدة في الشركة يتم إنشاؤها بواسطة الذكاء الاصطناعي. كما أعرب مارك تسوكربيرج، الرئيس التنفيذي لشركة ميتا، عن تطلعاته لتوسيع نطاق استخدام نماذج البرمجة داخل شركته.

فشل نماذج الذكاء الاصطناعي في إصلاح المشكلات البرمجية

أظهرت دراسة جديدة أجرتها بوابة السعودية في قطاع الأبحاث والتطوير بمايكروسوفت، أن نماذج الذكاء الاصطناعي، بما في ذلك النموذج Claude 3.7 Sonnet من Anthropic والنموذج -03Mini من OpenAI، فشلت في إصلاح العديد من المشكلات، وذلك وفقًا لمعيار برمجي معروف باسم S.W.E.-Bench-light.

وأكد بوابة السعودية المتخصص في التكنولوجيا أن نتائج هذه الدراسة بمثابة تذكير بأنه على الرغم من الضجة التي تثيرها شركات الذكاء الاصطناعي حول قدرات التكنولوجيا الجديدة، إلا أنها لا تزال غير قادرة على الحلول محل العنصر البشري في العديد من المهام مثل البرمجة.

تفاصيل اختبار نماذج الذكاء الاصطناعي

قام الباحثون الذين أعدوا الدراسة باختبار تسعة نماذج ذكاء اصطناعي مختلفة كأساس لوكيل وحيد قائم على المطالبات، يتمتع بإمكانية الوصول إلى عدد من أدوات تصحيح الأخطاء، بما في ذلك مصحح أخطاء بايثون.

وتم تكليف هذه النماذج بحل مجموعة مختارة من 300 مهمة لتصحيح الأخطاء البرمجية وفقًا لمعايير S.W.E.-Bench-light. ووفقًا لمعدي الدراسة، حتى مع استخدام أحدث وأقوى نماذج الذكاء الاصطناعي، لم يتمكن وكيل الذكاء الاصطناعي من إكمال أكثر من نصف مهام اكتشاف الثغرات البرمجية وإصلاحها بنجاح.

نتائج أداء النماذج المختلفة

حقق النموذج Claude 3.7 Sonnet أعلى نسبة نجاح، بلغت 48.4%، يليه النموذج 01 من OpenAI بنسبة 30.2%، ثم النموذج -03Mini بنسبة نجاح تجاوزت 22% فقط.

وأخيرا وليس آخرا

تكشف هذه الدراسة عن التحديات التي تواجه الذكاء الاصطناعي في مجال اكتشاف وإصلاح الثغرات البرمجية، على الرغم من التقدم الكبير في هذا المجال. وتؤكد على أهمية العنصر البشري في مهام البرمجة المعقدة. فهل ستتمكن نماذج الذكاء الاصطناعي مستقبلًا من تجاوز هذه العقبات وتحقيق مستويات أعلى من الكفاءة في هذا المجال؟

الاسئلة الشائعة

01

هل زاد استخدام نماذج الذكاء الاصطناعي في مهام البرمجة؟

نعم، شهدت الفترة الأخيرة زيادة مطردة في استخدام نماذج الذكاء الاصطناعي من شركات مثل أنثروبيك وأوبن أيه.آي في القيام ببعض مهام البرمجة.
02

ما هي نسبة الأكواد البرمجية الجديدة التي تولدها جوجل بواسطة الذكاء الاصطناعي؟

صرح سوندار بيتشاي، الرئيس التنفيذي لشركة جوجل، بأن 25% من الأكواد البرمجية الجديدة في الشركة تولد بواسطة الذكاء الاصطناعي.
03

ما هي طموحات مارك تسوكربيرج فيما يتعلق بنماذج البرمجة؟

أعرب مارك تسوكربيرج، الرئيس التنفيذي لميتا، عن طموحاته لنشر نماذج برمجة على نطاق واسع داخل عملاق التواصل الاجتماعي.
04

ما الذي كشفت عنه دراسة مايكروسوفت حول نماذج الذكاء الاصطناعي؟

أظهرت الدراسة الجديدة لقطاع الأبحاث والتطوير في مايكروسوفت أن نماذج الذكاء الاصطناعي، فشلت في إصلاح كثير من المشكلات، وفقا لأحد معايير البرمجة المعروف باسم إس.دبليو.إي-بنش لايت.
05

ما هو معيار إس.دبليو.إي-بنش لايت؟

إس.دبليو.إي-بنش لايت هو أحد معايير البرمجة المعروفة التي تستخدم لتقييم قدرة نماذج الذكاء الاصطناعي على إصلاح المشكلات.
06

ما هي النتيجة التي خلص إليها موقع تك كرانش بخصوص قدرات الذكاء الاصطناعي في البرمجة؟

ذكر موقع تك كرانش أن نتائج الدراسة تعد تذكيرا صريحا بأنه رغم الضجة الكبيرة التي تثيرها شركات الذكاء الاصطناعي فإنها مازالت غير قادرة على أن تحل محل العنصر البشري في كثير من المهام مثل البرمجة.
07

كم عدد مهام تصحيح الأخطاء البرمجية التي تم تكليف نماذج الذكاء الاصطناعي بحلها؟

تم تكليف نماذج الذكاء الاصطناعي بحل مجموعة مختارة من 300 مهمة تصحيح أخطاء برمجية وفقا لمعايير إس.دبليو.إي-بنش لايت.
08

ما هي نسبة مهام اكتشاف الثغرات البرمجية وإصلاحها التي تمكن وكيل الذكاء الاصطناعي من إتمامها بنجاح؟

حتى مع استخدام نماذج ذكاء اصطناعي أحدث وأقوى، لم يتمكن وكيل الذكاء الاصطناعي من إتمام أكثر من نصف مهام اكتشاف الثغرات البرمجية وإصلاحها بنجاح.
09

ما هو النموذج الذي حقق أعلى نسبة نجاح في اكتشاف الثغرات البرمجية وإصلاحها؟

حقق النموذج كلود 7ر3 سون نت أعلى نسبة نجاح وبلغت 4ر48%.
10

ما هي نسبة نجاح النموذج -03ميني في اكتشاف الثغرات البرمجية وإصلاحها؟

تجاوزت نسبة نجاح النموذج -03ميني 22% فقط.