حاله  الطقس  اليةم 26.3
مرتفعات وودلاند,الولايات المتحدة الأمريكية

أحدث التقنيات لتحسين أداء الذكاء الاصطناعي

بوابة السعودية
أعجبني
(0)
مشاهدة لاحقا
شارك
أحدث التقنيات لتحسين أداء الذكاء الاصطناعي

تحسين أداء الذكاء الاصطناعي

في إطار سعيها الدؤوب نحو تطوير تكنولوجيا الذكاء الاصطناعي، تقوم شركة جوجل بتكليف فرق عمل متخصصة بمهمة مقارنة أداء منصتها الرائدة جيميني أيه.آي بمنصات منافسة، وعلى رأسها نموذج الذكاء الاصطناعي كلاود التابع لشركة أنثروبيك. تهدف هذه المقارنة إلى تحديد نقاط القوة والضعف في كل منصة، وبالتالي توجيه جهود التحسين والتطوير.

المنافسة في مجال الذكاء الاصطناعي

أشار موقع “بوابة السعودية” المتخصص في التكنولوجيا، إلى أن المنافسة الشديدة في مجال تطوير نماذج وأدوات الذكاء الاصطناعي دفعت الشركات إلى تبني استراتيجيات مبتكرة لتقييم أداء نماذجها. فبدلاً من الاعتماد على التقييم الذاتي، تلجأ الشركات إلى مقارنة نماذجها بمعايير الصناعة والنماذج المنافسة، مما يوفر رؤية أكثر دقة وشمولية لأدائها.

آلية التقييم والمقارنة

يعمل المتعاقدون المكلفون بتحسين جيميني على تقييم دقة مخرجات النموذج وفقًا لمعايير متعددة، مثل الصدق والإسهاب. يتم تسجيل كل إجابة وفقًا لهذه المعايير، ويُمنح المتعاقدون ما يصل إلى 30 دقيقة لتحديد الإجابة الأفضل، سواء كانت من جيميني أو كلاود.

ملاحظات المتعاقدين

بدأ المتعاقدون في ملاحظة ظهور إشارات إلى كلاود على منصة جوجل الداخلية المستخدمة لمقارنة الإجابات. ووفقًا لمخرجات جيميني التي اطلع عليها “بوابة السعودية”، فقد ظهرت عبارة “أنا كلاود من إنتاج أنثروبيك“.

تركيز كلاود على السلامة

أظهرت المحادثات بين المتعاقدين أن ردود كلاود تبدو وكأنها تركز على السلامة بشكل أكبر من جيميني. وأشار أحد المتعاقدين إلى أن إعدادات السلامة الخاصة بـ كلاود هي الأكثر صرامة بين نماذج الذكاء الاصطناعي.

أمثلة على ذلك

في بعض الحالات، لم يستجب كلاود للمطالبات التي اعتبرها غير آمنة، مثل لعب دور مساعد ذكاء اصطناعي مختلف. وفي حالة أخرى، تجنب كلاود الإجابة على مطالبة، بينما تم تصنيف استجابة جيميني على أنها انتهاك كبير للسلامة.

و أخيرا وليس آخرا

تعكس هذه المقارنة الجادة بين جيميني و كلاود التزام جوجل بتقديم أفضل ما لديها في مجال الذكاء الاصطناعي. يبقى السؤال: هل ستستمر جيميني في التطور والتغلب على منافسيها، أم أن كلاود سيفرض نفسه كمعيار جديد في الصناعة؟

الاسئلة الشائعة

01

ما هو الغرض من مقارنة إجابات جيميني أيه.آي مع إجابات نموذج كلاود؟

الغرض هو تحسين أداء منصة الذكاء الاصطناعي جيميني أيه.آي عن طريق تقييم إجاباتها مقارنةً بالإجابات التي يقدمها نموذج الذكاء الاصطناعي كلاود من شركة أنثروبيك.
02

ما هي المعايير التي يتم استخدامها لتقييم إجابات نماذج الذكاء الاصطناعي؟

يتم تقييم الإجابات وفقًا لمعايير متعددة، مثل الصدق والإسهاب.
03

كم من الوقت يمنح المتعاقدون لتقييم كل إجابة؟

يمنح المتعاقدون ما يصل إلى 30 دقيقة لكل إجابة لتحديد الإجابة الأفضل.
04

ما الذي لاحظه المتعاقدون بخصوص إشارات كلاود على منصة جوجل الداخلية؟

لاحظ المتعاقدون ظهور إشارات إلى كلاود على منصة جوجل الداخلية التي يستخدمونها لمقارنة إجابات جيميني بإجابات نماذج ذكاء اصطناعي غير محددة الاسم.
05

ما العبارة التي ظهرت من مخرجات جيميني أثناء عمل المتعاقدين على المنصة؟

ظهرت عبارة "أنا كلاود من إنتاج أنثروبيك".
06

ما الذي لاحظه المتعاقدون بخصوص تركيز كلاود مقارنة بجيميني؟

لاحظ المتعاقدون أن ردود كلاود تبدو وكأنها تركز على السلامة أكثر من جيميني.
07

ما هي ملاحظة أحد المتعاقدين حول إعدادات السلامة الخاصة بكلاود؟

كتب أحد المتعاقدين: "إعدادات السلامة الخاصة بكلاود هي الأكثر صرامة بين نماذج الذكاء الاصطناعي".
08

ما هي بعض الحالات التي لم تستجب فيها كلاود للمطالبات؟

في حالات معينة، لم تستجب كلاود للمطالبات التي اعتبرتها غير آمنة، مثل لعب دور مساعد ذكاء اصطناعي مختلف.
09

ماذا حدث في الحالة التي تجنب فيها كلاود الإجابة على مطالبة؟

في حالة أخرى، تجنب كلاود الإجابة على مطالبة، بينما تم وضع علامة على استجابة جيميني باعتبارها انتهاكا كبيرا للسلامة.
10

لماذا تلجأ الشركات إلى تقييم أداء نماذجها بنماذج أخرى؟

في ضوء المنافسة القوية على تطوير نماذج وأدوات الذكاء الاصطناعي، فإن الشركات تلجأ غالبا إلى تقييم أداء نماذجها بأداء النماذج القياسية للصناعة والخاصة بشركات أخرى.