حاله  الطقس  اليةم 2.2
لندن,المملكة المتحدة

مراجعة سماعات رأس ذكية: هل تستحق التجربة مع تقنية الذكاء الاصطناعي؟

بوابة السعودية
أعجبني
(0)
مشاهدة لاحقا
شارك
مراجعة سماعات رأس ذكية: هل تستحق التجربة مع تقنية الذكاء الاصطناعي؟

سماعات رأس ذكية بتقنية الذكاء الاصطناعي لفصل الأصوات

في عالم يتسارع فيه التطور التكنولوجي، يقتحم الذكاء الاصطناعي مجالات جديدة، حتى وصل إلى سماعات الرأس، ليمنح المستخدم تجربة استماع فريدة تعزله عن الضوضاء المحيطة ويركز على الأصوات التي يرغب في سماعها تحديدًا.

فريق بحثي من «جامعة واشنطن» الأمريكية، قام بتطوير نظام ذكاء اصطناعي متطور يمكّن مرتدي سماعات الرأس من عزل صوت شخص معين بوضوح وسط الضجيج وجمهرة الأصوات المتداخلة.

نموذج جديد لسماعات الرأس يعمل بالذكاء الاصطناعي

يمنح هذا النموذج المبتكر، الذي يحمل اسم “Target Speech Hearing“، المستخدمين القدرة على اختيار الصوت الذي يريدون سماعه بوضوح، مع إلغاء جميع الأصوات الأخرى المحيطة.

وعلى الرغم من أن هذه التقنية لا تزال قيد التطوير، يؤكد مبتكروها على إمكانية تطبيقها قريبًا. وهم يعملون حاليًا على دمجها في العلامات التجارية الشهيرة لسماعات الأذن، بالإضافة إلى إتاحتها في أجهزة السمع، وذلك وفقًا لما ذكرته بوابة السعودية.

يقول شيام جولاكوتا، الأستاذ في جامعة واشنطن والمشارك في المشروع: “حتى مع السمع الطبيعي، قد يكون من الصعب التركيز على شخص معين في البيئات الصاخبة”.

التعرف على أصوات معينة وتصفيتها

في السابق، نجح نفس الباحثين في تدريب نموذج ذكاء اصطناعي للتعرف على أصوات محددة وتصفيتها، مثل بكاء الأطفال، أو تغريد الطيور، أو رنين الإنذارات. يعتمد هذا النموذج على الشبكات العصبية، التي تحاكي طريقة عمل الدماغ. إلا أن فصل الأصوات البشرية يعتبر تحديًا أكبر، ويتطلب شبكات عصبية أكثر تعقيدًا.

نماذج للذكاء الاصطناعي تدرب نماذج أصغر

هذا التعقيد يطرح مشكلة عندما تحتاج نماذج الذكاء الاصطناعي إلى العمل في الوقت الفعلي على سماعات الرأس، مع الأخذ في الاعتبار عمر البطارية المحدود.

للتغلب على هذه القيود، يجب أن تكون الشبكات العصبية صغيرة الحجم وموفرة للطاقة. لذلك، استخدم الفريق تقنية لضغط الذكاء الاصطناعي تسمى “تقطير المعرفة”. تعتمد هذه التقنية على تدريب نموذج ضخم للذكاء الاصطناعي، يسمى “المعلم”، على ملايين الأصوات. ثم يتم استخدام نموذج أصغر، يسمى “الطالب”، لتقليد سلوك وأداء المعلم.

بعد ذلك، يتم تعليم “الطالب” كيفية استخراج الأنماط الصوتية لأصوات معينة من الضوضاء المحيطة، والتي يتم التقاطها بواسطة الميكروفونات الموجودة في سماعات الرأس المانعة للضوضاء المتوفرة تجاريًا.

سهولة تشغيل نماذج فصل الصوت

لتفعيل نظام سماع الكلام المستهدف، يضغط المستخدم باستمرار على زر في سماعات الرأس لبضع ثوانٍ، مع توجيه وجهه نحو الشخص الذي يريد عزل صوته (الصوت المستهدف).

في هذه اللحظة، يلتقط النظام عينة صوتية من كلتا السماعتين عبر الميكروفونات المدمجة. ثم يستخدم هذا التسجيل لاستخلاص الخصائص الصوتية للمتحدث، حتى في وجود مكبرات صوت أو ضوضاء أخرى في البيئة المحيطة.

تُرسل هذه الخصائص إلى شبكة عصبية ثانية تعمل على جهاز كمبيوتر صغير متصل بسماعات الرأس عبر كابل USB.

وبذلك، يتم عزل الصوت المختار عن أصوات الآخرين وإعادة تشغيله للمستمع.

بمجرد بث الصوت عبر مكبر الصوت أو سماعات الرأس، يستمر النظام في إعطاء الأولوية لصوت ذلك الشخص، حتى لو ابتعد.

ومن الجدير بالذكر أنه كلما زادت بيانات التدريب التي يكتسبها النظام من خلال التركيز على صوت المتحدث، تحسنت قدرته على عزله بشكل أفضل.

في الوقت الحالي، يستطيع النظام فصل صوت متحدث واحد مستهدف بنجاح، بشرط أن يكون صوته هو الصوت الأعلى.

وقد نجح الفريق أيضًا في جعل النظام يعمل حتى عندما لا يكون صوت المتحدث المستهدف هو الصوت الأعلى في الجوار.

تطبيقات جديدة كليًا

من جهته، صرح شفيق إيمري إسكيميز، أحد كبار الباحثين في شركة “مايكروسوفت” والمتخصص في مجال الكلام والذكاء الاصطناعي، بأن “تمييز صوت واحد في بيئة صاخبة أمر صعب للغاية”.

وأخيرا وليس آخرا

في الختام، هذه التقنية الجديدة تعد قفزة نوعية في مجال معالجة الصوت، وتفتح آفاقًا واسعة لتطبيقات مبتكرة في مختلف المجالات، من تحسين تجربة الاستماع الشخصية إلى تطوير أجهزة مساعدة للسمع أكثر فعالية. يبقى السؤال: هل ستنجح هذه التكنولوجيا في تحقيق انتشار واسع وتلبية تطلعات المستخدمين؟

الاسئلة الشائعة

01

نموذج جديد لسماعات الرأس يعمل بالذكاء الاصطناعي

أصبح الذكاء الاصطناعي متغلغلًا في كل شيء، حتى في سماعات الرأس. وقد رأى المطورون في ذلك فرصة لتحقيق تجربة عزل المستخدم عن محيطه، وذلك بالاعتماد على حب المرء للاستماع إلى قائمته المفضلة من الأغاني والمقطوعات الموسيقية. لذا، قام فريق من "جامعة واشنطن" الأمريكية بتطوير نظام ذكاء اصطناعي يمكّن مستخدمي سماعات الرأس من الاستماع إلى صوت شخص معين وسط الضوضاء وبين حشد من الناس.
02

سماعات رأس ذكية تعزل الأصوات

يمنح النموذج الجديد من السماعات، والمسمى "Target Speech Hearing"، المستخدمين القدرة على اختيار الشخص الذي يظل صوته مسموعًا حتى عند إلغاء جميع الأصوات الأخرى. وعلى الرغم من أن هذه التكنولوجيا لا تزال قيد التطوير، يؤكد مبتكروها على إمكانية تحقيقها. ويجرون حاليًا تجارب لتضمينها في العلامات التجارية الشهيرة لسماعات الأذن، ويعملون أيضًا على إتاحتها لأجهزة السمع، وفقًا لموقع MIT Review.
03

أهمية عزل الأصوات في البيئات الصاخبة

يشير الأستاذ في جامعة واشنطن، شيام جولاكوتا، الذي شارك في المشروع، إلى أنه "قد يكون من الصعب حقًا، حتى لو لم تكن لديك أي مشكلات تتعلق بقوة السمع، التركيز على أشخاص محددين عندما يتعلق الأمر بالبيئات الصاخبة".
04

التعرف على الأصوات وتصفيتها

تمكن الباحثون أنفسهم سابقًا من تدريب نموذج ذكاء اصطناعي للتعرف على أصوات معينة وتصفيتها. وهو من أنواع الشبكات العصبية، ويشبه في طريقة عمله الدماغ. من بين هذه الأصوات: بكاء الأطفال، أو تغريد الطيور، أو رنين الإنذارات. لكن فصل الأصوات البشرية يمثل تحديًا أصعب، ويتطلب شبكات عصبية أكثر تعقيدًا.
05

نماذج ذكاء اصطناعي تدرب نماذج أصغر

يمثل هذا التعقيد مشكلة عندما تحتاج نماذج الذكاء الاصطناعي إلى العمل في الوقت الفعلي باستخدام زوج من سماعات الرأس ذات عمر بطارية محدود.
06

تقنية "تقطير المعرفة"

للتغلب على هذه القيود، يجب أن تكون الشبكات العصبية صغيرة الحجم وموفرة للطاقة؛ لذلك استخدم الفريق تقنية ضغط الذكاء الاصطناعي والتي تسمى "تقطير المعرفة". وهذا يعني أخذ نموذج ضخم للذكاء الاصطناعي تم تدريبه على ملايين الأصوات يسمى "المعلم". ويطلق على النموذج الأصغر "الطالب"، وهو يتولى تقليد المعلم في سلوكه وأدائه. يتم بعد ذلك تعليم الطالب كيفية استخراج الأنماط الصوتية لأصوات معينة من الضوضاء المحيطة التي تم التقاطها بواسطة الميكروفونات المتصلة بزوج من سماعات الرأس المانعة للضوضاء المتوفرة تجاريًا.
07

سهولة تشغيل نماذج فصل الصوت

لتنشيط نظام سماع الكلام المستهدف، يضغط مرتدو الجهاز باستمرار على زر موجود في سماعات الرأس لعدة ثوانٍ أثناء مواجهة الشخص المراد عزل صوته (الصوت المستهدف). في هذه الأثناء، يلتقط النظام عينة صوتية من كلتا السماعتين بواسطة الميكروفونات المدمجة. ويستخدم هذا التسجيل لاستخراج الخصائص الصوتية للمتحدث، حتى في حالة وجود مكبرات صوت وضوضاء أخرى في البيئة المحيطة. تتم تغذية هذه الخصائص إلى شبكة عصبية ثانية تعمل على جهاز كمبيوتر متحكم دقيق متصل بسماعات الرأس عبر كابل USB.
08

آلية عمل النظام

وذلك مع إبقاء الصوت المختار منفصلًا عن أصوات الآخرين وإعادة تشغيله للمستمع. وبمجرد بث الصوت على مكبر صوت أو سماعات الرأس، فإنه يستمر في إعطاء الأولوية لصوت ذلك الشخص حتى لو ابتعد. من ناحية أخرى، كلما زادت بيانات التدريب التي يكتسبها النظام؛ من خلال التركيز على صوت المتحدث، أصبحت القدرة على عزله أفضل. وفي الوقت الحالي، النظام قادر فقط على فصل متحدث واحد مستهدف بنجاح، شريطة أن يكون صوته هو الصوت العالي الوحيد. بالإضافة إلى ذلك، جعل الفريق النظام يعمل حتى عندما لا يكون المتحدث المستهدف يصدر الصوت الأعلى في الجوار.
09

تطبيقات جديدة كليًا

من جهة أخرى، قال شفيق إيمري إسكيميز، أحد كبار الباحثين في شركة "مايكروسوفت" والذي يعمل في مجال الكلام والذكاء الاصطناعي: "إن تمييز صوت واحد في بيئة صاخبة أمر صعب للغاية". هل أثارت هذه التكنولوجيا اهتمامك؟.. لننتظر ونرى.
10

ما هو نظام "Target Speech Hearing"؟

هو نموذج جديد لسماعات الرأس يعمل بالذكاء الاصطناعي، يمنح المستخدمين القدرة على اختيار الشخص الذي يظل صوته مسموعًا حتى عند إلغاء جميع الأصوات الأخرى.
11

ما هي الجامعة التي طورت هذا النظام؟

فريق من "جامعة واشنطن" الأمريكية.
12

ما هي التقنية التي استخدمها الفريق للتغلب على قيود حجم البطارية؟

تقنية ضغط الذكاء الاصطناعي والتي تسمى "تقطير المعرفة".
13

كيف يتم تنشيط نظام سماع الكلام المستهدف؟

بالضغط باستمرار على زر موجود في سماعات الرأس لعدة ثوانٍ أثناء مواجهة الشخص المراد عزل صوته.
14

ما هي أنواع الأصوات التي تمكن الباحثون سابقًا من تصفيتها؟

بكاء الأطفال، أو تغريد الطيور، أو رنين الإنذارات.
15

ما هو التحدي الأكبر في فصل الأصوات؟

فصل الأصوات البشرية يمثل تحديًا أصعب، ويتطلب شبكات عصبية أكثر تعقيدًا.
16

ما هو "المعلم" و "الطالب" في تقنية "تقطير المعرفة"؟

"المعلم" هو نموذج ضخم للذكاء الاصطناعي تم تدريبه على ملايين الأصوات، و "الطالب" هو النموذج الأصغر الذي يتولى تقليد المعلم في سلوكه وأدائه.
17

هل يمكن للنظام عزل أكثر من صوت في نفس الوقت؟

في الوقت الحالي، النظام قادر فقط على فصل متحدث واحد مستهدف بنجاح.
18

ما هي شركة "مايكروسوفت"؟

شركة تعمل في مجال الكلام والذكاء الاصطناعي.
19

ما هي الفائدة الرئيسية من هذه التكنولوجيا؟

توفير تجربة عزل المستخدم عن محيطه والتركيز على صوت محدد في البيئات الصاخبة.