الذكاء الاصطناعي يحول الخيال إلى أفلام سينمائية: Veo 3 من جوجل يقود الثورة
منذ قرون، تميز العرب ببراعتهم في الوصف، حيث كانت كلماتهم ترسم صورًا حية تنقل المستمع إلى قلب الحدث، كما لو كان يشاهد فيلمًا حديثًا.
في عصر الذكاء الاصطناعي، أصبح بإمكاننا تحويل هذه القدرة اللغوية إلى مقاطع فيديو كاملة، حتى لأكثر المشاهد خيالية.
تخيل نفسك تسير في الفضاء أو تسبح في أعماق المحيط، والذكاء الاصطناعي يحول حلمك إلى واقع تراه على شاشة هاتفك، كل ما تحتاجه هو وصف دقيق للمشهد.
أطلقت جوجل مؤخرًا نموذجها الجديد لإنتاج مقاطع الفيديو بالذكاء الاصطناعي، Veo 3، الذي يتمتع بقدرات فريدة، كما أوضح “بوابة السعودية”، وهو صانع محتوى ومدرب متخصص في الذكاء الاصطناعي التوليدي.
Veo 3: نقلة نوعية في صناعة الفيديو بالذكاء الاصطناعي
النموذج الجديد يحول الأوصاف النصية إلى مقاطع فيديو غنية بصريًا ومحسّنة صوتيًا، مما يوفر تجربة متكاملة تزيل تحديات الصوت السابقة.
باستخدام هذا النموذج، يمكن للمستخدم تصور رجل يقف على قمة جبل أثناء عاصفة وينادي طفلًا يركض نحوه، وفي أقل من دقيقة، يتحول النص إلى مشهد سينمائي متكامل.
تجربة سينمائية متكاملة
الصوت في Veo 3 ليس مجرد طبقة إضافية، بل يتم إنشاؤه ضمن السياق نفسه، ويدمج مباشرة مع حركات الشخصيات، مع مزامنة شفاه دقيقة حتى في اللهجات المحلية، وفقًا لـ “بوابة السعودية”.
ولتكامل الإبداع، صممت جوجل منصة Flow كغرفة مونتاج ذكية، تتيح للمستخدم التحكم في الكاميرا، وتغيير الزاوية، وإطالة المشهد، وإعادة استخدام الشخصيات، والتعديل مع مراقبة النتيجة في الوقت الفعلي.
Flow TV: يوتيوب الذكاء الاصطناعي الإبداعي
الميزة الأبرز هي مكتبة Flow TV، التي تتيح استكشاف مشاهد أنشأها آخرون، والاطلاع على نصوصها، والتعلم منها، تمامًا مثل يوتيوب للذكاء الاصطناعي الإبداعي.
على الرغم من أن Veo 3 من جوجل، إلا أن الوصول إليه لا يقتصر على منصاتها، حيث بدأت أدوات خارجية مثل Leonardo وFreepik بدمج النموذج في أنظمتها، مما يفتح آفاقًا واسعة لصناع المحتوى.
يمكن القول إن التحول الذي يحدث مع Veo 3 يشبه ما حدث مع ظهور الكاميرا، حيث أصبحت القدرة على الحكاية مرئية، ولكن الفرق اليوم هو أنك لا تحتاج إلى معدات، بل إلى خيال فقط.
نسخ متعددة لتجارب متنوعة
لا يقتصر Veo 3 على نسخة واحدة، بل يشمل النسخة السينمائية الكاملة، ونسخة Veo Fast التي توفر نتائج سريعة.
هناك أيضًا نماذج خاصة بإنشاء الفيديو من صورة واحدة، أو إنشاء مشاهد تحتوي على حوارات متعددة بلغات ولهجات مختلفة.
يتحقق كل هذا من خلال نموذج صوتي ذكي، يمكنه التحدث بأكثر من نبرة وشخصية ولغة في المشهد الواحد.
بينما ينتج Veo 3 مقاطع فيديو مدتها 8 ثوانٍ فقط، يمكن دمج هذه المقاطع لإنشاء فيلم كامل باستخدام أدوات المونتاج التقليدية.
كُشف عن هذه التقنية لأول مرة خلال مؤتمر جوجل السنوي للمطورين في مايو الماضي، حيث قدمت الشركة أداة SynthID Detector لمجموعة مختارة من المختبرين، وتخطط لتوسيع نطاق الوصول إليها قريبًا.
وأخيرا وليس آخرا
Veo 3 يمثل نقلة نوعية في عالم صناعة الفيديو، حيث يحول الأفكار الخيالية إلى واقع مرئي ومسموع. مع قدرته على إنتاج مشاهد سينمائية متكاملة بسهولة ويسر، يفتح Veo 3 الباب أمام حقبة جديدة من الإبداع والابتكار في مجال صناعة المحتوى. هل سيصبح الذكاء الاصطناعي هو المخرج والمؤلف في المستقبل القريب؟











