جوجل تطلق دبلجة تلقائية مع مزامنة للشفاه للفيديوهات على منصتها

أعلنت جوجل في فعالية «Made on YouTube» هذا الشهر عن توسعة جديدة لتقنية الدبلجة التلقائية على يوتيوب لتشمل مزامنة حركة الشفاه، بهدف حل مشكلة طويلة الأمد في المحتوى المرئي المترجم آلياً. وتستهدف الميزة جعل الفيديوهات المترجمة تبدو وتُسمع بشكل أكثر طبيعية، مع تحسين وصول المحتوى للمشاهدين حول العالم.
ستُطرح التقنية مبدئياً مع 20 لغة، من بينها الإنجليزية، والألمانية، والفرنسية، والإسبانية، لكن ليس العربية مع إضافة المزيد من اللغات خلال الأشهر المقبلة.
لطالما أثارت أنظمة الدبلجة والترجمة التلقائية في يوتيوب الجدل بسبب إعادة عرض الوسائط الأصلية بصيغ محلية بشكل آلي، مما يؤثر على العناوين والمسارات الصوتية معاً. وقد انتقد العديد من المشاهدين هذه الميزات، مفضلين النسخ الأصلية، وأبدوا انزعاجهم من غياب خيار عالمي لإيقاف الترجمات التلقائية. أما المستخدمون متعددو اللغات فقد عبروا عن استيائهم من أن ترجمات الذكاء الاصطناعي غالباً لا ترقى إلى جودة الترجمة البشرية.
حالياً، لا يوجد إعداد عالمي لإيقاف الدبلجة التلقائية، مما يجبر المستخدمين على تعديل إعدادات المسار الصوتي لكل فيديو على حدة. وقد أدى هذا القيد إلى ظهور إضافات للمتصفح مثل YouTube Anti-Translate، والتي تمنع طبقات الترجمة والدبلجة غير المرغوبة.
ميزة مزامنة الشفاه الجديدة تستهدف معالجة واحدة من أكثر الشكاوى شيوعاً حول الدبلجة: عدم تطابق الصوت مع حركة الفم. إذ يستخدم النظام الذكاء الاصطناعي لمزامنة حركة شفاه المتحدث بصرياً مع المسار الصوتي المولد، مما يخلق تجربة مشاهدة أكثر سلاسة.
يمكن لصناع المحتوى تفعيل ميزة الدبلجة التلقائية بمزامنة الشفاه عبر YouTube Studio. وستركز المرحلة الأولى من الاختبار على أعضاء برنامج شركاء يوتيوب. وبينما يظل الاشتراك طوعياً في الوقت الحالي، قد توسع جوجل الميزة لاحقاً أو تجعلها آلية لمجموعة أوسع من الفيديوهات.
تعتمد مبادرة الدبلجة متعددة اللغات على نماذج ذكاء اصطناعي خاصة (يُعتقد أنها تشمل Gemini وAloud) لتوليد الصوت المترجم، ومحاكاة نبرة وإحساس المتحدث، وفصل المسارات الصوتية عن المؤثرات الخلفية. وأظهرت الاختبارات المبكرة مع بعض المبدعين نتائج واعدة، إذ تضاعفت مشاهدات بعض القنوات ثلاث مرات من جمهور غير ناطق باللغة الأصلية بعد اعتماد المسارات الصوتية المتعددة.
لكن النظام لا يزال مثيراً للانقسام. فالمؤيدون يشيرون إلى إمكانية زيادة الوصول والعائدات لصناع المحتوى والمعلنين، بينما يجادل المنتقدون بأن الدبلجة الآلية تقلل من أصالة المحتوى الأصلي، كما أنها تؤثر على صانعي المحتوى باللغات الأقل هيمنة، مثل العربية، حيث سيتلقون موجة كبرى من المنافسة من قنوات عالمية ناطقة بالإنجليزية ومدبلجة للغاتهم المحلية. وما إذا كانت تقنية مزامنة الشفاه قادرة على سد الفجوة بين الفيديوهات المدبلجة آلياً وتلك الأصلية، يبقى أمراً مفتوحاً للنقاش.