صحيفة اللحظة:
طوَّرت شركة “مايكروسوفت” نظاماً ذكياً لديه القدرة على إنشاء مقاطع بصوت أي إنسان، وذلك من خلال تدريب النظام على مقطع بصوت الشخص المستهدف، لا تزيد مدته عن 3 ثوانٍ فقط.
ويحمل النظام الجديد اسم “VALL-E” ويعمل على تحويل النصوص المكتوبة إلى مقاطع صوتية، وذلك بحسب صفحة المصدر الكودي للنظام على موقع GitHub.
ولا يقتصر النظام على إنشاء مقاطع صوتية عبر كتابة نصوص عشوائية، لكنه يستطيع أيضاً مراعاة أسلوب القراءة ونبرة الصوت، لإظهار شخصية صاحب الصوت الأصلي في المقاطع الصوتية المزيفة.
وبحسب الموقع، لا يزال النظام قيد التطوير والبحث، لكن المشروع يقدم مستوىً فائقاً في دقة محاكاة العوامل والمؤثرات الصوتية المحيطة بالمتحدث في المقطع الأصلي البالغة مدته 3 ثوان فقط، بحيث يتم إبرازها في المقاطع المصنعة بشكل أقرب للحقيقة.
وأوضحت عينات مقاطع صوتية عرضتها “مايكروسوفت” للكشف عن قدرات نظامها الجديد، مستوى دقيق للبرنامج في إنشاء مقاطع صوتية كأنها مسجلة خلال مكالمة هاتفية، وذلك من خلال اقتباس نمط الصوت ومستواه ودرجة شدته، من المقطع الأصلي المُسجل للمستخدم خلال حديثه في الحقيقة.
وأثبتت “مايكروسوفت” من خلال المقاطع الصوتية التي نشرتها على صفحة النظام الجديد على “جت هب” أن النظام بإمكانه إنشاء مقاطع صوتية بأساليب مختلفة، عبر استخدام صوت شخص واحد.