دليل تقنية التزييف العميق الصوتي
أصبح الذكاء الاصطناعي متقدماً إلى حد يمكنك من خلاله إنشاء نسخ دقيقة من أصوات الآخرين. البرنامج المستخدم لمثل هذه المشاريع معروف باسم تقنية التزييف العميق الصوتي. ستشرح هذه المقالة آلية عملها.
ما هي تقنية الـ deepfake؟
باستخدام الذكاء الاصطناعي المتقدم، يمكنك إنشاء وسائط تركيبية عالية الجودة وواقعية، بما في ذلك تقليد أصوات الأشخاص. وهنا يأتي دور تقنية الـ deepfake. أصوات الـ deepfake تقنية مدعومة بالذكاء الاصطناعي تُمكّنك من توليد نماذج صوتية تُحاكي صوت شخص آخر. عادةً ما تُدرَّب النماذج بتزويد البرنامج بتسجيلات واقعية للمتحدث المستهدف. بعد التدريب، يمكن للبرنامج توليد صوت اصطناعي يشبه التسجيل الأصلي. يستخدم التعلم الآلي والتعلم العميق وخوارزميات متقدمة لتحليل خصائص وأنماط صوت الشخص. إليك بعض الأمثلة:
- اللكنة
- إيقاع الكلام
- السرعة
- طبقة الصوت (اللحن)
يستخدم مطوّرو مشاريع التزييف الصوتي حواسيب وتقنيات متقدمة. ومع ذلك، قد يستغرق تقليد صوت شخص آخر أسابيع. وغالباً ما تتأخر هذه المشاريع لأنها تحتاج إلى قدرٍ كافٍ من بيانات التدريب. أي إنّ على الحاسوب الاستماع إلى تسجيلات الشخص لساعات محددة قبل أن يتمكن من محاكاة جميع الخصائص.
الاستخدامات
حالات استخدام تقنية التزييف العميق الصوتي تكاد تكون لا تُحصى:
- مساعدة الأشخاص الذين فقدوا أصواتهم — قد تحد المشاكل الطبية من الكلام أو تمنع الناس من التحدث تماماً. يمكن لتقنية التزييف العميق الصوتي مساعدة المتضررين على استعادة القدرة على التواصل، إذ تستند إلى تسجيلاتهم السابقة لابتكار نسخة من صوتهم كما كان.
- مثالية للشركات — يمكن للشركات إنشاء تمائم أو أصوات للعلامة التجارية باستخدام تقنية الذكاء الاصطناعي للصوت المزيف. ويمكن لمجموعة من التسجيلات الصوتية لأشخاص محددين أن تساعد أصحاب الأعمال على زيادة الوعي بالعلامة وجذب مزيد من العملاء. السر في نماذج ذكاء اصطناعي دقيقة.
- ملائمة تماماً لقطاع الترفيه — يمكن لشركات الإنتاج استخدام أصوات تركيبية لاستعادة مواهب تاريخية وإدماجها في مشاريع حديثة. أيضاً، يستخدم منشئو البودكاست هذه التقنية غالباً لدبلجة تسجيلات صوتية إلى لغات أخرى.
- فرص رعاية وإعلانات أفضل — يمكن للمؤثرين والشخصيات والمشاهير ترخيص أصواتهم لمطوّري النماذج اللغوية والحصول على عوائد مجزية مقابل هذه المقاطع الصوتية.
- تنويع المحتوى أو توطينه — استخدمت العديد من المؤسسات الإخبارية تقنية استنساخ الصوت لتنويع محتواها العام الماضي، مثل نشرات الرياضة وتقارير الطقس. وبالمثل، قامت بتوطين المحتوى حتى يتمكن المستمعون من سماع الراوي بلغة مختلفة.
أنواع مختلفة من الـ deepfake
هناك عدة أنواع من الـ deepfake:
- التزييف النصي العميق – برامج مثل ChatGPT يمكنها إنشاء مقالات، مدونات، قصائد، وأي نص تقريبًا. تعتمد هذه المنصات على تحليل أنماط اللغة البشرية وفهمها لإنتاج النصوص.
- الفيديوهات المُزيفة العميقة – مقاطع تُنشأ بتقنيات تحرير الفيديو والذكاء الاصطناعي. غالبًا ما تتضمن تبديل الوجوه، وتُستخدم كثيرًا في عمليات الاحتيال.
- الصوت المُزيف العميق – كما ذُكر سابقًا، هو محاكاة/استنساخ لصوت شخص حقيقي.
- التزييفات الحية في الوقت الحقيقي – دفع بعض المتمرسين تقنيًا تقنية التزييف العميق خطوة أبعد، ليتقمصوا شخصية شخص آخر أثناء مكالمة هاتفية أو بث مباشر. ويمكنهم أيضًا الالتفاف على إجراءات المصادقة الأمنية لتمرير أفعالهم دون إثارة الشبهات.
- تزييفات وسائل التواصل الاجتماعي – يمكن للقراصنة نشر مقاطع فيديو أو صور مفبركة لآخرين على تيك توك, لينكدإن وغيرها من المنصات. ويُطلق على هذا النوع تزييفات وسائل التواصل الاجتماعي.
كيف أنشئ تزييفًا عميقًا؟
بفضل التقدّم التكنولوجي، لم تعد بحاجة إلى معدات باهظة أو خبرة تقنية متقدمة لصنع تزييفات عميقة. في معظم الحالات، يكفي تنزيل أو التسجيل في منصة تزييف عميق واتباع الدروس المقدّمة. ومع ذلك، لا يعني هذا أن تبدأ بإنشاء تزييفات على حاسوب يعمل بنظام مايكروسوفت ويندوز من دون التفكير في جميع جوانب مشروعك، بما في ذلك الاعتبارات الأخلاقية.
المخاوف الأخلاقية
أهم مشكلة أخلاقية في التزييفات العميقة هي أنها قد تتضمن استخدام وجه أو صوت شخص آخر دون إذنه. وحتى إن لم تُستعمل لأغراض خبيثة، فإن غياب الموافقة يضع المشروع برمّته محل تساؤل. ومن الإشكالات أيضًا أن المحتالين يستعملونها لانتحال شخصيات أخرى. يمكنهم تبديل وجوههم بوجوه الآخرين ليبدوا بمظهر أفضل على وسائل التواصل الاجتماعي. وإلى جانب البعد الأخلاقي، يجعل ذلك بعض الشبكات أقل موثوقية.
مولدات التزييف العميق
إذا لم تكن لديك اعتراضات على صنع التزييفات العميقة، فمن المفيد أن تتعرّف إلى آلية عملها. هناك عدة مولدات تزييف عميق يمكن أن تساعدك في إنشاء تزييفات صوتية مقنعة.
Resemble AI
Resemble AI هو مولد صوتي بالذكاء الاصطناعي قادر على إنتاج أصوات بشرية خلال ثوانٍ. يقدّم تحويل كلام إلى كلام بالوقت الفعلي، مقلدًا النبرة والانحناءات وغيرها من خصائص الكلام المستهدف. يمكنك أيضًا تضمين عواطف مختلفة في تسجيلاتك، مثل الغضب، السعادة، والحزن. وكل ذلك جاهز للاستخدام مباشرة.
Descript
يتيح لك Descript إنشاء نماذج تحويل النص إلى كلام لأصوات أشخاص آخرين. يستخدم ذكاءً اصطناعيًا متقدّمًا يُدعى Lyrebird لتوليف الكلام بدقة وإنتاج نماذج متقنة.
ReSpeecher
باستخدام قوة الشبكات العصبية، يبتكر ReSpeecher أصواتًا اصطناعية يصعب تمييزها من نظيراتها الحقيقية. يلتقط نموذج الذكاء الاصطناعي كل العواطف والفروق الدقيقة لتعزيز التسجيلات الصوتية وتقديم توليف كلام محكم.
iSpeech
iSpeech هو أداة متقدمة لاستنساخ الصوت قادرة على تحويل الكلام من مجموعة واسعة من المصادر. التطبيق مفيد في إنشاء أصوات مزيّفة للتعلّم التفاعلي، إرشادات القيادة، السرد، مراكز الاتصال، الرسوم المتحركة، الأفلام، بل وحتى إعادة إنشاء أصوات المشاهير.
استوديو التعليق الصوتي من Speechify
مع أن استوديو التعليق الصوتي من Speechify ليس تطبيقًا للتزييف العميق، فإنه يستحق التجربة بفضل مزاياه اللافتة. أولًا، يقدّم أصواتًا طبيعية واقعية تناسب كل مشاريعك. يحوّل الذكاء الاصطناعي المتقدّم أي نصّ ترفعه أو تكتبه إلى صوت غامر يعزّز تجربة الاستماع. إذا كنت تبحث عن أصوات بنطق طبيعي ولهجات مختلفة، فـ Speechify يلبي طلبك. يتوفر بأكثر من 20 لغة ليساعدك على الوصول إلى جماهير حول العالم، ومع واجهة سهلة يمكنك تحرير المخرجات الصوتية بدقّة: من إضافة توقفات طبيعية إلى ضبط النطق بعناية وغير ذلك. اطّلع على استوديو التعليق الصوتي من Speechify اليوم واكتشف كيف يمكن لأكثر من 200 خيار للراوي أن يحوّل أي مشروع تعليق صوتي.

