شهدت تقنية التزييف العميق تقدماً ملحوظاً في السنوات الأخيرة. وإلى جانب تزييف الفيديو، يُعد التزييف الصوتي أو استنساخ الصوت مجالاً يتطور بسرعة ويستفيد من الذكاء الاصطناعي وخوارزميات تعلّم الآلة.
ما هو التزييف العميق؟ ما هو استنساخ الصوت؟
يشير مصطلح التزييف العميق إلى وسائط تركيبية يُستبدل فيها مظهر أو صوت شخص بآخر، ما ينتج مقاطع صوتية أو فيديو مزيفة لكنها مُقنِعة. من ناحية أخرى، يتضمن استنساخ الصوت إنشاء نسخة عالية الجودة من صوت بشري باستخدام نظام تحويل النص إلى كلام (TTS). كلتا التقنيتين تستخدمان التعلم العميق، وهو فرع من الذكاء الاصطناعي يحاكي طريقة عمل الدماغ البشري في معالجة البيانات لاتخاذ القرارات.
إمكانية تزييف واستنساخ الصوت
أصبح من الممكن فعلاً تزييف الصوت أو استنساخ الأصوات. تستخدم هذه الأنظمة خوارزميات تعلّم الآلة لتحليل مجموعات ضخمة من تسجيلات الصوت. وبمجرد تدريبها، يمكن للخوارزميات توليد صوت يطابق نبرة الصوت الأصلية وطبقته وأسلوبه. تُعرَف هذه العملية أيضاً بتوليف الكلام.
إنشاء تزييف صوتي واستنساخ صوت
يتضمن إنشاء تزييف صوتي ثلاث خطوات: جمع البيانات، والتدريب، والتوليد. أولاً، يحتاج النظام إلى كمية كبيرة من عينات الصوت للصوت المستهدف. وكلما زادت البيانات المتاحة، جاءت النتائج أفضل. ثانياً، تُستخدم هذه العينات لتدريب نموذج تعلّم عميق. وأخيراً، يُولِّد النموذج صوتاً جديداً يحاكي الصوت المستهدف. توفر منصات مفتوحة المصدر على Github موارد متنوعة لهذه العمليات.
استنساخ الصوت مقابل التزييف العميق
على الرغم من أن كلاً من استنساخ الصوت والتزييف العميق يستخدمان خوارزميات تعلّم متشابهة، فإنهما يخدمان أغراضاً مختلفة. فعادةً ما يكون لاستنساخ الصوت تطبيقات عملية مثل إنشاء التعليقات الصوتية للبودكاست والكتب المسموعة أو مساعدة الأشخاص الذين يعانون من مشاكل في النطق. أما التزييف العميق فغالباً ما يُستخدم لإنتاج مقاطع صوتية مزيفة مُقنِعة لأغراض قد تكون ضارة.
كيفية اكتشاف التزييفات الصوتية واستنساخ الأصوات
قد يصعُب اكتشاف التزييفات الصوتية أو استنساخ الأصوات نظراً لجودة الصوت المُولَّدة العالية. ومع ذلك، هناك مؤشرات قد تفضحها؛ مثل نبرات أو إيقاعات كلام غير طبيعية، أو ضوضاء خلفية غريبة. يساعد تضمين مؤشرات داخل نماذج التعلّم العميق في اكتشاف التزييفات الصوتية في الوقت الفعلي. كما طوّرت شركات وباحثون عديدون تقنيات لرصد التزييفات باستخدام تعلّم الآلة لاكتشاف الفروق الطفيفة التي قد يغفل عنها البشر.
الجوانب القانونية للتزييفات العميقة
تختلف قانونية التزييفات العميقة حول العالم. ففي بعض الأماكن، يُعد إنشاء تزييفات بقصد الاحتيال أو نشر معلومات مضللة أو التسبب في ضرر أمراً غير قانوني. على سبيل المثال، قدّمت ولاية نيويورك قوانين ضد الانتحال الرقمي. ومع ذلك، قد يظل الخط الفاصل غير واضح، وغالباً ما تكافح التشريعات الحالية لمواكبة الوتيرة السريعة لتقدّم التكنولوجيا.
فوائد استنساخ الصوت وتداعيات التزييفات العميقة
رغم أن التزييفات العميقة قد تُشكّل تهديدات، خصوصاً عند استخدامها لإنشاء مقاطع صوتية مزيفة للمكالمات الهاتفية أو منشورات وسائل التواصل الاجتماعي، فإن لاستنساخ الصوت فوائد عديدة. ومن بينها إنشاء التعليقات الصوتية، وتسهيل التفريغ النصي، وتوليد أصوات تركيبية لأنظمة الذكاء الاصطناعي.
على الجانب الآخر، هناك دائماً احتمال سوء الاستخدام. فمع تزييف صوتي متقن، قد يتمكن أصحاب النوايا الخبيثة من انتحال هوية الأفراد بشكل مقنع عبر الهاتف أو في مؤتمرات الفيديو، ما قد يفضي إلى عمليات احتيال ونشر معلومات مضللة.
أفضل 9 برامج وتطبيقات للتزييف الصوتي واستنساخ الأصوات
- استنساخ صوت Speechify: استنساخ صوت Speechify هو من أفضل ما ستجده. ينسخ صوتك خلال لحظات. كل ما عليك هو الضغط على زر التسجيل في متصفحك والتحدث لمدة 30 ثانية. ستتولى تقنية Speechify AI استنساخ صوتك مباشرة.
- Resemble AI: يوفر خدمة إنشاء أصوات مخصّصة بالذكاء الاصطناعي.
- Descript: يقدّم حزمة قوية لتحرير الصوت مع مُولِّد الأصوات الاصطناعية.
- Lyrebird: قسم أبحاث الذكاء الاصطناعي لدى Descript، متخصص في توليف الأصوات.
- iSpeech: يقدّم خدمات تحويل النص إلى كلام واستنساخ الأصوات بجودة عالية.
- CereProc: متخصص في إنشاء أصوات فريدة مُولَّدة بالذكاء الاصطناعي.
- Real-Time Voice Cloning: مشروع مفتوح المصدر على GitHub يستنسخ الأصوات في الوقت الحقيقي.
- Azure Cognitive Services: يوفّر خدمات الكلام من مايكروسوفت، بما في ذلك تحويل النص إلى كلام ومعالجة الصوت.
- Voicery: ينشئ أصواتًا اصطناعية بنبرة طبيعية لاستخدامات متعدّدة.
كل خدمة من هذه الخدمات تقدّم ميزات وأسعارًا وجودات متباينة، لذا يجدر بك تقييم كل خيار وفق احتياجاتك المحددة.
مع استمرار تقدّم الذكاء الاصطناعي، يُرجَّح أن يتزايد انتشار التزييف الصوتي واستنساخ الأصوات. من الضروري فهم هذه التقنية وفوائدها المحتملة وما قد يترتب عليها من تداعيات على المجتمع في عالمنا الرقمي الآخذ في الاتساع.

