كل ما يتعلق بأصوات الديب فيك
يُعد بروز تقنيات الديب فيك من أكثر المواضيع إثارة للجدل في الأمن السيبراني والإعلام. تتعدد استخداماتها، من إنشاء محتوى للبالغين إلى الأخبار المضللة والاحتيال المالي. قد يبدو استغلال هيئة شخص وصوته من دون موافقته في مقاطع فيديو وتسجيلات مُقنِعة إنجازًا تقنيًا في الذكاء الاصطناعي، لكنه لا يخلو من الجدل.
ما هو صوت الديب فيك؟
صوت الديب فيك هو صوت يقلّد صوت شخص حقيقي بدقة شديدة. ورغم كونه مُولَّدًا، يبدو بشريًا ويمكنه استنساخ النبرة واللهجات والإيقاع والسمات المميزة الأخرى بإتقان.
الأشخاص الذين ينشئون أصوات ديب فيك أو استنساخ الأصوات يستخدمون تقنيات ذكاء اصطناعي وقدرات حوسبة قوية. وأحيانًا قد يستغرق استنساخ صوت شخص ما أسابيع. إلى جانب الأدوات والبرامج المتخصصة، تتطلب الديب فيك عادةً بيانات تدريب، وغالبًا ما يعني ذلك توافر تسجيلات كافية لصوت الشخص المستهدف.
تشبه هذه العملية إلى حد ما استخدام تحويل النص إلى كلام لإنشاء أصوات مُولَّدة. لكن برامج تحويل النص إلى كلام عادةً ما تُنتج أصواتًا بطابع طبيعي من دون محاولة تقليد صوت شخص بعينه.
لا بأس أن يستنسخ الأشخاص أصواتهم لاستخدامها في الكتب الصوتية، التعليقات الصوتية وأنواع المحتوى الأخرى. ومع ذلك، فإن إنشاء أصوات ديب فيك لأشخاص آخرين من دون موافقتهم يثير قلقًا بالغًا.
مخاطر أصوات الديب فيك
لطالما بدا التحقق الصوتي وكأنه شيء من أفلام الخيال العلمي. للأسف، التقنية موجودة اليوم لكنها بعيدة عن أن تكون مثالية. ومع تطور برامج صوت الديب فيك والشبكات العصبية، تمكن المحتالون من إحداث أضرار أكبر.
في عام 2020، تلقى مدير بنك مكالمة من شخص ظن أنه مدير شركة. تعرّف على الصوت وفوّض تحويلًا بقيمة 35 مليون دولار دون تردد. لم يكن يدري أن صوت المدير الفعلي قد تم استنساخه.
أوردت فوربس حادثة مماثلة قبل ذلك بعام. وقع ذلك في شركة طاقة بالمملكة المتحدة تعرضت للاحتيال عبر صوت ديب فيك لشخص موثوق به.
والمقلق أكثر أن الحصول على تسجيلات واضحة لأصوات الناس أصبح سهلاً؛ من أجهزة التسجيل، والمقابلات عبر الإنترنت، والمؤتمرات الصحفية، وغيرها. ومع تحسّن تقنيات التقاط الصوت كثيرًا، تصبح البيانات المُدخلة إلى نماذج الذكاء الاصطناعي أدق، فتنتج عنها أصوات ديب فيك أكثر إقناعًا.
لم تتوصل أدوات الأمن السيبراني بعد إلى طرق مضمونة لاكتشاف الديب فيك الصوتي.
أفضل برامج لصنع أصوات الديب فيك
Speechify
على خلاف أدوات أخرى في هذه القائمة، فإن Speechify Voice Over ليست تطبيقًا لاستنساخ الصوت. ومع ذلك، تعتمد تحويل النص إلى كلام لديها على خوارزميات ذكاء اصطناعي عالية الجودة لإنشاء وسائط مُولَّدة وأصوات تبدو طبيعية. يأتي استوديو Speechify Voice Over بمكتبة واسعة من الأصوات الأقرب للبشر ويمكنه إنشاء أصوات جديدة بناءً على معايير مختلفة.
يساعد تحويل النص إلى صوت الناس على متابعة النصوص المكتوبة أو إنشاء بودكاستات. بل ويمكنه إنشاء تسجيلات صوتية استنادًا إلى النص الذي تدخلونه أو تمسحونه ضوئيًا. يمكنك استخدام هذه الأصوات لأغراض التسويق، والرسائل الصادرة، وردود دعم العملاء، وغيرها.
Resemble
تُعد Resemble AI من أقوى حلول الصوت لإنشاء تسجيلات ديب فيك. ولا تتطلب أدوات الاستنساخ هذه كميات كبيرة من البيانات للشروع في العملية.
يمكنك استخدام Resemble لاستنساخ صوتك الخاص. في هذه الحالة، تكون فعّالة في إعداد مقاطع تجارية مسجلة مسبقًا، وكتابة سيناريوهات لبودكاستات، وصنع إعلانات، وما إلى ذلك. كما يدعم مولّد الكلام لغات متعددة ويوفر أدوات تعديل متنوعة لتخصيص الأصوات وإضفاء النبرة أو العاطفة.
Descript
Descript هو أداة استنساخ أصوات تتمتع بقدرات تحرير متقدمة. يعمل بالاعتماد على نصوص وتسجيلات صوتية لإنتاج أصوات واقعية يمكن استخدامها في صنع فيديوهات ديب فيك مُقنعة.
رغم أن Descript ذو منحنى تعلّم حاد، فإن خيارات التخصيص المتقدّمة، ومسجّل الشاشة، وأدوات التحرير متعدّد المسارات، يمكن أن تساعدك على إنشاء خُطب شديدة الواقعية بصوت أيّ شخص.
ReSpeecher
استخدام خوارزميات التعلّم الآلي لإنشاء أصوات ذكاء اصطناعي تشبه أصوات أشخاص حقيقيين قد يكون أمرًا مثيرًا ويوفّر فرصة تجارية ممتازة. ReSpeecher هو البرنامج الذي استخدمته Lucasfilm لإنشاء صوت لوك سكاي ووكر في مسلسل The Mandalorian.
هذا يوضّح أن بعض برامج التزييف الصوتي العميق قادرة على ما يتجاوز مجرد مقاطع قصيرة لوسائل التواصل الاجتماعي. يحظى ReSpeecher بطلب كبير بفضل قدراته على توليد كلام مُصنَّع عالي الجودة وسِجلّه الموثوق في محاكاة الأصوات البشرية.
Real-Time Voice Cloning
ليس لدى الجميع مئات الدولارات لدفعها شهريًا لـ ReSpeecher، ولا يرغبون في الانتظار ضمن قائمة الانتظار. بعض الناس يريدون خيارًا أقل تكلفة، وربما مجانيًا. Real-Time Voice Cloning هو برنامج مفتوح المصدر متاح للجميع على GitHub.
ليست أسهل أداة لتوليد الكلام، خاصةً عند التعامل مع تسجيلات بصوت شخص آخر، لكنها تتعامل جيدًا مع مقاطع صوتية أقصر. في بعض الحالات، قد تكفي عيّنات الصوت لخداع Alexa أو لإجراء بعض المقالب الهاتفية.
iSpeech
iSpeech هو مولّد أصوات مجاني آخر يركّز على استنساخ الصوت. يتضمّن محرّك تعرّف متقدّم على الكلام وقارئ نصوص إلى كلام أيضًا. يوفّر التطبيق وظائف موسّعة ومجموعة جاهزة من أصوات المشاهير.
يمكنك استخدام iSpeech لإنشاء تزييفات صوتية مخصّصة وقوالب فريدة وتسجيل صوتك. إنها أداة متعددة الاستخدامات، وإن لم تكن مقنعة بقدر غيرها في هذه القائمة. ومع ذلك فهي تمثّل تطبيقًا تمهيديًا رائعًا لعالم التزييف العميق.
Speechify – إنشاء أصوات بشرية طبيعية
Speechify يستفيد إلى أقصى حد من خوارزميات التعلّم العميق لتوليد أصوات بشرية طبيعية تبدو وكأنها بشرية دون استنساخ صوت شخص محدد. رغم ما يثيره التزييف العميق من مخاوف أمنية، فإن برامج تحويل النص إلى كلام غالبًا ما تكون أنفع من أن تُسبّب ضررًا.
جرِّب Speechify Voice Over Studio لإنشاء بودكاست وسرد قصصي، وقراءة المحتوى المعقّد بسهولة أكبر، وتعلّم لغة جديدة، وغير ذلك الكثير.
الأسئلة الشائعة
هل FakeYou مجاني؟
FakeYou هو مولد صوت ذكاء اصطناعي محدود ولكنه مجاني AI voice generator. لديه مكتبة واسعة من الأصوات المشابهة لأصوات المشاهير، ويمكن لأي شخص استخدامه إذا لم يمانع أحيانًا أوقات التحويل البطيئة. فهو بالنهاية سهل الاستخدام عبر المتصفح.
كيف يمكنك اكتشاف الأصوات المزيفة (deepfake)؟
يتطلّب اكتشاف الأصوات المزيفة برامج ومعدّات متقدّمة جدًا لتحليل أنماط الكلام والضوضاء الخلفية وعوامل أخرى.
ما الفرق بين الصوت المزيف العميق ومولد الأصوات؟
غالبًا ما تشير الأصوات المزيفة العميقة إلى أصوات مستنسخة، بينما تولّد مولدات الأصوات أصواتًا شبيهة بالبشر للاستخدامات التجارية.

