أصبح استنساخ الصوت، أو إنشاء نسخة مُولدة حاسوبيًا لصوت إنسان، أكثر سهولة بفضل التقدّم في تقنيات الذكاء الاصطناعي وتعلّم الآلة. سيرشدك هذا المقال إلى جوانب استنساخ الصوت، بما في ذلك التكاليف والعمليات وأفضل البرامج والتطبيقات المتاحة في السوق.
ما هو استنساخ الصوت؟
تستخدم تقنية استنساخ الصوت أدوات الذكاء الاصطناعي وخوارزميات تعلم الآلة لتوليد أصوات اصطناعية تحاكي أصوات البشر. من خلال تحليل عينات الصوت، يمكن لتقنية الصوت المعتمدة على الذكاء الاصطناعي إنتاج نسخة دقيقة وعالية الجودة من صوت الشخص، بما في ذلك التقاط الفروق الدقيقة وأنماط النطق. تشمل الاستخدامات إنشاء المحتوى لوسائل التواصل الاجتماعي والتعلم الإلكتروني والكتب الصوتية وألعاب الفيديو والبودكاست وغيرها.
هل يمكنني استنساخ صوتي بنفسي؟
نعم بالتأكيد، يمكنك استنساخ صوتك. كل ما تحتاجه ملف صوتي عالي الجودة لصوتك. ثم تُدخِل هذا الصوت في برنامج استنساخ الصوت، الذي يستخدم توليف الكلام وتقنيات الذكاء الاصطناعي لنمذجة صوتك. لا فرق كنت ذكرًا أم أنثى؛ ما دمت تملك تسجيلات صوتية، يمكن للتقنية استنساخ صوتك.
كيف يتم استنساخ الصوت؟
يتضمن استنساخ الصوت التقاط عينات صوتية، تُستخدم بعد ذلك لتدريب نموذج تعلّم آلي. كلما زادت كمية البيانات لدى النموذج، زادت قدرته على توليد صوت واقعي يشبه الصوت المستهدف إلى حد كبير. تتضمن العملية ما يلي:
- تسجيل الصوت: سجّل مجموعة من العبارات في ملف صوتي واضح وعالي الجودة.
- تدريب الذكاء الاصطناعي: تُستخدم العينات المسجلة لتدريب نظام الذكاء الاصطناعي، بما يُنشئ نموذجًا صوتيًا.
- توليد الصوت المستنسخ: بمجرد أن يصبح نموذج الصوت جاهزًا، يمكن للنظام إنتاج أصوات اصطناعية في الوقت الحقيقي، وحتى بلغات مختلفة.
كم ستكلفني عملية استنساخ صوتي؟
تتفاوت تكلفة استنساخ الصوت بشكل كبير اعتمادًا على مزودي الخدمة، وتعقيد نموذج الصوت، والجودة المطلوبة، وطول مخرجات تحويل النص إلى كلام. تعرض بعض الشركات أسعارًا متدرجة بحسب كمية الصوت المُولَّد. حتى عام 2023، تراوحت الأسعار من نحو 10 دولارات إلى مئات الدولارات لكل ساعة من المحتوى الصوتي المُولَّد.
كم تكلفة الصوت المعتمد على الذكاء الاصطناعي؟
تختلف تكلفة توليد الصوت بالذكاء الاصطناعي كثيرًا حسب المنصة وحجم الاستخدام. تقدّم بعض المنصات خططًا مجانية، لكنها تأتي مع قيود. عادةً ما تبدأ الخطط المدفوعة من نحو 10 دولارات شهريًا وقد تصل إلى مئات الدولارات للاستخدام الاحترافي واسع النطاق.
كيف تكرر صوت إنسان؟ كيف تستنسخ صوت شخص ما؟
يتضمن تكرار صوت إنسان مزيجًا من تسجيل الصوت وتعلم الآلة وتوليف الكلام. وإليك الخطوات:
- سجّل الصوت: ابدأ بتسجيل عينات صوتية عالية الجودة للشخص الذي تريد تكرار صوته. كلما كثرت العينات وكانت التسجيلات أنقى، كان التكرار أدق.
- درّب الذكاء الاصطناعي: تُغذّى هذه العينات في نموذج تعلّم آلي. يتعلم هذا النموذج خصائص الصوت وملامحه وتبايناته الخاصة بالمتحدث.
- ولّد الصوت الاصطناعي: بعد تدريب النموذج، يمكنه توليد أصوات اصطناعية تشبه المتحدث الأصلي. يمكن للذكاء الاصطناعي حتى إنتاج الكلام في الوقت الحقيقي، ليبدو كما لو أن الشخص يتحدث فعلًا.
هل يجب أن تكون رجلاً لاستنساخ صوتك؟
لا، لست بحاجة إلى أن تكون رجلًا لاستنساخ صوتك. يمكن استخدام تقنية استنساخ الصوت لاستنساخ أي صوت بغض النظر عن الجنس. طالما توفرت عينات صوتية كافية وعالية الجودة، يمكن للتقنية إنشاء نسخة مستنسخة لأي صوت.
ما تكلفة استنساخ الصوت؟
تعتمد تكلفة استنساخ الصوت على المزود ومدى الاستخدام. تقدّم بعض المنصات نموذج الدفع حسب الاستخدام، حيث تدفع مقابل كل كلمة أو جملة يُولّدها الذكاء الاصطناعي. لدى منصات أخرى نماذج اشتراك، بأسعار تتراوح من نحو 10 دولارات إلى مئات الدولارات شهريًا. وقد تكون خدمات المؤسسات ذات المتطلبات الكبيرة أعلى تكلفة.
كيف تُنشئ صوت شخص آخر؟
لإنشاء صوت شخص آخر، ستسير على الخطوات نفسها المتبعة لنسخ صوت الإنسان كما أشرنا سابقًا. ستحتاج إلى مجموعة تسجيلات صوتية عالية الجودة لذلك الشخص، تُستخدَم لاحقًا لتدريب نموذج التعلم الآلي. بعد تدريب نظام الذكاء الاصطناعي على هذه العينات، يمكنه توليد صوت اصطناعي يُحاكي صوت ذلك الشخص.
كم تبلغ تكلفة استنساخ الصوت؟
تختلف تكلفة استنساخ الصوت كثيرًا تبعًا لعدة عوامل، منها:
- المزوّد: يمتلك المزوّدون نماذج تسعير متباينة، مثل الدفع حسب الاستخدام، والاشتراكات، وخطط الشركات.
- الاستخدام: حجم المخرجات الصوتية التي تحتاجها يؤثر في التكلفة؛ فكلما زاد المحتوى الذي تريد توليده ارتفعت الكلفة.
- الجودة والتعقيد: إن احتجت صوتًا بخصائص فريدة أو تعبيرات عاطفية، زاد ذلك من التكلفة.
عمومًا، تبدأ الأسعار من نحو 10 دولارات شهريًا للاستخدام الأساسي، وقد تصل إلى مئات الدولارات للاستخدام الاحترافي المكثّف.
أفضل 8 أدوات وتطبيقات لاستنساخ الصوت
- Resemble AI: معروف بإنتاج أصوات اصطناعية عالية الجودة، ويُستخدم على نطاق واسع في البودكاست والكتب الصوتية وتطوير الألعاب. يوفر واجهة برمجة تطبيقات للمطورين وخطط تسعير متنوعة.
- Play.ht: مفضّل لدى صنّاع المحتوى والممثلين الصوتيين لبساطة منصته. ممتاز لإنشاء التعليقات الصوتية ويدعم لغات متعددة.
- ReSpeecher: يُستخدم في صناعة السينما لاستنساخ أصوات الممثلين. يتميز بدقّة عالية وصوت واقعي.
- CereProc: شائع في قطاع التعليم الإلكتروني، ويوفّر مجموعة واسعة من الأصوات التعبيرية والفريدة.
- Lyrebird AI: يوفّر واجهة برمجة تطبيقات سهلة الاستخدام واستنساخًا صوتيًا عالي الجودة، مع تركيز على الاستخدامات الأخلاقية المتقدمة.
- iSpeech: مثالي لإنشاء أوامر صوتية مخصّصة أو تعليقات صوتية مع خيارات صوتية ولغوية متعددة.
- Google's Text-to-Speech: مجاني ويدعم لغات متعددة ويتكامل بسهولة مع خدمات Google الأخرى.
- Amazon Polly: مصمّم للمطورين وممتاز لبناء تطبيقات تعزّز التفاعل وإمكانية الوصول.
كما هو الحال مع أي تقنية جديدة، يصاحب استنساخ الصوت اعتبارات أخلاقية، خصوصًا مع احتمالات إساءة الاستخدام مثل التزييف العميق. لكن عند استخدامه بمسؤولية، تفتح أدوات استنساخ الصوت آفاقًا واسعة عبر صناعات متعددة، من الترفيه إلى التعليم.
أينما كنت—في نيويورك أو غيرها—يمكنك الاستفادة من تقنية استنساخ الصوت وصنع بصمتك الصوتية الذكية. حان الوقت ليُسمَع صوتك، وبأكثر من طريقة.

