على خلاف الاستنساخ الحقيقي، استنساخ الصوت آمن وسهل التعلّم ومتاح عمليًا للجميع ممن لديهم اتصال بالإنترنت. وفوق ذلك، فهو ليس عمليًا فحسب، بل مفيد أيضًا، إذ يُحدث ثورة في الطريقة التي نتعامل بها مع التعليم والأعمال وألعاب الفيديو والأدب وكل ما يخطر ببالك. هل ترغب في تجربته؟ تابعنا!
ما هو استنساخ الصوت؟
استنساخ الصوت هو بالضبط ما تتخيّله — تكرار وتوليد صوت فرد بواسطة الذكاء الاصطناعي (AI). قد يبدو كخيال علمي، لكن على الأرجح أنك جربته من قبل. تذكّر ذلك البرنامج لتحويل النص إلى كلام الذي لعبت به وحصلت من خلاله على قراءة الأخبار بصوت آرنولد شوارزنيغر؟ هذا مثال على استنساخ الصوت. إضافات المتصفح وتطبيقات تحويل النص إلى كلام (TTS) ليست متطورة أو قوية بقدر حلول استنساخ الصوت المتقدّمة. وهذا طبيعي، فذلك ليس هدفها الأساس. أما حلول الاستنساخ الحقيقية فتتعمّق أكثر في تحليل أنماط الكلام، ما يتيح لها التقاط كل التفاصيل التي تجعل صوت الشخص فريدًا واستخدامها. وكما قد تتوقع، كلما زادت المعطيات المتاحة كانت الأصوات الاصطناعية أقرب إلى الواقع وكانت نماذج التعلّم الآلي أكثر تقدّمًا.
استخدامات استنساخ الصوت
استنساخ الصوت ليس مجرد حيلة؛ فله العديد من الاستخدامات في التعليم والأعمال والطب وغيرها. وبطبيعة الحال، كما هو الحال مع الاستنساخ الحقيقي، لا بد أن تُثار أسئلة أخلاقية (تذكّر فضائح التزييف العميق المسربة). لكن سنؤجل السجالات الفلسفية ليومٍ آخر، ولننظر إلى الجانب المشرق.
التعليم
ينتقل التعليم، ببطء لكن بثبات، إلى العالم الرقمي. لسنا هنا لمناقشة تبعات ذلك على المنظومة التعليمية، بل للإشارة إلى حقيقة بسيطة — الشاشات ومكالمات الزوم تحلّ محلّ الفصول والسبّورات. وهذا يمنحنا وفرة من الموارد لنستخدمها في جعل محاضراتنا أشد جذبًا ومتعة. مع استنساخ الصوت، على سبيل المثال، يمكننا استخدام التعلّم العميق لتكرار أصوات الشخصيات التاريخية. تخيّل الاستماع إلى نيكولا تسلا يشرح لك التيار المتردد.
الكتب الصوتية
ولدينا أيضًا الكتب الصوتية. مع أننا نراها أدوات تعليمية ووسيلة للاسترخاء، فهي أهم من ذلك بكثير. بالنسبة لبعض الأشخاص، هي نافذتهم الوحيدة إلى الكلمة المكتوبة، خصوصًا ضعاف البصر. وباستنساخ الصوت يمكننا جعل الكتب الصوتية أمتع وأكثر جاذبية.
خدمات تحويل النص إلى كلام
قبل أن نرى كيف يعمل استنساخ الصوت في الوقت الفعلي وتوليد الكلام، فلنعد قليلًا إلى برامج تحويل النص إلى كلام ونرى مدى جودتها. مثلًا، لنلقِ نظرة على Speechify، من بين أكثر حلول TTS تقدّمًا المتاحة. ماذا يمكن أن يفعل Speechify؟ يحوّل أي نص إلى ملفات صوتية، ويمسح المستندات الورقية ليحوّلها إلى كلام، ويساعدك على إنشاء تعليق صوتي لمدونتك، وغيرها. لماذا نذكر ذلك؟ لأن تطبيقات TTS متاحة وبأسعار معقولة، ولا تستفيد كثيرًا من استنساخ الصوت فحسب، بل تساهم أيضًا في دفعه إلى التيار العام. على سبيل المثال، لدى Speechify أصوات مشاهير، لذا يمكنك الاستماع إلى روايتك المفضلة بصوت غوينيث بالترو. وبالمناسبة جربها.
كيف تُصنع أصوات الذكاء الاصطناعي؟
الآن نعود إلى الجانب التقني لنشرح كيف تُصنع أصوات الذكاء الاصطناعي فعلًا وكيف تبدو بشرية. لا تقلق — لن نجعلها معقّدة جدًا. كما ذكرنا، تستخدم تقنية استنساخ الصوت الذكاء الاصطناعي والتعلّم العميق لتفهم ما الذي يميّز صوت كل شخص. نتحدّث عن النبرة والطبقة واللهجة وشدّة الصوت وكل ما نُسنده عادةً إلى الأصوات البشرية. وكما قد تتخيّل، يتطلب ذلك تقنيات قوية لاستخلاص كل هذه السمات؛ لكنه ممكن. المهم فعليًا هو تزويد الشبكات العصبية العميقة بكمّ كبير من المدخلات الصوتية. وهذا، بشكل أو بآخر، يشبه طريقتنا في تعلّم اللغات الأجنبية! وبالطبع تطوّرت التقنية؛ فبعض الحلول تحتاج إلى بضع ساعات فقط لإتقان الصوت المطلوب، وهذا رائع حين لا تتوفر بيانات صوتية كثيرة يمكننا الاستفادة منها (تذكّر ما قلناه عن الشخصيات التاريخية).
تطبيقات استنساخ الصوت
كما قد تتوقع، هناك اليوم الكثير من تطبيقات استنساخ الصوت مع انتشار الإنترنت. بالطبع، بعضها يقوم بعملٍ أفضل من غيره. إليك بعضًا من أبرز اختياراتنا التي يمكنك استخدامها لإنشاء أصواتك الاصطناعية واستغلال القوة الكاملة لتوليف الكلام وأنت مرتاح في منزلك:
- Respeecher
- Murf
- Resemble
- Descript
مواقع استنساخ الصوت
إذا كنت معتادًا على أدوات تحويل النص إلى كلام، فأنت تعلم أنك لست مضطرًا دائمًا لتنزيل تطبيقات لإنجاز المهمة. بدلًا من ذلك، يمكنك الاعتماد على إضافات المتصفح والمواقع لتحقيق نتيجة أسرع. وينطبق الأمر ذاته على استنساخ الصوت بالذكاء الاصطناعي؛ فمثلًا يمكنك تجربة خدمة مثل Zzlab. لكن إن أردت أقصى استفادة من برامج الكلام بالذكاء الاصطناعي، فننصح بتنزيل Speechify أو أيٍّ من الأدوات التي ذكرناها أعلاه.
الأسئلة الشائعة
ما الفرق بين استنساخ الصوت وتغيير الصوت (المورفينغ)؟
الإجابة سهلة: تغيير الصوت (المورفينغ) هو مجرد تعديل لصوت المتحدث ليبدو مختلفًا، أي تمريره عبر مُرشِّح رقمي ما. أما استنساخ الصوت فهو عملية أعقد تتضمن التعلم العميق والتعلم الآلي لإنشاء صوت ذكاء اصطناعي قادر على توليد الكلام بنفسه، لا مجرد تبديل صوت المتحدث في الوقت الفعلي.
من أسهل شخص يمكن استنساخه صوتيًا؟
أسهل نموذج صوتي للاستنساخ هو الذي تتوفر له أكبر كمية من بيانات الصوت وعيّنات التسجيل. مثلًا، يمكنك استخدام تسجيلاتك أنت، أو الاعتماد على أصوات صنّاع المحتوى والمشاهير، لأن الخوارزميات تميل أصلًا إلى تفضيلهم.

