مؤسس Speechify يناقش مستقبل الذكاء الاصطناعي في بودكاست Everyday AI
هل ستكون أصوات المشاهير مستقبل الذكاء التوليدي؟ وهل الذكاء الاصطناعي آمن؟ جلس مؤسّس Speechify ومديرها التنفيذي، كليف وايتزمان، مع جوردان ويلسون في الحلقة 152 من بودكاست Everyday AI لمناقشة هذه الأسئلة والمزيد.
بودكاست Everyday AI
بودكاست Everyday AI هو بث مباشر يومي مجاني شهير، إلى جانب بودكاست ونشرة بريدية تساعد الأشخاص العاديين على تطوير مساراتهم المهنية باستخدام الذكاء الاصطناعي. لا يكتفي البودكاست بإبقاء المستمعين على اطّلاع بأحدث النصائح والاتجاهات في مجال الذكاء التوليدي سريع النمو، بل يضمن أيضًا تعلّم كيفية توظيف الذكاء الاصطناعي لتحقيق النجاح. منذ انطلاقه في أبريل 2023، بودكاست Everyday AI جذب 22,000 مستمعًا و7,800 مشتركًا يوميًا في النشرة البريدية ممّن يرغبون في تعلّم الرؤى والاستراتيجيات للعمل بذكاء أكثر، لا بجهد أكثر، ورفع سقف نجاحهم بمساعدة الذكاء الاصطناعي.
قصة Speechify
طوّر كليف وايتزمان Speechify أصلًا بعد معاناته في الجامعة من عسر القراءة (الديسلكسيا) واكتشافه أن معظم المقررات ليست متاحة ككتب صوتية. اليوم، هو التطبيق رقم 1 لتحويل النص إلى كلام في العالم، مع أكثر من 150,000 تقييم بخمس نجوم وأكثر من 25 مليون مستخدم. كيف بلغت شعبيته حدّ أن Snoop Dogg نفسه أراد الشراكة مع الشركة؟ تطرّق وايتزمان إلى ذلك وغيره في الحلقة 152 من بودكاست Everyday AI التي نُشرت يوم الاثنين، 27 نوفمبر.
كيف يعمل Speechify
أوضح وايتزمان أن Speechify مبني على أفضل محرّك لتحويل النص إلى كلام (TTS)، مع مولد أصوات بالذكاء الاصطناعي من أعلى جودة في العالم لتحويل أي نص إلى كلام فورًا وبأسعار في المتناول. مع تطبيقات لأندرويد وMac وiOS، ونسخة ويب بالإضافة إلى امتدادات لمتصفح Microsoft Edge وChrome، لا يقتصر Speechify على قراءة النص الرقمي مثل ملفات PDF ومقالات الأخبار ومستندات Google ورسائل البريد الإلكتروني بصوت عالٍ فحسب. باستخدام تقنية OCR والذكاء الاصطناعي المتقدّمة، يمكن للمستخدمين التقاط صور سريعة للكتب الدراسية وأدلة الدراسة والملاحظات اليدوية وغيرها من الوثائق المادية وتحويلها إلى ملفات صوتية نابضة بالحياة في الوقت الفعلي.
استخدامات Speechify ورسالتُه
من خلال السماح للمستخدمين بالاستماع إلى النص بدلًا من قراءته، أو أثناء القراءة مع ميزة تمييز النص في Speechify، يمكن للمستخدمين استيعاب المعلومات أسرع وأسهل وبكفاءة أعلى. وقد جعل هذا من Speechify أداة ذكاء اصطناعي لا غنى عنها للطلاب والأفراد الذين يعانون من فروق أو إعاقات تعلم، مثل عسر القراءة (الديسلكسيا)، وفرط الحركة وتشتت الانتباه، وضعف الرؤية، والعمى، والتوحد، وارتجاجات الدماغ، والقلق.
مع ذلك، ورغم أن Speechify استُخدم في سنواته الأولى أساسًا كتقنية مساعدة لأصحاب فروق التعلّم، فإن جميع أنواع الأشخاص يستخدمونه الآن، بما في ذلك — بحسب وايتزمان — الأطباء والمحامون والمحاسبون والعسكريون والمديرون التنفيذيون والمتخصصون في المالية ومتعلمو اللغات ومتعددو المهام الذين يرغبون في رفع إنتاجيتهم وتسريع وتيرة قراءتهم، وذلك بفضل أصواته الطبيعية عالية الجودة وتقنية OCR الخاصة به.
في الواقع، شارك وايتزمان أن هدف Speechify هو ضمان "ألّا تكون القراءة عائقًا أمام التعلّم لأي شخص، مهما كانت خلفيته."
أصوات المشاهير
ومع توسّع Speechify، سنحت له فرصة التعاون مع بعض المشاهير البارزين. في الحلقة، ناقش وايتزمان وويلسون كيف وُلدت شراكة Speechify مع Snoop Dogg، الذي أتاح صوته ليكون ضمن العديد من خيارات الصوت في Speechify.
أوضح وايتزمان أن كثيرًا من شراكات Speechify تبدأ حين يتواصل أشخاص يستخدمون المنتج بأنفسهم. وأضاف أنّ وكيل Snoop Dogg تواصل مع Speechify، موضحًا أن Snoop أراد استخدام صوته لمساعدة جمهوره على استيعاب المعلومات. فانتهى الأمر بوايتزمان إلى السفر إلى الاستوديو الخاص بـ Snoop Dogg لتسجيل صوته واستنساخه عبر استنساخ الصوت وتقنيات توليد الكلام.
ومن بين أكثر من 200 صوت بالذكاء الاصطناعي في Speechify عبر لغات متعددة، بما في ذلك الإنجليزية والصينية والإسبانية والبرتغالية وغيرها، يتوفر أيضًا صوت الممثلة والمستثمِرة منذ زمن طويل في Speechify غوينيث بالترو كخيار للقراءة بتحويل النص إلى كلام.
لكن مع هذه الخيارات من أصوات المشاهير التي يمكنها قراءة أي شيء من منشورات التواصل الاجتماعي إلى الأوراق البحثية، تأتي ضوابط يطبّقها Speechify لتفادي سوء الاستخدام.
أمان الذكاء الاصطناعي واستنساخ الصوت
مع إقرار Speechify بفوائد أدوات تحويل النص إلى كلام وتقنية استنساخ الصوت بالذكاء الاصطناعي، شدّد وايتزمان أيضًا على أن من أبرز أولويات Speechify حماية صنّاع المحتوى والأفراد، لأن "أمان الذكاء الاصطناعي مهم للغاية."
أضحى تطبيق سياسات السلامة أكثر إلحاحًا مع توسّع Speechify في قدرات تحويل النص إلى كلام وإطلاق منتجات جديدة مثل Speechify Studio، وهي حزمة أدوات مدعومة بالذكاء الاصطناعي تمكّن صنّاع المحتوى من إنشاء تعليقات صوتية بالذكاء الاصطناعي، وأصوات مخصّصة، وترجمة التعليقات الصوتية، وتفريغ أعمالهم نصيًا تلقائيًا، وتحرير الفيديوهات، واستخدام الصور الرمزية بالذكاء الاصطناعي.
على سبيل المثال، أوضح ويتزمان أن Speechify يسمح للمستخدمين باستنساخ صوتهم فقط أو صوت شخص مقرّب منهم، مثل صديق منح موافقته، وليس أي صوت على الإنترنت، درءًا لسوء الاستخدام وكذلك لانتحال الهوية أو انتهاك حقوق الطبع والنشر.
قال ويتزمان: "فلسفتنا بشكل عام في Speechify تمنح أصحاب الحقوق زمام القيادة." وأضاف أن تقنية الذكاء الاصطناعي في Speechify ليست لإحلال منشئي المحتوى مثل مؤدي الصوت للكتب المسموعة مكانهم بل لـ"تعزيز قدراتهم الإبداعية"، كأن تساعدهم على إنتاج المزيد من المحتوى بكفاءة أعلى.
كما كشف ويتزمان أن Speechify تعمل حاليًا على منتج يتيح للمستخدمين التمييز بسهولة بين الصوت البشري والصوت الاصطناعي المُولَّد بالذكاء الاصطناعي، وإذا كان الصوت مزيفًا فسيحدّد مصدر إنشائه الأصلي — وهي حماية تساعد على منع الناس من الوقوع ضحية لعمليات احتيال صوتية يستخدم فيها المجرمون مبدِّلات صوت لانتحال صوت أحد الأحبّة لأغراض خبيثة.
استمع إلى كليف ويتزمان على بودكاست Everyday AI
للتعرّف أكثر إلى كيف تسهم تقنية تحويل النص إلى كلام في Speechify في تشكيل مستقبل التعلّم وصناعة المحتوى، استمع إلى هذه الحلقة الخاصة من بودكاست Everyday AI على منصات البودكاست الرئيسية مثل Apple Podcasts وSpotify أو استمع أدناه:
التوقيتات الزمنية للحلقة:
[00:12:50] السلامة في مجال تحويل النص إلى كلام
[00:18:12] حالات استخدام تحويل النص إلى كلام
[00:21:05] أسئلة الجمهور
[00:24:10] مستقبل تحويل النص إلى كلام
[00:27:28] هل باتت الكلمة المكتوبة أقل تأثيرًا؟
[00:31:30] الاستخدام الاحترافي لتحويل النص إلى كلام

