تُعدّ IBM مرادفًا للحواسيب والتكنولوجيا الحديثة. إنها واحدة من تلك العلامات التجارية المحفورة في الذاكرة مثل Microsoft وApple. ولأسباب وجيهة أيضًا: فهي تنتج بعضًا من أرقى البرمجيات التي توفر لنا ميزات مفيدة تحسّن حياتنا اليومية.
ومن أبرزها بالتأكيد IBM Watson. تطبيق تحويل النص إلى كلام قائم على التعلم العميق، جاهز لتحويل أي محتوى مكتوب إلى ملف صوتي عالي الجودة عبر العديد من الأصوات الواقعية الطابع. لذا، في السطور التالية، سنأخذك في جولة داخل هذا التطبيق لنرى إن كان يبرّر سعره وخطط التسعير.
ما هو Watson لتحويل النص إلى كلام؟
باختصار، Watson Text to Speech عبارة عن واجهة برمجة سحابية توفر معالجة اللغة الطبيعية. تولّد أصواتًا بالذكاء الاصطناعي تعمل بعدة لغات لتحقيق ذلك. تبدو هذه الأصوات طبيعية للغاية لدرجة يصعب معها تمييزها عن الأصوات البشرية الحقيقية. إنه برنامج قوي وسهل الاستخدام ولا يحتاج إلى أي تعليمات معقّدة.
يمكنك استخدامه كمساعد افتراضي للتواصل مع شركاء أجانب بلغتهم الأم، وكذلك لتقليص أوقات الانتظار في تفاعلات دعم العملاء. علاوة على ذلك، يعزّز سهولة الوصول لذوي عُسر القراءة والأشخاص المصابين بفرط الحركة أو ضعف البصر. لكن دعنا لا نستبق الأحداث. سنتحدث عن حالات الاستخدام والفوائد بعد قليل.
الميزات
كما هو الحال مع أي تطبيق مميّز، لدى Watson لتحويل النص إلى كلام الكثير ليقدّمه لمستخدميه. إنه ليس مجرد أداة بسيطة لتوليد الكلام في الوقت الحقيقي؛ يمكنه القيام بأكثر من ذلك بكثير. فلنستعرض أبرز ميزاته، ما رأيك؟
اللغات
يدعم Watson Text to Speech أكثر من 10 لغات مختلفة، من بينها الإنجليزية والألمانية والإيطالية والصينية والعربية والبرتغالية. وعلى عكس بعض تطبيقات TTS الأخرى، يمكنك استيراد نص بلغة وجعل التطبيق يقرأه بلغة أخرى. إنها ميزة رائعة تفيد متعلّمي اللغات على نحوٍ خاص.
قدرات التحرير
على الرغم من أنه ليس برنامج تحرير في الأساس، يمكنك التلاعب ببعض خيارات SDK الأساسية. على سبيل المثال، بمجرد فتح تطبيق Watson لتحويل النص إلى كلام، سترى فورًا مربّع الإدخال حيث يمكنك البدء بالكتابة أو لصق نص مكتوب مسبقًا. بعد ذلك، يمكنك اختيار اللغة وضبط الصوت.
تحديدًا، يمكنك اختيار لهجات وأصوات مختلفة، وكذلك السرعة والنبرة. على سبيل المثال، تضم الإنجليزية لهجات أمريكية وبريطانية وأسترالية لتختار منها. وبالطبع، هذا ليس ثوريًا مقارنةً بما تقدّمه تطبيقات TTS اليوم، لكنه كافٍ لإرضاء المستخدم العادي.
تنوع الأصوات
كما ذُكر، لكل لغة أصوات متعددة. هذا يعني أنه للإنجليزية الأمريكية يمكنك الاختيار من بين 11 راويًا بالذكاء الاصطناعي، من Alison إلى Michael، لكلٍ منها خصائصه الفريدة. وبالإضافة إلى اختلاف الجنس بين ذكور وإناث، فإن بعض الأصوات أنسب للتعليقات الصوتية التعليمية للتعلّم الإلكتروني، فيما أخرى مرحة وتناسب مقاطع YouTube.
ما الذي يميّزه؟
فما الذي يجعل IBM Watson مختلفًا عن خيارات TTS الأخرى في السوق؟ بخلاف قوة العلامة التجارية، يقدّم هذا التطبيق أصوات ذكاء اصطناعي عالية الجودة جميعها عصبية (Neural)، أي أقرب للواقعية. ثانيًا، يمكنك إنشاء صوت مخصّص أيضًا، وهي لمسة لطيفة دائمًا لمنشئي المحتوى.
لكن هذا ليس كل شيء. لدى هذا المساعد من Watson المزيد ليقدّمه. يمكنك تحديد نطق الكلمات. إنها ميزة مفيدة لتوضيح الكلمات غير المألوفة، وستجعل نصك يبدو أكثر احترافية.
ثم تأتي تعبيرية الراوي. يمكن لكل صوت أن يحمل أسلوب إلقاء مثل GoodNews أو Apology أو Uncertainty. وإذا جمعت ذلك مع إمكانية تعديل النغمة والحجم والسرعة، فالنتيجة رائعة حقًا.
فوائد الاستخدام
كل هذا يقودنا إلى السؤال الأهم: من الذي سيستفيد أكثر من IBM Watson لتحويل النص إلى كلام؟ الإجابة: كثيرون. من أصحاب الأعمال الصغيرة الذين يريدون تحسين تجربة المستخدم عبر بوت دردشة فعّال، إلى الأفراد الذين يصنعون مقاطع لوسائل التواصل أو للتعلّم الإلكتروني، يُعدّ خيارًا مناسبًا للجميع. ومع ذلك، هل يستحق الأمر؟ دعنا نرى.
الأسعار
رغم أنه ليس تطبيقًا مفتوح المصدر، لدى Watson باقة مجانية تُسمى Lite. إنه حلّ ممتاز لأي شخص لا يرغب في إنفاق المال على برنامج تحويل النص إلى كلام الآن. يمكنك تحويل 10,000 حرف شهريًا، واستخدام 35 صوتًا، وهناك 16 لغة ولهجة للاختيار من بينها.
من ناحية أخرى، توجد خطط التسعير Standard وPremium وDeploy Anywhere. تختلف أسعارها، ويمكنك التواصل مع IBM لمناقشة التفاصيل. كل واحدة منها توفّر تحويلًا غير محدود للنص إلى كلام، و35 صوتًا، وكافة اللغات واللهجات. يكمن الفرق الوحيد بينها في مستوى التكامل مع خدمات سحابية خارجية مثل Google Cloud.
Speechify
طبعًا، إلى جانب Watson توجد خيارات أخرى في سوق تحويل النص إلى كلام. أحد أكثر التطبيقات شهرة هو Speechify، ويستحق التجربة. يعتمد على نماذج التعلم الآلي والذكاء الاصطناعي وخوارزميات OCR. تتيح لك هذه التقنيات مجتمعة تصوير النص ليقرؤه Speechify بصوتٍ عالٍ، فضلًا عن التحويل الأساسي للنص إلى كلام.
يقدّم Speechify أكثر من 30 صوتًا بتقنية الذكاء الاصطناعي تتحدّث بأكثر من 15 لغة مختلفة. يتوفر Speechify على هواتف iOS وAndroid، كتطبيق على macOS، وكإضافة لكلٍ من Google Chrome وSafari. لذا، جرّبوه وحوّلوا أي نص إلى صوت.
الأسئلة الشائعة
هل يمكنك استخدام IBM Watson لتحويل النص إلى كلام لأغراض تجارية؟
اتفاقية SaaS التي تعقدها مع IBM تنص على أنك مخوّل باستخدام Watson TTS للاستخدام الشخصي فقط، وليس للأغراض التجارية. على سبيل المثال، لا يمكنك تقاضي أجر من الآخرين لقاء تحويل نصوصهم إلى كلام باستخدام نسختك المرخّصة من Watson.
كيف يمكنني تنزيل تطبيق Watson لتحويل النص إلى كلام؟
أولًا، ستحتاج إلى إنشاء حساب على IBM Cloud. ما إن تفعل ذلك، ستُعاد توجيهك إلى صفحة التنزيل لتختار الإصدار (x64 أو x86) من Watson Text to Speech المناسب لجهازك.

