قارئات TTS مطلوبة بكثرة. فهل يعني ذلك أن جميع تقنيات تحويل النص إلى كلام تقدّم المستوى نفسه؟ كثير من قارئات الشاشة TTS تتعامل بسلاسة مع النصوص الرقمية من مستندات Microsoft Word أو صفحات الويب HTML أو نصوص منسوخة من ملفات أخرى. لكن القليل منها فقط يقدر على تحويل النصوص الرقمية المُغلقة والنصوص المطبوعة داخل الصور إلى سرد طبيعي. والأنظمة القادرة على ذلك تعتمد على تقنية التعرف الضوئي على الحروف (OCR).
ما هو التعرف الضوئي على الحروف (OCR)؟
التعرف الضوئي على الحروف، المعروف أيضاً بـ"تمييز النصوص"، هو تقنية مصمَّمة لاستخراج بيانات محددة. له تطبيقات تجارية عديدة واستخدامات ترفيهية كثيرة. غالباً ما يتكوّن هذا النوع من التقنيات من عنصر مادي لمسح الصور وعنصر برمجي لاستخراج البيانات وإعادة استخدامها. غير أن الجزء البرمجي هو الأهم والأكثر تعقيداً. يمكن لبرمجيات OCR تمييز الحروف المفردة والكلمات كاملة وترتيبها في جمل. كما تمكّن المستخدمين من تحرير المحتوى المُغلق الأصلي، بطريقة تشبه تحرير ملف PDF يحتوي على نص غير قابل للتحرير.
كيف تعمل تقنية OCR
التعرف الضوئي على الحروف (OCR) تقنية تحوّل أنواعاً متعددة من المستندات، كالمستندات الورقية الممسوحة ضوئياً وملفات PDF والصور الملتقطة بكاميرا رقمية، إلى بيانات قابلة للتحرير والبحث. تبدأ العملية بتحليل برنامج OCR لبنية صورة المستند واكتشاف المناطق التي تحتوي نصاً، ثم تقسيمها إلى أسطر وكلمات وحروف. يُقارن كل حرف بقوالب محددة مسبقاً أو يُستعان بنماذج تعلّم آلي للتعرّف عليه وتحويله إلى نص رقمي قابل للمعالجة. بهذه العملية يصبح بالإمكان تحرير النص الموجود في الصورة والبحث فيه ومعالجته رقمياً.
دمج تحويل النص إلى كلام مع OCR
يشكّل دمج التعرف الضوئي على الحروف مع تقنية تحويل النص إلى كلام أداة قوية تعزّز إمكانية الوصول والكفاءة. يقوم OCR باستخراج النص من المستندات الممسوحة أو الصور أو المواد المطبوعة وتحويله إلى نص قابل للقراءة آلياً. ثم يُمرَّر هذا النص إلى نظام TTS الذي يحوّل الكلمات المكتوبة إلى صوت منطوق. يوفّر هذا التكامل طيفاً واسعاً من الاستخدامات، مثل مساعدة الأشخاص ذوي الإعاقة البصرية على "قراءة" المواد المطبوعة، وتحويل الكتب والمستندات إلى كتب صوتية، أو إتاحة ترجمات صوتية فورية للنصوص المطبوعة بلغات أجنبية. ومع دمج OCR مع TTS، يصبح بإمكان المستخدمين التفاعل مع المحتوى النصي بطريقة أكثر مرونة، فتغدو المعلومات أسهل وصولاً للجميع بغضّ النظر عن مهارات القراءة أو الإعاقة البصرية.
استخدامات تحويل النص إلى كلام مع OCR
يفتح دمج تقنيتَي OCR وTTS آفاقاً واسعة لجعل المعلومات أسهل وصولاً وأسلس استهلاكاً في مواقف شتّى. فيما يلي بعض استخدامات تحويل النص إلى كلام باستخدام OCR:
- تقنيات مساعدة لذوي الإعاقة البصرية: تحوّل المحتوى المكتوب من الكتب أو المستندات أو الشاشات إلى كلام منطوق، مما يساعد ضعاف البصر أو المكفوفين على "قراءة" المحتوى.
- التعلّم والتعليم:
- مساندة لطلاب عُسر القراءة: تساعد الطلاب الذين يعانون عسر القراءة أو صعوبات أخرى في القراءة عبر تحويل النص المكتوب إلى صوت.
- التعلّم متعدّد الوسائط: يتيح للمتعلمين القراءة والاستماع إلى المحتوى معاً، مما يحسّن الفهم ويُرسّخ المعلومات.
- الترجمة وتعلّم اللغات: يحوّل النص المكتوب بلغة أجنبية إلى كلام منطوق، مما يساعد على تحسين النطق والفهم.
- استهلاك المحتوى الرقمي: يحوّل الكتب والمقالات الإخبارية وسائر المواد المطبوعة إلى كتب صوتية أو بودكاست للاستماع أثناء التنقّل.
- إتاحة المستندات: يجعل ملفات PDF والمستندات الممسوحة ضوئياً والصيغ غير القابلة للتحرير في متناول من يفضّلون أو يحتاجون إلى محتوى صوتي.
- تحليل الوثائق التاريخية: يحوّل المخطوطات القديمة أو الوثائق الأرشيفية إلى محتوى صوتي للباحثين والمهتمين الراغبين في الاستماع إلى النصوص التاريخية.
- الأعمال والإنتاجية: يحوّل التقارير المطبوعة غير الرقمية إلى محتوى منطوق للمهنيين المشغولين.
- التدقيق اللغوي: يساعد الكتّاب والمحررين على اكتشاف الأخطاء في المحتوى المطبوع عبر الاستماع إليه.
- الترفيه: يحوّل الكتب المصوّرة والروايات المصوّرة وسائر الوسائط البصرية إلى تجربة سمعية.
كيفية قراءة نصّ من صورة بصوت عالٍ
ليس كل مستخدمي أجهزة Apple وAndroid المحمولة يدركون أن تطبيقاتهم قد تحتوي على تقنية التعرّف الضوئي على الحروف (OCR) وميزة تحويل النص إلى كلام (TTS) قادرتين على إنجاز مهام بسيطة. فكّر في ميزات TTS المدمجة بوصفها أدوات تقرأ لك مجانًا أو تطبيقًا مجانيًا يقرأ النص من الكاميرا، إلا أن جودتها لا ترقى إلى مستوى برامج تحويل النص إلى كلام المتقدمة. إليك طريقة الوصول إلى قارئ النص من الصور على أجهزة Android وApple:
أندرويد
تأتي أجهزة Android، على الأقل تلك التي تعمل بنظام Android 12 والإصدارات الأحدث، مزودة بقارئ TTS مدمج. إنها أداة مفيدة للتنقّل وقراءة الخطوط الصغيرة وغير ذلك. ويمكنك أيضًا استخدامها لقراءة النص من الصور. إليك كيفية إعداد جهازك:
- انتقل إلى قائمة “إمكانية الوصول” عبر تطبيق “الإعدادات”.
- فعِّل خيار “تحديد للتحدث”.
- انتقل إلى علامة “الإعدادات” الخاصة بقارئ TTS وشغِّل خيار “قراءة النص على الصور”.
- ارجع إلى الشاشة الرئيسية وابدأ تشغيل تطبيق “الكاميرا”.
- وجِّه الكاميرا نحو كتاب أو صحيفة أو شاشة أخرى تحتوي على نص رقمي.
- اضغط زر “تحديد للتحدث” قبل النقر على كلمة في تطبيق “الكاميرا”.
سيبدأ قارئ TTS على Android بالقراءة من الكلمة المظللة. يمكنك تحديد أجزاء من النص بسحب إصبعك عبر الشاشة لإجراء تحديد، كما تفعل في معالج الكلمات.
أبل
لقراءة النص المطبوع بصوت عالٍ باستخدام iPhone، يلزم أن تكون الكاميرا تعمل، وأن يكون النظام iOS 15 فأحدث، مع تفعيل قارئ TTS المدمج.
- انتقل إلى قسم “إمكانية الوصول” من قائمة “الإعدادات”.
- اضغط على ميزة “المحتوى المنطوق”.
- فعِّل خياري “تحدث التحديد” و“تحدث الشاشة”.
- ارجع إلى الشاشة الرئيسية وشغِّل الكاميرا.
- وجِّه الكاميرا نحو صفحة وانتظر ظهور زر “النص الحي” على شريط الأدوات السفلي.
- اضغط الزر لتمكين قراءة الشاشة بواسطة OCR.
- اسحب لأسفل بإصبعين لبدء القراءة من أعلى الصفحة.
- اضغط كلمة أو حدِّد نصًا على الشاشة لقراءة كلمة أو جملة أو فقرة معينة بصوت عالٍ.
كما هو الحال في أجهزة Android، يضمّ iPhone وiPad قدرات OCR وTTS محدودة. ورغم أن دقة التعرّف على الكلمات فوق المتوسّط، فإن جودة الصوت تبقى مخيّبة نوعًا ما بسبب طابعها الآلي.
Speechify—أفضل TTS بتقنية OCR
صحيح أن وجود قرّاء TTS المدمجين وبرامج OCR على الأجهزة المحمولة مفيد، لكن جودتها وأداءها لا يرقَيان للمستوى المطلوب. لحسن الحظ، هناك بديل كتطبيق لقراءة النص. Speechify هو قارئ تحويل النص إلى كلام يجمع بين تقنية OCR وأصوات الذكاء الاصطناعي عالية الجودة. يتفوّق بقدراته على قارئات النص الافتراضية في الأجهزة المحمولة، ويمكنه مسح كتب كاملة ومستندات ورقية لتحويل النص المطبوع إلى نص رقمي. من هناك، تولّد الخوارزميات المعقّدة أصواتًا طبيعية يمكنك التحكّم بها وضبط سرعة قراءتها كما تشاء. يتوفر برنامج Speechify لتحويل النص إلى كلام على المنصات التالية:
سواء حصلت عليه من متجر تطبيقات Apple App Store أو متجر Google Play أو قمت بتنزيل إصدار سطح المكتب لنظام Mac أو إضافة متصفح Chrome، فإن ترخيصًا واحدًا يكفي لاستخدام Speechify على جميع أجهزتك المكتبية والمحمولة. واجهته السهلة الاستخدام تناسب جميع الفئات العمرية ومستويات الخبرة التقنية. تتوفر عمليات مسح OCR في Speechify للقراءة الفورية عبر الإنترنت.
مصممة للمستخدمين الذين يعانون من عسر القراءة، وصعوبات القراءة، وضعف البصر، ومن ينجزون مهامًا متعددة في آنٍ واحد، تقدّم تقنية المساعدة في Speechify أكثر بكثير من مجرد قارئ شاشة متكامل. إنه التطبيق الذي سترغب في استخدامه لتحويل أي نص رقمي أو مطبوع إلى كتاب صوتي، وإنشاء بودكاست، وتحسين مهارات القراءة لديك بجهد أقل وتركيز أكبر. جرّب تطبيق Speechify المجاني لتحويل النص إلى كلام وخصّص تجربة قراءة غامرة. كما يوفّر Speechify مولد أصوات مدعومًا بالذكاء الاصطناعي يتيح لك اختبار صوته بنفسك مع أي نص تكتبه.

