1. الرئيسية
  2. إمكانية الوصول
  3. تحويل نص الصورة إلى كلام — التقط صورة لصفحة واستمع إليها بصوت عالٍ
إمكانية الوصول

تحويل نص الصورة إلى كلام — التقط صورة لصفحة واستمع إليها بصوت عالٍ

Cliff Weitzman

كليف وايتزمان

الرئيس التنفيذي ومؤسس Speechify

قارئ النص إلى كلام رقم 1.
دع Speechify يقرأ لك.

apple logoجائزة آبل للتصميم 2025
أكثر من 50 مليون مستخدم

المحولات النصية إلى صوت (TTS) تحظى بطلب كبير وتتوفر بكثرة. لكن هل يعني ذلك أن جميع تقنيات تحويل النص إلى كلام تقدم نفس الأداء؟ العديد من برامج قراءة الشاشة TTS يمكنها معالجة النص الرقمي من مستندات مايكروسوفت وورد أو صفحات الويب HTML أو النص المنسوخ من ملفات نصية أخرى، لكن القليل منها فقط يمكنه تحويل النص المقفل رقميًا أو النصوص الورقية من الصور إلى سرد طبيعي وواضح. تلك التي تستطيع ذلك تستخدم تقنية التعرف الضوئي على الحروف (OCR).

Turn Any Page Into a Voice

ما هي تقنية التعرف الضوئي على الحروف (OCR)؟

تقنية OCR، المعروفة بالتعرف الضوئي على الحروف أو التعرف على النص، هي تقنية مصممة لاستخلاص البيانات المتخصصة. لها تطبيقات عديدة في الأعمال التجارية بالإضافة إلى الاستخدام الشخصي والترفيهي. عادةً ما تتكون هذه التقنية من عنصرين: عنصر مادي لمسح الصور وعنصر برمجي لاستخلاص البيانات وإعادة استخدامها. لكن الجزء البرمجي هو الأكثر إثارة وتعقيدًا. يمكن لبرنامج OCR تمييز كل حرف وكلمة كاملة وترتيبها في جمل. بالإضافة إلى ذلك، يمكن للمستخدمين تعديل المحتوى الأصلي المقفل، كما هو الحال عند تحرير ملف PDF يحتوي على نص مقفل.

كيف تعمل تقنية OCR

يُعد التعرف الضوئي على الحروف (OCR) تقنية تحول أنواعًا مختلفة من المستندات، مثل المستندات الورقية الممسوحة ضوئيًا، أو ملفات PDF، أو الصور الملتقطة بواسطة الكاميرا الرقمية، إلى بيانات قابلة للتحرير والبحث. تبدأ العملية عند تحليل البرنامج للبنية العامة لصورة المستند، وذلك بتحديد المناطق التي تحتوي على نص. ثم يقوم بتقسيم هذه المناطق إلى أسطر وكلمات وحروف. تتم مقارنة كل حرف بمجموعة من الأنماط المحددة مسبقًا أو نماذج مدرَّبة بالذكاء الاصطناعي بهدف التعرف عليها وتحويلها إلى نص مشفّر يمكن للآلة معالجته. هذا التحويل يمكِّن النص الموجود في الصورة من التعديل والبحث والمعالجة الرقمية.

دمج تحويل النص إلى كلام مع تقنية OCR

إن دمج تقنية التعرف الضوئي على الحروف مع تقنية تحويل النص إلى صوت ينشئ أداة قوية تعزز إمكانية الوصول والكفاءة. يقوم OCR باستخلاص النص من الوثائق الممسوحة ضوئيًا، أو الصور، أو المواد المطبوعة ويحوّله إلى نص قابل للقراءة بواسطة الآلة. يمكن بعد ذلك تمرير هذا النص إلى نظام TTS الذي يحوله إلى صوت مسموع. يسمح هذا التكامل بمجموعة واسعة من الاستخدامات مثل مساعدة ضعاف البصر في "قراءة" المواد المطبوعة، وتحويل الكتب والمستندات إلى كتب صوتية، أو تقديم ترجمات صوتية فورية للنصوص الأجنبية المطبوعة. من خلال دمج OCR مع TTS، يمكن للمستخدمين التفاعل مع المحتوى النصي بشكل أكثر ديناميكية، مما يجعل المعلومات في متناول الجميع بغض النظر عن القدرة على القراءة أو مشاكل البصر.

استخدامات تحويل النص إلى كلام مع OCR

إن دمج تقنيتي OCR وTTS يفتح العديد من الإمكانيات لجعل المعلومات أسهل في الاستخدام والاستهلاك في مختلف السيناريوهات. إليك بعض استخدامات تحويل النص على الصور إلى كلام:

  • التقنيات المساعدة لذوي الإعاقة البصرية: تحول المحتوى المكتوب من الكتب أو المستندات أو الشاشات إلى صوت مقروء، مما يساعد ذوي الإعاقة البصرية أو المكفوفين على "قراءة" المحتوى.
  • التعلّم والتعليم:
    • مساعدة للطلاب المصابين بعسر القراءة: تساعد الطلاب الذين يعانون من عسر القراءة أو صعوبات أخرى في القراءة عبر تحويل النص المكتوب إلى صوت.
    • التعلم متعدد الوسائط: يتيح للمتعلمين القراءة والاستماع في نفس الوقت، مما يعزز الفهم والتذكر.
  • الترجمة وتعلم اللغات: يحوّل النص الأجنبي المكتوب إلى كلام منطوق، مما يساعد في النطق والفهم.
  • استهلاك المحتوى الرقمي: تحويل الكتب والمقالات الإخبارية وغيرها من النصوص المطبوعة إلى كتب صوتية أو بودكاست للاستماع أثناء التنقل.
  • إتاحة المستندات: يُسهّل الوصول إلى ملفات PDF، والمستندات الممسوحة ضوئيًا، والصيغ غير القابلة للتحرير للأشخاص الذين يفضلون أو يحتاجون محتوى مسموعًا.
  • تحليل الوثائق التاريخية: تحويل المخطوطات القديمة أو الوثائق الأثرية إلى محتوى صوتي للباحثين أو المهتمين الذين يرغبون في الاستماع إلى النصوص التاريخية.
  • الأعمال والإنتاجية: تحويل التقارير المطبوعة وغير الرقمية إلى محتوى منطوق للمحترفين المشغولين.
  • مراجعة النصوص: مساعدة الكتّاب أو المحررين في اكتشاف الأخطاء في النصوص المطبوعة عبر الاستماع إليها.
  • الترفيه: تحويل القصص المصورة، الروايات المصورة، أو الوسائط المرئية بشكل أساسي إلى تجربة سمعية.

كيفية قراءة النص بصوت عالٍ من صورة

ليس كل مستخدم لأجهزة آبل وأندرويد يدرك أن تطبيقاته قد تحتوي على تقنية OCR وقارئ نصوص قادر على تنفيذ مهام تحويل النص إلى كلام بسيطة. فكّر في ميزات TTS المدمجة مثل التطبيقات التي تقرأ لك مجانًا أو كتطبيق مجاني يقرأ النص من الكاميرا، لكن جودتها ليست بمستوى برامج تحويل النص إلى كلام المتقدمة. إليك كيفية الوصول إلى قارئ النص من الصور على أجهزة أندرويد وآبل:

أندرويد

أجهزة أندرويد، على الأقل تلك التي تعمل بنظام تشغيل Android 12 أو أحدث، تأتي مع قارئ نصوص مدمج. إنها أداة مفيدة للملاحة، وقراءة الخطوط الصغيرة، وغيرها. ولكن يمكنك أيضًا استخدامه لقراءة النص من الصور. إليك كيفية ضبط جهازك:

  • انتقل إلى قائمة "إمكانية الوصول" عبر تطبيق "الإعدادات".
  • فعّل خيار "اختر للتحدث".
  • اذهب إلى تبويب "الإعدادات" الخاص بقارئ النصوص وفَعِّل خيار "قراءة النصوص على الصور".
  • ارجع إلى الشاشة الرئيسية وافتح تطبيق "الكاميرا".
  • وجّه الكاميرا إلى كتاب أو جريدة أو أي شاشة أخرى تحتوي على نص رقمي.
  • انقر على زر "اختر للتحدث" قبل الضغط على كلمة في تطبيق "الكاميرا".

سيبدأ قارئ النصوص في أندرويد بسرد النص من الكلمة المظللة. يمكنك تحديد أجزاء من النص بسحب إصبعك على الشاشة كما تفعل عند استخدام معالج النصوص.

آبل

لقراءة النص الفعلي بصوت عالٍ من خلال الآيفون، ستحتاج إلى كاميرا تعمل بنظام iOS 15 أو أحدث مع تفعيل قارئ النصوص المدمج.

  • انتقل إلى قسم "إمكانية الوصول" من قائمة "الإعدادات".
  • انقر على ميزة "المحتوى المنطوق".
  • فعّل خياري "نطق التحديد" و"نطق الشاشة".
  • ارجع إلى الشاشة الرئيسية وقم بتشغيل الكاميرا.
  • وجّه الكاميرا نحو الصفحة وانتظر ظهور زر "النص الحي" في شريط الأدوات السفلي.
  • انقر على الزر لتمكين قراءة الشاشة باستخدام OCR.
  • اسحب للأسفل باستخدام إصبعين لبدء القراءة من أعلى الصفحة.
  • انقر على كلمة أو حدد نصًا على الشاشة لقراءة كلمة أو جملة أو فقرة بعينها بصوت عالٍ.

مثل أجهزة أندرويد، تحتوي أجهزة آيباد وآيفون على قدرات محدودة في تقنيتي OCR وTTS. ورغم أن دقة معالجة النص فوق المتوسطة، فإن جودة الصوت دون المستوى بسبب طبيعته الآلية.

سبوتشيفاي — أفضل محوّل نص إلى كلام بتقنية OCR

رغم أن وجود برامج قراءة النصوص المدمجة وبرامج التعرف على الحروف يُعد ميزة لطيفة على الأجهزة المحمولة، فإن جودتها وأداءها غالبًا ما يكونان دون المستوى. ولحسن الحظ، لديك بديل أفضل، وهو تطبيق قراءة النصوص Speechify، وهو محوّل نص إلى كلام يجمع بين تقنية OCR وأصوات الذكاء الاصطناعي عالية الجودة (AI). تتخطى قدراته ما هو متاح في التطبيقات الافتراضية، ويمكنه مسح الكتب الكاملة والمستندات الورقية وتحويل النصوص المادية إلى رقمية. من هناك، تُنتج الخوارزميات المتقدمة أصواتًا طبيعية يمكنك التحكم بها وتعديل سرعة القراءة كما تشاء. برنامج Speechify متوفر على المنصات التالية:

سواء حصلت عليه من متجر آبل أو متجر جوجل بلاي، أو قمت بتنزيل إصدار سطح المكتب للماك أو إضافة كروم، ترخيص واحد يكفي لاستخدام Speechify على جميع أجهزة سطح المكتب والهاتف الخاصة بك. واجهته سهلة الاستخدام وتناسب جميع الفئات العمرية ومستويات الخبرة التقنية. كما تتوفر عمليات مسح OCR من Speechify للقراءة عبر الإنترنت مباشرة.

تم تصميم تقنيات Speechify المساعدة لمن يعانون من عسر القراءة أو صعوبات القراءة أو ضعف البصر أو حتى لمحبي أداء عدة مهام في آن واحد، فهو يقدم أكثر من مجرد قارئ شاشة تقليدي. إنه التطبيق الذي سترغب في استخدامه لتحويل أي نص رقمي أو ورقي إلى كتاب صوتي، أو إنشاء بودكاست، وتحسين مهارات القراءة لديك بجهد أقل وتركيز أكبر. جرّب تطبيق Speechify المجاني لتحويل النص إلى كلام وشخّص تجربتك القرائية الغامرة. لدى Speechify أيضًا مولّد صوتي بالذكاء الاصطناعي عبر الإنترنت يتيح لك اختبار الأصوات بنفسك مع أي نص تكتبه.

استمتع بأذكى الأصوات وأكثرها تقدّمًا، وبعددٍ غير محدود من الملفات، ودعمٍ على مدار الساعة

جرّب مجانًا
tts banner for blog

شارك هذا المقال

Cliff Weitzman

كليف وايتزمان

الرئيس التنفيذي ومؤسس Speechify

كليف وايتزمان مدافع عن ذوي عسر القراءة والرئيس التنفيذي ومؤسس تطبيق Speechify، أفضل تطبيق لتحويل النص إلى كلام في العالم، إذ نال أكثر من 100,000 تقييم بخمس نجوم وتصدّر متجر التطبيقات ضمن فئة الأخبار والمجلات. في عام 2017، أدرجته فوربس ضمن قائمة 30 تحت 30 تقديراً لجهوده في جعل الإنترنت أكثر سهولة وصولاً لذوي صعوبات التعلّم. ظهر كليف وايتزمان في منصات مثل EdSurge وInc. وPC Mag وEntrepreneur وMashable، وغيرها من وسائل الإعلام الرائدة.

speechify logo

حول Speechify

قارئ النص إلى كلام رقم 1

Speechify هي المنصة الرائدة عالميًا في تحويل النص إلى كلام، يثق بها أكثر من 50 مليون مستخدم، ويدعمها أكثر من 500,000 تقييم بخمس نجوم عبر تطبيقاتها على iOS، Android، امتداد Chrome، تطبيق الويب، وتطبيقات سطح المكتب على Mac. في عام 2025، منحت شركة Apple Speechify جائزة Apple Design Award المرموقة في WWDC، ووصفتها بأنها "مورد حيوي يساعد الناس على عيش حياتهم." تقدّم Speechify أكثر من 1000 صوت طبيعي بأكثر من 60 لغة، وتُستخدم في قرابة 200 دولة. ومن بين الأصوات الشهيرة Snoop Dogg، Mr. Beast، وGwyneth Paltrow. للمبدعين والشركات، يوفّر Speechify Studio أدوات متقدمة، بما فيها AI Voice Generator، AI Voice Cloning، AI Dubbing، وAI Voice Changer. كما تزوّد Speechify أبرز المنتجات بواجهة برمجة تطبيقات لتحويل النص إلى كلام عالية الجودة وموفّرة للتكلفة text to speech API. وقد تناولتها The Wall Street Journal، CNBC، Forbes، TechCrunch، وغيرها من كبريات وسائل الإعلام، وتُعد Speechify أكبر مزوّد لتحويل النص إلى كلام في العالم. تفضّل بزيارة speechify.com/news، speechify.com/blog، وspeechify.com/press لمعرفة المزيد.