Speech synthesizers লিখিত টেক্সটকে মানুষের কথায় বদলে দেয়। বাজারের প্রাচীনতম স্পিচ সিন্থেসাইজারগুলোর একটি হিসেবে, eSpeak বিশ্বজুড়ে ব্যবহৃত। বর্তমান eSpeakNG সংস্করণটি পুরানোটার তুলনায় বড় আপডেট। তবু, এতে এখনো নানা সমস্যা ও সীমাবদ্ধতা আছে।
চলুন এমন কিছু সেরা eSpeak বিকল্প দেখি, যেগুলো এই সফটওয়্যারের ঝামেলা অনেকটাই কমিয়ে আনে।
eSpeak কি?
eSpeak একটি ওপেন সোর্স স্পিচ সিন্থেসাইজার, যা GitHub-এ হোস্টেড। এটি ফর্ম্যান্ট সিন্থেসিস পদ্ধতি ব্যবহার করে, অর্থাৎ চালানোর সময় eSpeak মানুষের কণ্ঠের নমুনা ব্যবহার করে না। তাই খুব কম জায়গা নিয়ে অনেক ভাষা সাপোর্ট করতে পারে।
তবে, ভাষার গুণগত মান অনেক ক্ষেত্রেই আলাদা। কিছু ভাষায় আরও উন্নয়ন দরকার, যেখানে মূলত স্থানীয় ব্যবহারকারীদের ফিডব্যাক জরুরি। মূলত, এসব ব্যবহারকারী সফটওয়্যারটি স্ক্রীন রিডার হিসেবে ব্যবহার করেন।
স্পষ্টভাবে নির্ভরযোগ্য টেক্সট পড়ে শোনানোর জন্য এই ফিচারটি কাজে লাগে। ফলে, দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীরা প্রায় কোনো শব্দগত ঝামেলা ছাড়াই কম্পিউটার চালাতে পারেন। সব অডিও WAV ফাইলে সেভও করা যায়।
eSpeak-এর সুবিধা ও অসুবিধা
ছোট সাইজের কারণে eSpeak বিভিন্নভাবে ব্যবহার করা যায়:
- Windows ও Linux-এ কমান্ড লাইনে চালানোর জন্য টেক্সট টু স্পিচ সফটওয়্যার
- Windows ও Linux-এ অন্য প্রোগ্রামের জন্য শেয়ার্ড লাইব্রেরি
- Windows, Android ও macOS-এ স্ক্রীন রিডার
ছোট সাইজের বাইরে, কতগুলো ভাষা সাপোর্ট করে—এটিও বড় সুবিধা। বর্তমানে ২৭০+ ভাষার টেক্সট টু স্পিচ দেয়, প্রয়োজন হলে আরও ভাষা যোগ করা যায়।
এই ভাষাগুলো বিভিন্ন ভয়েসে শোনা যায় এবং আপনি ঠিক করে নিতে পারবেন:
- পিচ পরিবর্তন
- ইকো যোগ করা
- বিসপ হিসেবে যোগ
- ক্রোয়াকি ভয়েস
তবে, ভাষা ও ভয়েসের মানের বেশ কিছু সীমাবদ্ধতা আছে।
অনেক ভাষা এখনো খসড়া পর্যায়ে এবং ঠিকভাবে ব্যবহার উপযোগী করতে আরও সময় দরকার। বেশি ব্যবহার হলে মানও ধীরে ধীরে বাড়ে। আপাতত ইংরেজি ও স্প্যানিশ এতে এগিয়ে।
কণ্ঠস্বর পরিষ্কার ও দ্রুত পড়ে। তবে স্বাভাবিকভাবে খুব মানবিক শোনায় না, কারণ মানুষের কণ্ঠের রেকর্ড থেকে নয়। বেশিরভাগ ভয়েসই রোবটিক লাগে।
eSpeak-এর বিকল্পসমূহ
টেক্সট টু স্পিচে সীমাবদ্ধতার কারণে, অনেকেই এটাকে শুধু হালকা শোনা (যেমন ব্লগ, সংবাদ ওয়েবসাইট) জন্য ব্যবহার করেন। জটিল কাজে অন্য বিকল্প নেওয়া ভালো।
Speechify
Speechify একটি শক্তিশালী টেক্সট টু স্পিচ অ্যাপ; Mac, iPhone ও Android-এ চলে। অনলাইন বা Chrome extension হিসেবেও ব্যবহার করা যায়।
Speechify-এর সবচেয়ে বড় সুবিধা হলো প্রাকৃতিক-শোনার ভয়েস। অনেকক্ষণ রোবটিক কণ্ঠ শুনে থাকা বিরক্তিকর। তাই এখানে কৃত্রিম বুদ্ধিমত্তা-ভিত্তিক ভয়েস ব্যবহার করা হয়েছে, যেগুলো মানবিক ও সাবলীল শোনায়। এতে মনোযোগ ধরে রাখা সহজ হয় এবং আরও তথ্য মনে রাখা যায়।
অ্যাপটিতে প্রতিটি ভাষাই প্রায় সমানভাবে উন্নত। সব ভাষায় প্রায় স্বাভাবিক ভয়েসে অনলাইন আর্টিকেল শোনার সুযোগ ও বহু ফরম্যাটে টেক্সট পড়ার সুবিধা আছে।
ব্যবহারকারীরা নিজের ফটো ও স্ক্রিনশট-ও টেক্সট হিসেবে পড়ে শোনাতে পারবেন।
NaturalReader
NaturalReader আরেকটি বহুমুখী eSpeak বিকল্প, অনলাইন ও অফলাইন দুইভাবেই পাওয়া যায়। এটি বেশিরভাগ ডকুমেন্ট টাইপ, প্রিন্টেড কাগজ, স্ক্যানড ডকুমেন্ট এবং বিভিন্ন ডিভাইসের স্ক্রিনশট সাপোর্ট করে।
এই সেবা ১৬টি ভাষায় স্বাভাবিক-শোনার ভয়েস দেয়। ব্যবহারকারীরা নিজের ভাষায় শব্দের উচ্চারণও নিজের মতো ঠিক করে নিতে পারেন।
TextAloud
TextAloud উইন্ডোজের জন্য টেক্সট টু ভয়েস সফটওয়্যার। এই দরকারি টুল দিয়ে ডকুমেন্ট ও ওয়েব পেজ-এর লেখা স্বাভাবিক কণ্ঠে শোনা যায়। ব্যবহারকারীরা পিসিতে অডিও শুনতে পারেন বা অডিও ফাইল এক্সপোর্ট করে ইন্টারনেট ছাড়াই শুনতে পারেন।
এখানে ২৯+ ভাষায় প্রাকৃতিক-শোনার ভয়েস আছে। তবে এসব প্রিমিয়াম ভয়েস আলাদাভাবে কিনতে হয়। যেসব বান্ডল আছে, তাতেও আরও বেশি ভয়েস চাইলে আলাদা করে কিনে নিতে হয়।
Read Aloud
Read Aloud ওপেন সোর্স TTS রিডার; শুধু Google Chrome Extension হিসেবেই পাওয়া যায়। এই ওয়েব-ভিত্তিক টুলে এক ক্লিকেই প্রায় যেকোনো ওয়েব পেজ পড়ে শোনানো যায়। নিউজ, ইউনিভার্সিটির অনলাইন কোর্সসহ নানা ওয়েবসাইটে ভালো কাজ করে।
বিভিন্ন কনটেন্টের পাশাপাশি, Read Aloud-এ বহু কণ্ঠ থেকে বেছে নেওয়া যায়। Google Chrome নেটিভ ভয়েস দেয়, বাকি ভয়েস আসে Microsoft ও Amazon Polly-এর মতো TTS থেকে। কিছু ভয়েস ইন-অ্যাপ পারচেস করতে হয়।
Speechify একবার নিখরচায় ব্যবহার করে দেখুন
সঠিক TTS সফটওয়্যার ব্যবহার করলে পড়ার অভিজ্ঞতা মুহূর্তেই বদলে যেতে পারে। যদিও eSpeak ফ্রি ও সহজ, এতে কিছু সীমাবদ্ধতা আছে, তাই দীর্ঘমেয়াদে খুব উপযোগী নাও হতে পারে।
ফিচার বিবেচনায়, Speechify-ই সেরা eSpeak বিকল্প। আপনি Speechify ফ্রি চেষ্টা করে পড়ার এক নতুন অভিজ্ঞতা নিতে পারেন।
প্রশ্নোত্তর
সবচেয়ে স্বাভাবিক টেক্সট টু স্পিচ ইঞ্জিন কোনটি?
Speechify সবচেয়ে স্বাভাবিক টেক্সট টু স্পিচ ইঞ্জিন, কারণ এতে জীবন্ত মানব-শোনার কণ্ঠ পাওয়া যায় নানান কাজে।
সবচেয়ে ভাল ফ্রি টেক্সট টু স্পিচ অ্যাপ কোনটি?
ফিচার, ভয়েসের মান ও সহজলভ্যতার দিক থেকে Speechify অন্যতম সেরা টেক্সট টু স্পিচ অ্যাপ। অ্যাপটি ফ্রি ডাউনলোড করে শুনে ও পড়ার অভিজ্ঞতা আরও বাড়িয়ে নিন শোনা ও পড়ার দুই দিক দিয়েই।
eSpeak কি Linux-এ পাওয়া যায়?
eSpeak Linux-এ কমান্ড লাইন প্রোগ্রাম হিসেবে আছে, যেখান থেকে ফাইল বা ইনপুট নিয়ে টেক্সট পড়ে শোনানো যায়।
স্বাভাবিক টেক্সট টু স্পিচ ভয়েস কি পাওয়া যায়?
কৃত্রিম বুদ্ধিমত্তা ও আধুনিক ডিপ লার্নিং-ভিত্তিক অ্যাপে খুব স্বাভাবিক ভয়েস পাওয়া যায়, যা প্রায় যেকোনো ফরম্যাটে ডকুমেন্ট পড়ে দিতে পারে।

