ডিজিটাল যুগে যেখানে অ্যাক্সেসিবিলিটি ও ব্যবহারকারীর সম্পৃক্ততা গুরুত্বপূর্ণ, টেক্সট টু স্পিচ জাভাস্ক্রিপ্ট প্রযুক্তির ব্যবহার আরও বেশি অপরিহার্য হয়ে উঠছে। ওয়েব ডেভেলপমেন্টে বহুল ব্যবহৃত জাভাস্ক্রিপ্ট ডেভেলপারদের আরও অন্তর্ভুক্তিমূলক ও ইন্টারেক্টিভ ওয়েব অ্যাপ্লিকেশন বানাতে সহায়তা করে। এটি শুধু ব্যবহারকারীর অভিজ্ঞতার জন্যই নয়, দৃষ্টিপ্রতিবন্ধী বা পড়তে সমস্যা হয় এমন ব্যবহারকারীদের জন্যও দারুণ কাজে লাগে। চলুন, জাভাস্ক্রিপ্ট ইকোসিস্টেমে টেক্সট টু স্পিচ নিয়ে একটু ঘেঁটে দেখি।
টেক্সট টু স্পিচ জাভাস্ক্রিপ্ট বোঝা
টেক্সট টু স্পিচ জাভাস্ক্রিপ্ট মানে জাভাস্ক্রিপ্ট ব্যবহার করে লেখা টেক্সটকে কথা হিসেবে শোনানো। বিভিন্ন API ও লাইব্রেরি ব্যবহার করে মানুষের কণ্ঠের মতো স্বর তৈরি হয়। আধুনিক ব্রাউজার ও ডিভাইসে এটি আগে থেকেই আছে, speechSynthesis ও SpeechSynthesisUtterance-এর মতো বিল্ট-ইন ফাংশন ব্যবহার করে।
টেক্সট টু স্পিচ জাভাস্ক্রিপ্টের ১০টি সেরা ব্যবহার
- অ্যাক্সেসিবিলিটি সলিউশন: দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীদের কন্টেন্ট শোনার সুযোগ বাড়ানো।
- ই-লার্নিং প্ল্যাটফর্ম: শিক্ষামূলক কন্টেন্ট আরও সহজ ও ইন্টারেক্টিভভাবে কানে শোনা।
- ইন্টারেক্টিভ গেম: গেমিং অভিজ্ঞতায় ভয়েস নির্দেশনা বা গল্প যোগ করা।
- ভাষা শেখার অ্যাপ: উচ্চারণ ও লিসনিং স্কিল বাড়ানো।
- ভয়েস-বেসড ফর্ম: ফর্ম ফিলআপের সময় ব্যবহারকারীরা ফিল্ড শুনতে পাবেন, এতে ব্যবহার আরও সহজ হয়।
- রিডিং অ্যাসিস্ট্যান্ট: টেক্সট জোরে পড়ে শোনাতে পারে, শেখায় সমস্যা হয় বা মাল্টিটাস্কিংয়ের সময় বেশ সহায়ক।
- ওয়েবসাইট নেভিগেশন: সাইটে ভয়েস গাইড দিয়ে সবার জন্য, বিশেষত বয়স্কদের জন্য নেভিগেশন সহজ করা।
- কাস্টমার সার্ভিস বট: অটোমেটেড উত্তরে ভয়েস যোগ করে ইন্টারঅ্যাকশনে মানবিক স্পর্শ আনে।
- কন্টেন্ট অনুবাদ: অনূদিত টেক্সট শোনার অপশন দিলে মাল্টিল্যাঙ্গুয়াল ইউজ কেস অনেক সহজ হয়।
- আর্টিকেল শোনানো: সংবাদ বা ব্লগকে কণ্ঠে রূপান্তর করে চলতি পথে শুনে ফেলা যায়।
জাভাস্ক্রিপ্টে টেক্সট টু স্পিচে রূপান্তর
জাভাস্ক্রিপ্টে টেক্সট টু স্পিচ বেশ সহজ, কারণ আছে Web Speech API। মূলভাগে থাকে window.speechSynthesis ইন্টারফেস। শুরু করার জন্য দ্রুত ধাপগুলো:
- স্পিচ সিনথেসিস শুরু: speechSynthesis API দিয়ে কাজ শুরু করুন।
- উচ্চারণ অবজেক্ট তৈরি: নতুন SpeechSynthesisUtterance অবজেক্ট বানিয়ে সেখানে টেক্সট দিন।
- ভয়েস ও ভাষা নির্বাচন: getVoices() দিয়ে পছন্দের ভয়েস বেছে নিন।
- কণ্ঠে পড়া: speechSynthesis.speak() দিয়ে টেক্সট উচ্চারণ করান।
জাভাস্ক্রিপ্টে টেক্সটে ভয়েস যোগের উপায়
ভয়েস যোগ করতে যা করবেন:
- HTML-এ div বা input type তৈরি করুন, যেখানে ব্যবহারকারী টেক্সট লিখবে।
- জাভাস্ক্রিপ্ট দিয়ে লেখা টেক্সট পড়ে নিন।
- তারপর Web Speech API ব্যবহার করুন টেক্সটকে কথায় রূপান্তরের জন্য।
HTML এ টেক্সট টু স্পিচ কোডিং
HTML-এ টেক্সট টু স্পিচ এম্বেড করার ধাপ:
- HTML স্ট্রাকচার ঠিক করুন, যেমন doctype html ও div কন্টেইনার সেটআপ করুন।
- <script> ট্যাগে জাভাস্ক্রিপ্ট লিখে কন্টেইনারের সাথে ইন্টারঅ্যাক্ট করুন ও ইভেন্ট লিসেনার ব্যবহার করে টেক্সট টু স্পিচ চালান— যেমন addeventlistener।
জাভাস্ক্রিপ্টে স্পিচ রেকগনিশন ইমপ্লিমেন্টেশন
স্পিচ রেকগনিশন মানে মূলত:
- SpeechRecognition ইন্টারফেস ব্যবহার, Web Speech API থেকে।
- জাভাস্ক্রিপ্ট দিয়ে রিয়েল-টাইমে রেকগনিশন চালু-বন্ধ ও রেজাল্ট হ্যান্ডল করা।
জাভাস্ক্রিপ্টে টেক্সট পড়া
টেক্সট জোরে পড়াতে চাইলে:
- speechSynthesis.speak() মেথড ব্যবহার করুন, সাথে SpeechSynthesisUtterance অবজেক্ট দিন।
- ভয়েস, পিচ, রেট ইত্যাদি নিজের মতো কাস্টোমাইজ করুন।
টেক্সট টু স্পিচ জাভাস্ক্রিপ্ট টুল
ResponsiveVoiceJS
খরচ: ফ্রি/পেইড
খুব অল্প কোডেই টেক্সট টু স্পিচ চালানো যায়, বহু প্ল্যাটফর্মে চলে।
শীর্ষ বৈশিষ্ট্য: সহজ ইন্টিগ্রেশন, বহু ভাষা, নন-HTML5 ব্রাউজারে ফলোব্যাক।
Speak.js
খরচ: ফ্রি
কমপ্যাক্ট ওপেন-সোর্স সলিউশন, GitHub-এ পাওয়া যায়, eSpeak সিন্থেসাইজার ব্যবহার করে।
শীর্ষ বৈশিষ্ট্য: বিভিন্ন ব্রাউজার সমর্থিত, স্পিচ রেট কাস্টোমাইজ করা যায়, ওপেন-সোর্স।
SpeechSynthesis API
খরচ: ফ্রি
আধুনিক ব্রাউজার (Chrome, Firefox, Edge)-এর জন্য শক্তিশালী API।
শীর্ষ বৈশিষ্ট্য: নেটিভ ব্রাউজার সাপোর্ট, আলাদা লাইব্রেরি লাগে না, রিয়েল-টাইম স্পিচ সিন্থেসিস।
MeSpeak.js
খরচ: ফ্রি
একটি ওপেন-সোর্স টেক্সট টু স্পিচ লাইব্রেরি, যা অফলাইনে চলে।
শীর্ষ বৈশিষ্ট্য: কাস্টম ভয়েস, বহু ভাষা, ইন্টারনেট ছাড়াই কাজ করে।
Google Cloud Text-to-Speech
খরচ: ফ্রি টিয়ার/পেইড
নানান ভয়েস ও কাস্টোমাইজেশন অপশন, এন্টারপ্রাইজ অ্যাপের জন্য উপযোগী।
শীর্ষ বৈশিষ্ট্য: উন্নতমানের ভয়েস, প্রচুর ভাষাসাপোর্ট, ডিপ লার্নিং প্রযুক্তি।
IBM Watson Text to Speech
খরচ: ফ্রি টিয়ার/পেইড
AI-চালিত বহুভাষিক স্পিচ, নানান ধরণের কণ্ঠে শোনা যায়।
শীর্ষ বৈশিষ্ট্য: এক্সপ্রেসিভ ভয়েস, রিয়েল-টাইম স্ট্রিমিং, SSML দিয়ে ফ্লেক্সিবল কাস্টমাইজেশন।
Amazon Polly
খরচ: ফ্রি টিয়ার/পেইড
ডিপ লার্নিংয়ের সাহায্যে টেক্সটকে স্বাভাবিক, বাস্তবসম ভাষণে রূপান্তর করে।
শীর্ষ বৈশিষ্ট্য: প্রাণবন্ত ভয়েস, SSML সাপোর্ট, AWS ইন্টিগ্রেশন।
Voxygen
খরচ: পেইড
বিভিন্ন ইউজ কেস ও ইন্ডাস্ট্রির জন্য আলাদা ধরনের অনন্য ভয়েস দেয়।
শীর্ষ বৈশিষ্ট্য: ইউনিক ভয়েস, ক্রস-প্ল্যাটফর্ম, উন্নতমানের সাউন্ড।
MaryTTS
খরচ: ফ্রি
ওপেন-সোর্স, বহু ভাষিক একটি টেক্সট টু স্পিচ প্ল্যাটফর্ম।
শীর্ষ বৈশিষ্ট্য: প্ল্যাটফর্ম-নিরপেক্ষ, ভয়েস কাস্টোমাইজ করা যায়, বিভিন্ন ভাষা সাপোর্ট।
Speechify টেক্সট টু স্পিচ চেষ্টা করুন
খরচ: বিনামূল্যে ট্রাই
Speechify Text to Speech একটি নতুন যুগের টুল, যা পাঠ্যভিত্তিক কনটেন্ট ব্যবহারে ভিন্নমাত্রা এনেছে। উন্নত টেক্সট-টু-স্পিচ প্রযুক্তি ব্যবহার করে স্পিচিফাই লেখাকে স্বাভাবিকভাবে বলে শোনায়—পাঠ সমস্যা, দৃষ্টিপ্রতিবন্ধী বা যাদের শোনে শেখা ভালো লাগে তাদের জন্য এটি বেশ কার্যকর। এটি বিভিন্ন ডিভাইস ও প্ল্যাটফর্মে ইন্টিগ্রেট হয়, অন-দ্য-গো শোনার সুবিধা দেয়।
Speechify TTS-এর ৫টি সেরা ফিচার:
উন্নতমানের ভয়েস: Speechify বহু ভাষায় স্বাভাবিক, জীবন্ত কণ্ঠ দেয়। এতে শুনতে প্রাকৃতিক লাগে, বোঝা সহজ ও অভিজ্ঞতা আনন্দদায়ক হয়।
নিরবচ্ছিন্ন ইন্টিগ্রেশন: Speechify ওয়েব, স্মার্টফোনসহ বিভিন্ন প্ল্যাটফর্মে চলে। ওয়েবসাইট, ই-মেইল, PDF থেকে টেক্সট তাৎক্ষণিকভাবে কণ্ঠে রূপান্তর করুন।
স্পিড কন্ট্রোল: প্লেব্যাক স্পিড নিজের মতো কম-বেশি করা যায়, ফলে চাইলে দ্রুত স্ক্যান বা মনোযোগ দিয়ে ধীরে শোনা যায়।
অফলাইন শ্রবণ: Speechify-এর অন্যতম বৈশিষ্ট্য—কনভার্টেড টেক্সট সেভ করে ইন্টারনেট ছাড়াই পরে শুনে নেওয়া যায়।
টেক্সট হাইলাইট: পড়ার সময় কোন অংশ বলা হচ্ছে সেটি হাইলাইট করে দেখায়, ফলে চোখ ও কানে একসাথে যায় এবং মনে রাখা সহজ হয়।
সাধারণ প্রশ্নাবলী:
কীভাবে ভয়েস টেক্সট বানাব?
ভয়েস টেক্সট বানাতে টেক্সট টু স্পিচ সফটওয়্যার বা API ব্যবহার করুন, যা লেখা কণ্ঠে রূপান্তর করে। জাভাস্ক্রিপ্টের Web Speech API ওয়েবেই এই কাজ করতে পারে।
টেক্সট টু স্পিচ কী?
টেক্সট টু স্পিচ (TTS) হচ্ছে এমন প্রযুক্তি, যা ডিজিটাল লেখা জোরে পড়ে শোনায়। এটি কম্পিউটার বা ডিভাইসে টেক্সটকে কণ্ঠে রূপান্তর করে।
স্পিচ রেকগনিশন ও টেক্সট টু স্পিচ-এর পার্থক্য কী?
স্পিচ রেকগনিশন কথাকে টেক্সটে রূপান্তর করে, আর টেক্সট টু স্পিচ উল্টোভাবে লেখাকে কণ্ঠে রূপান্তর করে।
টেক্সট টু স্পিচ জাভাস্ক্রিপ্ট ব্যবহার করলে সফটওয়্যার ডেভেলপার বা ওয়েব ডেভেলপারদের সামনে অসংখ্য দারুণ সুযোগ খুলে যায়। React, Node, কিংবা CSS ও HTML মিলিয়েও সহজেই যুক্ত করা যায়। এই টিউটোরিয়াল ও টুলগুলো কাজে লাগিয়ে আপনার ওয়েবপেজ আরও ব্যবহারবান্ধব ও সবার জন্য অ্যাক্সেসযোগ্য হবে।

