1. হোম
  2. উইন্ডোজ
  3. পিসিতে টেক্সট-টু-স্পিচ কীভাবে ব্যবহার করবেন
প্রকাশের তারিখ উইন্ডোজ

পিসিতে টেক্সট-টু-স্পিচ কীভাবে ব্যবহার করবেন

Tyler Weitzman

টাইলার ওয়েইটজম্যান

স্ট্যানফোর্ড বিশ্ববিদ্যালয় থেকে কম্পিউটার সায়েন্সে এমএস, ডিসলেক্সিয়া ও অ্যাক্সেসিবিলিটি নিয়ে কাজ করা প্রবক্তা, স্পিচিফাই-এর সিইও ও প্রতিষ্ঠাতা

apple logo২০২৫ অ্যাপল ডিজাইন অ্যাওয়ার্ড
৫ কোটি+ ব্যবহারকারী

পিসিতে টেক্সট-টু-স্পিচ কীভাবে ব্যবহার করবেন

টেক্সট-টু-স্পিচ (বা TTS) পিসিতে অ্যাক্সেসিবিলিটি বাড়ায়, মাল্টিটাস্কিং সম্ভব করে আর প্রোডাক্টিভিটি বাড়ায়। আর পিসিতে এটি চালু ও ব্যবহার করার একাধিক উপায়ও আছে!

পিসিতে টেক্সট-টু-স্পিচ

টেক্সট-টু-স্পিচের বেসিক ধারণা

মূলত, TTS-এ থাকে তিনটি প্রধান অংশ: টেক্সট বিশ্লেষণ মড্যুল, সিন্থেসিস ইঞ্জিন আর অডিও রেন্ডারিং সিস্টেম। টেক্সট বিশ্লেষণ মড্যুল লেখাকে ছোট ইউনিটে ভেঙে নেয়, যেমন শব্দ, বাক্যাংশ কিংবা বাক্য—যেখানে যতিচিহ্ন আর বড় হাতের অক্ষরও ধরা হয়।

এই বিশ্লেষণই নিশ্চিত করে যে সৃষ্ট কণ্ঠস্বর স্বাভাবিক আর সাবলীল শোনায়, সেটা মাইক্রোসফটের MS Sam হোক বা অন্য সিস্টেম। সিন্থেসিস ইঞ্জিন এই ইউনিটগুলোকে ধ্বনি-রূপে বদলে ফেলে, এতে তা গঠিত শব্দে পরিণত হয়।

এতে লিখিত টেক্সটকে উপযুক্ত ফনিম বা ধ্বনিতে রূপান্তর করা হয়—যা ভাষার মূল আওয়াজ। শেষে অডিও রেন্ডারিং সিস্টেম (যেখানে অনেক ভয়েস থাকে) ডিজিটাল সিগনাল প্রসেসিংয়ের মাধ্যমে, সাধারণত প্রি-রেকর্ডেড মানব কণ্ঠ ব্যবহার করে, চূড়ান্ত অডিও তৈরি করে।

ভাষাবৈজ্ঞানিক বিশ্লেষণ আর অডিও প্রসেসিং মিলিয়ে TTS এমন কণ্ঠ তৈরি করে, যা মানুষের গলার স্বরের মতোই স্বাভাবিক শোনায়।

মাইক্রোসফট ও উইন্ডোজে টেক্সট-টু-স্পিচ চালু করবেন যেভাবে

মাইক্রোসফট বহু বছর ধরে টেক্সট-টু-স্পিচ প্রযুক্তিতে কাজ করছে। উইন্ডোজ ২০০০ আর XP-তেও এটি ছিল, অ্যাপের নাম ছিল Microsoft Sam—যা দিয়ে নারেশনসহ আরও অনেক কিছু করা যেত।

তবে শুরুর দিকে Microsoft Sam বেশ যান্ত্রিক ছিল। কণ্ঠস্বরটি স্পষ্টভাবেই এআই-নির্ভর শোনাত, আর টেক্সট-টু-স্পিচ প্রযুক্তির মান এরপর থেকে অনেক বেড়েছে। 

মাইক্রোসফট তাদের TTS সফটওয়্যারে সময়ের সঙ্গে অনেক আপডেট এনেছে। উইন্ডোজ ভিস্তা আর ৭-এ ছিল Microsoft Anna, আর ৮-এ এসেছিল আরও নতুন ভয়েসওভার অপশন। এখন Windows 10-এ ডিফল্ট কণ্ঠ: Hazel, David, George, Susan, Zira ও Mark।

পিসিতে টেক্সট-টু-স্পিচ চালু করতে Settings-এ যান, Ease of Access-এ ক্লিক করুন, এরপর Narrator অংশে ঢুকুন। Windows key + Ctrl + Enter চাপলে সরাসরি Narrator অন হবে।

এখানে আপনি কাস্টমাইজ করতে পারবেন—ভয়েস বাছাই, স্পিড ঠিক করা, আর আরও কিছু দরকারি অপশন টিউন করতে পারবেন। 

পিসিতে টেক্সট-টু-স্পিচ ব্যবহারের সুবিধা

রোজকার অনেক ঝামেলা সামলাতে টেক্সট-টু-স্পিচ বেশ কাজের। অনেকেই পড়তে সমস্যায় পড়েন, যেমন ডিসলেক্সিয়া, ADHD, কিংবা দৃষ্টিশক্তিতে সমস্যা থাকলে।

TTS-এর ফলে আপনাকে নিজে পড়তে বসতে হবে না, হেডফোন বা স্পিকারে শুনতে পারবেন, ঠিক পডকাস্ট শোনার মতো। আর যদি পড়াতেও অসুবিধা না থাকে, TTS তবু নানাভাবে কাজে দেবে। 

আপনি অনেক সময় বাঁচাতে পারেন আর আরামে মাল্টিটাস্ক করতে পারেন। আরও সুবিধা—ই-লার্নিংয়ের জন্য TTS দারুণ। ঘরে আরাম করে বসে বই শুনুন, পড়াশোনাই হালকা লাগবে।

অনেকেই নতুন ভাষা শিখতেও TTS ব্যবহার করেন—লেখার সঙ্গে সঙ্গে সঠিক উচ্চারণ কানে যায়, ফলে শেখা আরও সহজ হয়।

পিসিতে টেক্সট-টু-স্পিচ কাস্টমাইজেশন

Settings-এ Narrator-এ গেলে টেক্সট-টু-স্পিচ টুলটি কাস্টমাইজ করার একগুচ্ছ অপশন পাবেন। অনেকগুলো ভয়েস আর সেটিং ঘেঁটে দেখতে পারবেন।

বিভিন্ন কাস্টমাইজেশন অপশন রয়েছে, যেগুলো অভিজ্ঞতা ভালো করতে বানানো। তবে এই অপশনগুলো শুধু বিল্ট-ইন Narrator অ্যাপ (Windows 10/11)-এর জন্যই কাজ করে।

এই সিস্টেমগুলোতে বিভিন্ন ভাষার সাপোর্টও আছে এবং তা TTS-এও চালু থাকে। অ্যাপের মান মোটামুটি ভালো, তবে অনেকের জন্য আবার সীমাবদ্ধতাও মনে হতে পারে।

আরও বেশি ফিচার চাইলে আলাদা অ্যাপ ডাউনলোড করতে হবে। ভাগ্য ভালো, Windows-এ অনায়াসে চলা অসংখ্য TTS অ্যাপ আছে।

পিসিতে টেক্সট-টু-স্পিচ ফিচার ব্যবহার

এখন পিসিতে Text to Speech ফিচার ঠিকমতো চালু করেছেন, সম্ভবত সেরা সফটওয়্যার দিয়েই—এবার এর নানা ফিচার ব্যবহার করে দেখার পালা।

বেসিক টেক্সট-টু-স্পিচ কমান্ড

Text to Speech ব্যবহার করা খুবই সহজ। বেশিরভাগ ফ্রি কম্পিউটার অ্যাপে টেক্সট হাইলাইট করে এক ক্লিকেই বা শর্টকাট চাপলেই পড়ে শোনানো যায়।

বাছাই করা টেক্সট স্পিচে রূপান্তরিত হবে এবং আপনার কম্পিউটারে বেজে উঠবে। স্পিচ রিকগনিশন প্রযুক্তি থাকলে কিছু অ্যাপে আবার টেক্সট ডিক্টেট করেও দিতে পারবেন।

ধরা যাক, বড় কোনো ডকুমেন্ট প্রুফরিড করছেন। বারবার পড়ার বদলে অনুচ্ছেদ হাইলাইট করে Text to Speech-এ শুনে নিতে পারেন।

এভাবে একদিকে যেমন সময় বাঁচবে, অন্যদিকে ভুল বা অসঙ্গতি কানেই ধরা পড়বে। ফ্রি চ্যাট অ্যাপ থাকলে আবার টাইপ না করেও মেসেজ পাঠানো যাবে।

কিছু সফটওয়্যারে ওয়েব ব্রাউজার বা ডকুমেন্ট ভিউয়ার ইনটিগ্রেটেড থাকে—সেখানে আপনি সরাসরি অনলাইন আর্টিকেল, PDF, ইবুক পড়াতে পারবেন, এমনকি শুনতেও পারবেন। ব্লগ, নিউজ, বই—সব শুনে পড়ুন, চোখের চাপ একদম কম!

অ্যাডভান্সড টেক্সট-টু-স্পিচ ফিচার

বেসিক ছাড়াও, টেক্সট-টু-স্পিচ অ্যাপে থাকে নানারকম অ্যাডভান্সড ফিচার। টেক্সটকে অডিও ফাইলে রেখে অফলাইনে শোনা বা মোবাইলে নেওয়ার সুবিধা, টাইপ অ্যান্ড স্পিক ফিচারে কীবোর্ড ছাড়াও টেক্সট ইনপুটের অপশন ইত্যাদি।

অনলাইনের কোনো লেখা তখনই পড়ে ওঠা হচ্ছে না? TTS-এ সেটি অডিও ফাইলে রেখে পরে শুনুন—গাড়িতে, ব্যায়ামের সময়, বাসার কাজে—সময়ও বাঁচে, তথ্যও বাদ যায় না।

কিছু সফটওয়্যার, যেমন কম্পিউটার টেক্সট বা টেক্সট পিসি সফটওয়্যার, নির্দিষ্ট শব্দ বা বাক্যের উচ্চারণ কাস্টমাইজ করার সুবিধাও দেয়—বিশেষ করে টেকনিক্যাল টার্ম, নাম বা বিদেশি শব্দের ক্ষেত্রে।

উদাহরণ হিসেবে, নতুন ভাষা শিখতে অজানা শব্দের উচ্চারণ TTS-এ শুনে খুব সহজে রপ্ত করা যায়। এতে স্কিল যেমন বাড়ে, তেমনি আত্মবিশ্বাসও বাড়ে। নতুন Speech to Text প্রযুক্তিতে আবার কথাকেও সোজা লিখিত রূপে আনা যায়।

দেখে বোঝা যাচ্ছে, টেক্সট-টু-স্পিচ প্রযুক্তি পড়ার অভিজ্ঞতাকে এক ধাপ উঁচুতে তুলতে পারে। আপনি ছাত্র, পেশাজীবী কিংবা বইপোকা—যাই হন না কেন, TTS দৈনন্দিন কাজে যোগ করলে সবকিছুই অনেক সহজ আর উপভোগ্য হবে।

কম্পিউটার টু টেক্সট অ্যাপ আর ফ্রি টেক্সট ফ্রম পিসির মতো অপশন থাকায় সম্ভাবনার আসলে শেষ নেই।

সাধারণ টেক্সট-টু-স্পিচ সমস্যা ও সমাধান

টেক্সট-টু-স্পিচ সাধারণত নির্ভরযোগ্য আর ব্যবহারবান্ধব, তবে মাঝেমধ্যে ঝামেলাও করতে পারে। সাধারণ সমস্যা আর সমাধান জানা থাকলে সহজেই ম্যানেজ করতে পারবেন।

অডিও সমস্যা সমাধান

TTS-এ অডিও সমস্যা হলে প্রথমে কম্পিউটারের অডিও সেটিংস দেখে নিন। ভলিউম ঠিক আছে কি না, সঠিক আউটপুট ডিভাইস সিলেক্টেড কি না, ড্রাইভার আপডেট আছে কি না, এগুলো চেক করুন। সমস্যা ঠিক না হলে অ্যাপ বা কম্পিউটার একবার রিস্টার্ট দিন।

টেক্সট রিকগনিশন এরর ঠিক করার উপায়

TTS নির্ভর করে যার টেক্সট রিকগনিশনে। খুব জটিল বা গড়বড় ফরম্যাটেড টেক্সটে মাঝেমধ্যে সমস্যা দেখা দিতে পারে।

যদি কিছু শব্দ বা বাক্য ভুল পড়ে, শব্দের বানান বা ফরম্যাট একটু পাল্টে দেখুন। কিছু সফটওয়্যারে আবার নিজে থেকেই ভুল উচ্চারণ ঠিক করে দেওয়ার অপশন থাকে, এতে স্পোকেন কনটেন্ট অনেকটাই ঠিকঠাক থাকে।

Speechify — Narrator-এর বিকল্প

আরও কিছু ফিচার চান? তাহলে Speechify ট্রাই করতে পারেন—এখনকার সবচেয়ে জনপ্রিয় TTS অ্যাপগুলোর একটি। Speechify-এর API প্রথমে ডিসলেক্সিয়া আর পড়তে অসুবিধা থাকা ব্যবহারকারীদের জন্য বানানো হয়েছিল, কিন্তু এখন তা কার্যত সবারই কাজে লাগে।

বর্তমানে Speechify ১৪টিরও বেশি ভাষায় চলে এবং নানা ধরনের এআই কণ্ঠ আর উচ্চারণের ভ্যারিয়েশন দেয়। এটি ব্যবহার করা খুব সহজ, ইন্টুইটিভ, চাইলে আলাদা টিউটোরিয়ালও আছে। 

ব্যবহার শেখার জন্য আলাদা করে সময় দিতে হবে না—ডাউনলোড করেই চলে যাবে। Windows, Android, iOS (iPhone/iPad) আর MacOS—সবখানেই চলে।

Speechify-এর বড় সুবিধা—এর কণ্ঠগুলো দারুণ স্বাভাবিক। মানুষের গলার মতো রিয়েলিস্টিক ভয়েস তৈরি হয়, তাই বিশ্বের নানা প্রান্তে ব্যবহার হচ্ছে। ওপর থেকে, এগুলো ইচ্ছে মতো কাস্টমাইজও করতে পারবেন!

Speechify-এ OCR (অপটিক্যাল ক্যারেক্টার রিকগনিশন) রয়েছে, ফলে এটি ছবি থেকে টেক্সট তুলে নিয়ে wav বা mp3 ফাইলে রূপান্তর করতে পারে। বেশিরভাগ অ্যাপ যেমন MS Word বা Google Docs-এ সাপোর্ট থাকে, Speechify প্রায় সব ধরনের টেক্সট ফাইল নিয়েই কাজ করতে পারে।

FAQs

উইন্ডোজ ১০-এ কি টেক্সট-টু-স্পিচ আছে?

জি, উইন্ডোজ ১০-এ বিল্ট-ইন ফ্রি টেক্সট-টু-স্পিচ টুল Narrator আছে। স্ক্রিন রিডার দিয়ে যেকোনো টেক্সট ফাইল পড়ানো যায়, আর অনেক কাস্টমাইজ অপশনও আছে। আরও ভালো TTS চাইলে Speechify ব্যবহার করার পরামর্শ দিচ্ছি।

কম্পিউটারে টেক্সট-টু-স্পিচ কিভাবে চালু করব?

Settings-এ যান, Ease of Access-এ ক্লিক করুন। সেখানে Narrator অপশন দেখবেন; স্লাইডার অন করলেই ফিচার চালু হয়ে যাবে। সঙ্গে একটা পপ-আপ বক্সে আরও গাইডলাইনও পাবেন। 

টেক্সট-টু-স্পিচ কী?

টেক্সট-টু-স্পিচ হলো ভয়েস সিন্থেসিস সফটওয়্যার—যা লেখাকে কণ্ঠে রূপান্তর করে। এআই, ডিপ লার্নিং, মেশিন লার্নিংসহ নানা টেকনোলজি মিলে এতে বাস্তবের মতো স্বাভাবিক কণ্ঠ তৈরি হয়। 

স্পিচ ইঞ্জিন দিয়ে সহজেই যেকোনো টেক্সট (PDF থেকে epub)-কে অডিও বানানো যায়, আর এগুলো মূলত অ্যাক্সেসিবিলিটির জন্যই বানানো। জনপ্রিয় অ্যাপ: Microsoft Azure, NaturalReader, Amazon Polly, Speechify, Balabolka ইত্যাদি। 

কম্পিউটার কি টেক্সট শুনিয়ে দিতে পারে?

জি। আপনি যদি Windows ব্যবহার করেন, তাহলে Windows 10/11-এ আছে বিল্ট-ইন Narrator। সেটা ভালো না লাগলে Chrome এক্সটেনশন ডাউনলোড করে ওয়েবপেইজে TTS ব্যবহার করতে পারেন—Speechify তাদের মধ্যে অন্যতম জনপ্রিয়।

অত্যাধুনিক AI কণ্ঠস্বর, সীমাহীন ফাইল আর ২৪/৭ সহায়তা উপভোগ করুন

বিনামূল্যে ব্যবহার করে দেখুন
tts banner for blog

এই নিবন্ধটি শেয়ার করুন

Tyler Weitzman

টাইলার ওয়েইটজম্যান

স্ট্যানফোর্ড বিশ্ববিদ্যালয় থেকে কম্পিউটার সায়েন্সে এমএস, ডিসলেক্সিয়া ও অ্যাক্সেসিবিলিটি নিয়ে কাজ করা প্রবক্তা, স্পিচিফাই-এর সিইও ও প্রতিষ্ঠাতা

টাইলার ওয়েইটজম্যান স্পিচিফাই-এর সহ-প্রতিষ্ঠাতা, কৃত্রিম বুদ্ধিমত্তা বিভাগের প্রধান ও প্রেসিডেন্ট; স্পিচিফাই বিশ্বের #1 টেক্সট-টু-স্পিচ অ্যাপ, যার ১,০০,০০০+ ৫-তারকা রিভিউ রয়েছে। তিনি স্ট্যানফোর্ড বিশ্ববিদ্যালয় থেকে গণিতে বিএস এবং কৃত্রিম বুদ্ধিমত্তাভিত্তিক কম্পিউটার সায়েন্সে এমএস ডিগ্রি অর্জন করেছেন। ইনক. ম্যাগাজিনের টপ ৫০ উদ্যোক্তার তালিকায় তাঁর নাম রয়েছে, এবং তাঁকে বিজনেস ইনসাইডার, টেকক্রাঞ্চ, লাইফহ্যাকার, সিবিএসসহ বিভিন্ন মাধ্যমে কভার করা হয়েছে। তাঁর মাস্টার্স গবেষণার মূল ক্ষেত্র ছিল এআই ও টেক্সট-টু-স্পিচ; চূড়ান্ত গবেষণাপত্রের শিরোনাম ছিল “CloneBot: Personalized Dialogue-Response Predictions.”

speechify logo

স্পিচিফাই সম্পর্কে

#১ টেক্সট-টু-স্পিচ রিডার

স্পিচিফাই পৃথিবীর শীর্ষস্থানীয় টেক্সট-টু-স্পিচ প্ল্যাটফর্ম, যা ৫ কোটি+ ব্যবহারকারীর কাছে ভরসাযোগ্য এবং এর টেক্সট-টু-স্পিচ iOS, অ্যান্ড্রয়েড, ক্রোম এক্সটেনশন, ওয়েব অ্যাপ আর ম্যাক ডেস্কটপ অ্যাপসে ৫ লক্ষ+ ফাইভ-স্টার রিভিউ পেয়েছে। ২০২৫ সালে অ্যাপল স্পিচিফাই-কে মর্যাদাপূর্ণ অ্যাপল ডিজাইন অ্যাওয়ার্ড প্রদান করে WWDC-তে এবং একে বলে, “মানুষের জীবনে দারুণ সহায়ক একটি গুরুত্বপূর্ণ রিসোর্স।” স্পিচিফাই ৬০+ ভাষায় ১,০০০+ প্রাকৃতিক কণ্ঠ নিয়ে প্রায় ২০০ দেশে ব্যবহৃত হচ্ছে। সেলিব্রিটি কণ্ঠের মধ্যে রয়েছে স্নুপ ডগ আর গুইনেথ পেল্ট্রো। নির্মাতা ও ব্যবসার জন্য স্পিচিফাই স্টুডিও উন্নত সব টুল দেয়, যার মধ্যে রয়েছে AI ভয়েস জেনারেটর, AI ভয়েস ক্লোনিং, AI ডাবিং আর AI ভয়েস চেঞ্জার। স্পিচিফাই-এর উচ্চমানের এবং খরচ-সাশ্রয়ী টেক্সট-টু-স্পিচ API-এর মাধ্যমে অসংখ্য শীর্ষ পণ্য সম্ভব হয়েছে। দ্য ওয়াল স্ট্রিট জার্নাল, CNBC, Forbes, TechCrunch এবং অন্যান্য বড় সংবাদমাধ্যমে স্পিচিফাই নিয়ে প্রতিবেদন প্রকাশিত হয়েছে; এটি বিশ্বের সর্ববৃহৎ টেক্সট-টু-স্পিচ প্রদানকারী। আরও জানতে ভিজিট করুন speechify.com/news, speechify.com/blog এবং speechify.com/press