টেক্সট টু স্পিচ সফটওয়্যার (TTS) কম্পিউটার ভয়েস
কম্পিউটার কথা বলবে—এটি স্টার ট্রেক থেকে এসেছে বলে মনে হতে পারে, কিন্তু স্পিচ রিকগনিশন ও টেক্সট টু স্পিচ এখন হাতের মুঠোয়, একেবারেই বাস্তব।
কম্পিউটার এখন স্বাভাবিক ও উচ্চমানের কণ্ঠে কথা বলতে পারে। এই আর্টিকেলে জানুন টেক্সট টু স্পিচ প্রোগ্রাম কীভাবে স্পিচ সিন্থেসিস দিয়ে ভয়েস তৈরি করে এবং এটি আপনাকে ঠিক কীভাবে সাহায্য করতে পারে।
টেক্সট টু স্পিচ সফটওয়্যার কীভাবে কাজ করে?
টেক্সট টু স্পিচ (TTS) সফটওয়্যার ডিজিটাল লেখা জোরে পড়ে শোনায় মানুষের কণ্ঠে। প্রথমবার শুনলে অস্বাভাবিক লাগতে পারে, কিন্তু এই প্রযুক্তি ইন্টারনেট ও ডিজিটাল মিডিয়াকে অনেক বেশি সহজলভ্য করে তুলেছে।
স্পিচিফাই কী?
স্পিচিফাই একটি TTS সফটওয়্যার, যা পড়া ও শেখার জন্য ইন্টার্যাক্টিভ উপায় দেয়। প্ল্যাটফর্মটি ওয়েবসাইটসহ বিভিন্ন ডিজিটাল উৎস থেকে আপনার পছন্দের ভাষা ও কণ্ঠে লেখা পড়ে শোনায়।
অ্যাপটি অডিও ফাইলও তৈরি করে, যা আপনি ডাউনলোড করে পরে সুবিধাজনক সময়ে শুনতে পারেন।
প্রশ্নোত্তর (FAQ) দেখুন
স্পিচিফাই কীভাবে কাজ করে জানতে চান? স্পিচিফাই সাইটের FAQ বিভাগে এই TTS সফটওয়্যার কীভাবে রিয়েল-টাইমে টেক্সট পড়ে শোনায়, সেই প্রক্রিয়া ও সাধারণ প্রশ্নের উত্তর দেওয়া আছে।
অ্যাপের সাধারণ তথ্য পাবেন অ্যাপল iOS, অ্যান্ড্রয়েড ও ক্রোম সম্পর্কে। ইনস্টল গাইডও আছে। এটি মাইক্রোসফট উইন্ডোজেও চলে।
স্পিচিফাই কম্পিউটার ভয়েসসমূহ
স্পিচিফাই কৃত্রিম বুদ্ধিমত্তা ও মেশিন লার্নিং ব্যবহার করে মানুষের মত ভয়েস তৈরি করে। ব্যবহারকারীরা নানা ধরনের কণ্ঠের মধ্য থেকে নিজের পছন্দমতো বেছে নিতে পারেন।
নারী কণ্ঠ
- গুইনেথ প্যালট্রো (সেলিব্রিটি, আমেরিকান)
- মেরি (আমেরিকান ইংরেজি)
- স্টেফানি (ব্রিটিশ)
- স্যালি (আমেরিকান ইংরেজি)
- সারাহ (ব্রিটিশ)
- অলিভিয়া (অস্ট্রেলিয়ান ইংরেজি)
- লুপে (স্প্যানিশ)
- মিয়া (স্প্যানিশ)
- কার্লা (ইতালিয়ান)
- ভিকি (জার্মান)
- লিয়া (ফরাসি)
- আদিতি (হিন্দি ইংরেজি)
- ক্যামিলা (পর্তুগিজ)
- তাতিয়ানা (রাশিয়ান)
- ঝিয়ু (চাইনিজ)
- জেইনা (আরবি)
- সিওয়েয়ন (কোরিয়ান)
- এমা (আমেরিকান ইংরেজি)
পুরুষ কণ্ঠ
- ম্যাথিউ (ইংরেজি)
- ন্যারেটর (ব্রিটিশ)
- হ্যারি (ব্রিটিশ)
- নেট (আমেরিকান ইংরেজি)
- সাইমন (আমেরিকান ইংরেজি)
- মাইকেল (ব্রিটিশ)
- এরিক্স (অস্ট্রেলিয়ান ইংরেজি)
- মিগেল (স্প্যানিশ)
- জর্জিও (ইতালিয়ান)
- হান্স (জার্মান)
- মাথিউ (ফরাসি)
- রিকার্ডো (পর্তুগীজ)
- ম্যাক্সিম (রাশিয়ান)
ভয়েস/পড়ার গতির নিয়ন্ত্রণ
স্পিচিফাই অ্যাপে স্লাইড ব্যবহার করে পড়ার গতি সহজে নিয়ন্ত্রণ করা যায়। এতে চারটি মূল অপশন আছে:
- ধীরে
- গড়
- দ্রুত
- স্পিড রিডার
পড়ার গতি প্রতি মিনিটে ১০০ থেকে ৯০০ শব্দ পর্যন্ত বাড়ানো যায়।
কখন TTS ব্যবহার করবেন
বিভিন্ন কারণে TTS প্রযুক্তি ব্যবহার করা হয়:
- TTS ভাষা শেখা সহজ করে (যেমন: বিরামচিহ্ন, উচ্চারণ)। এটি বিভিন্ন শব্দের উচ্চারণ আলাদা করে ধরতে সাহায্য করে।
- একসাথে একাধিক কাজ করা যায়—TTS দিয়ে কাজের ফাঁকে আর্টিকেল শুনতে পারেন।
- যারা ডিসলেক্সিয়া আছে বা দৃষ্টিশক্তির সমস্যার কারণে পড়তে পারেন না, তাদের জন্য টেক্সট ট্রান্সক্রিপশন শোনার ক্ষেত্রে TTS খুব উপকারী।
- অনেকে উপস্থাপনা আর মিডিয়ায় টেক্সটে কণ্ঠ যোগ করতে TTS ব্যবহার করেন—ভিডিও গেমেও এর ব্যবহার আছে।
স্পিচিফাই অ্যাকাউন্ট কিভাবে খুলবেন
স্পিচিফাই অ্যাকাউন্ট খোলা একদম সহজ, সরাসরি ওয়েবসাইট থেকেই করা যায়।
- নেভিগেশন বার থেকে “লগইন” এ ক্লিক করুন।
- গুগল, ফেসবুক বা অ্যাপল দিয়ে লগইন করতে চাইলে ওই অপশনগুলো বেছে নিন। নইলে “ক্রিয়েট অ্যাকাউন্ট” সিলেক্ট করুন।
- ইমেইল ও পাসওয়ার্ড লিখে “সাইন আপ” করুন।
- পেমেন্ট তথ্য দিয়ে শুরু করুন, তিন দিনের ফ্রি ট্রায়াল পাবেন।
স্পিচিফাই ফ্রি ও পেইড—দু’রকম প্ল্যানে পাওয়া যায়।
স্পিচিফাই ফ্রি অ্যাকাউন্ট
স্পিচিফাই-এর ফ্রি সংস্করণে ১০টি ভয়েস থেকে বেছে নিতে পারবেন, মোবাইলেও শুনতে পারবেন। তবে সেখানে ১ গুণ গতিতেই শুনতে পারবেন।
স্পিচিফাই পেইড অ্যাকাউন্ট
স্পিচিফাই-এর প্রিমিয়াম অ্যাকাউন্ট বছরে $১৩৯, গড়ে মাসে $১১.৫৮। পেইড ভার্সনে যা পাবেন:
- ৩০+ ভয়েসে শুনতে পারবেন
- ২০+ ভাষায় পড়ার সুযোগ
- পড়ার গতি কাস্টমাইজ করে মিনিটে ৯০০ শব্দ পর্যন্ত নেওয়ার সুবিধা
- ডিজিটাল বা প্রিন্টেড লেখা স্ক্যান করে শুনুন
- নোট নেয়ার টুল
- অ্যাডভান্সড স্কিপ ও টেক্সট ইমপোর্ট ফিচার
স্পিচিফাই বিকল্প
বিভিন্ন TTS রিডার ভিন্ন ধরনের সাবস্ক্রিপশন অফার করে। স্পিচিফাই-এর বিকল্প হিসেবে আছে Murf.ai, NaturalReader ও TextAloud। তবে স্পিচিফাই সবচেয়ে স্বাভাবিক ও মানুষের কাছাকাছি ভয়েস দেয়। ছবির লেখা পড়েও শোনাতে পারে, যা অন্য অনেক অ্যাপে নেই।
পরবর্তী পদক্ষেপ
টেক্সট টু স্পিচ সফটওয়্যারের ব্যবহার নানাভাবে হয়। সাধারণ পাঠ থেকে শুরু করে ডাবিং অ্যানিমে পর্যন্ত, TTS একদমই বহুমুখী।
TTS প্রযুক্তি ব্যবহার শুরু করতে চাইলে, স্পিচিফাইতে সাইন আপ করুন। ফ্রি অ্যাকাউন্টে বেসিক সুবিধা, আর প্রিমিয়ামে পুরো অভিজ্ঞতা পাবেন।
প্রশ্নোত্তর
কম্পিউটার ভয়েসকে কী বলা হয়?
TTS টুলের ভয়েসের আলাদা নাম থাকতে পারে, তবে সাধারণভাবে কম্পিউটার ভয়েস বলতে স্পিচ সিন্থেসিসকে বোঝায়।
কম্পিউটার কীভাবে ভয়েস তৈরি করে?
ডিপ লার্নিং, মেশিন লার্নিং ও কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে মানুষের মতো ভয়েস তৈরি করা হয়।
ল্যাপটপে কিভাবে ভয়েস টাইপ করবেন?
উইন্ডোজ ল্যাপটপে, উইন্ডোজ লোগো কি + H চাপুন। এরপর টাচ কিবোর্ডে মাইক্রোফোন চিহ্নে ট্যাপ করুন।
কীভাবে লেখায় ভয়েস যোগ করবেন?
TTS সফটওয়্যার দিয়ে অডিও ফাইল তৈরি করুন। তারপর এডিটিং সফটওয়্যারে টেক্সটের ওপর সেই ফাইল চালিয়ে দিন।
ভয়েস রিকগনিশন কীভাবে কাজ করে?
ভয়েস রিকগনিশন সফটওয়্যার শব্দকে ছোট ছোট অংশে ভাগ করে কম্পিউটারে শনাক্ত করে। এরপর সেগুলো ডিজিটাল ফরম্যাটে বিশ্লেষণ করে।
কম্পিউটার ভয়েসের কিছু অসুবিধা কী?
কম্পিউটার ভয়েস সবসময় মানুষের মতো আবেগ বা স্বরভঙ্গি ফুটিয়ে তুলতে পারে না। আর ভয়েসের মান সফটওয়্যারভেদে আলাদা হয়।
কিভাবে কম্পিউটারের ভয়েস পরিবর্তন করবেন?
ভিন্ন TTS রিডার ব্যবহার করুন, অথবা একই রিডারের ভেতরেই ভয়েস বদলে নিন। স্পিচিফাইতে ৩০টির বেশি ভয়েস থেকে বেছে নিতে পারবেন।
কম্পিউটার কিভাবে ভয়েস রেকর্ড করবেন?
মাইক্রোসফট উইন্ডোজের Voice Recorder সফটওয়্যারে রেকর্ড করুন। ম্যাকে Voice Memos আছে। স্পিচিফাই-এ স্পিচ টু টেক্সট সুবিধাও আছে।
ভয়েস সিন্থেসাইজার কী?
ভয়েস সিন্থেসাইজার হচ্ছে এমন কম্পিউটার সিস্টেম, যা মানুষের মত কণ্ঠ তৈরি করতে পারে।
কম্পিউটার ভয়েসের ধরন কত ধরনের?
কম্পিউটার ভয়েসের ধরন অনেক, তবে সবই মূলত কৃত্রিম বুদ্ধিমত্তা দিয়ে মানুষের মত কথা বলে।

