প্রযুক্তি সত্যিই অনেক দূর এগিয়েছে। নতুন কৃত্রিম বুদ্ধিমত্তা-ভিত্তিক অ্যাপগুলো দিয়ে আমরা চ্যাটবট, ছবি জেনারেটর, আরও কত কিছুই না পাচ্ছি। সেই তালিকায় আছে AI ভয়েস জেনারেটরও।
এ ধরনের অ্যাপ আমাদের দেওয়া নমুনা কণ্ঠ অনুযায়ী উচ্চমানের কণ্ঠ তৈরি করে। কনটেন্ট নির্মাতাদের জন্য এগুলো দারুণ, কারণ এতে একাধিক চরিত্রের কণ্ঠ খুব সহজেই আলাদা করে সেট করা যায়।
তাই, আপনি যদি একাধিক চরিত্রের জন্য ভিডিওতে ভয়েসওভার করতে চান, তাহলে ঠিক জায়গাতেই এসেছেন। এবার দেখুন, কণ্ঠশিল্পী না নিয়েও কিভাবে ভয়েস জেনারেটর কাজে লাগাতে পারেন।
চরিত্রের ভয়েস জেনারেটর ব্যবহার
মূলত, ভয়েস জেনারেটরে ব্যবহারকারীকে নিজের কণ্ঠের নমুনা দিতে হয়, এটি তা বিশ্লেষণ করে রিয়েল-টাইমে বিভিন্ন ধরনের নতুন কণ্ঠ তৈরি করে। এতে এক জন মানুষ নিজের একটি রেকর্ডিং দিয়েই নানা রকম কাস্টম কণ্ঠ বানাতে পারে। ফলে প্রতিটি চরিত্রের জন্য আলাদা কণ্ঠ দেওয়া সম্ভব হয়।
আবার, যারা নিজেদের কণ্ঠ রেকর্ড করতে অস্বস্তি বোধ করেন, তাদের জন্যও ভয়েস জেনারেটর একদম উপযোগী। কারও উচ্চারণ বা টান নিয়ে অস্বস্তি থাকলে পেশাদার কণ্ঠশিল্পী না নিয়েও AI দিয়ে সহজে ভিডিওতে নানান কণ্ঠ জুড়ে দেওয়া যায়; খরচও কম পড়ে।
ভয়েস চেঞ্জার ও জেনারেটরের সবচেয়ে প্রচলিত ব্যবহার ফ্যানমেড এনিমে, অডিওবুক, পডকাস্ট আর ডিপফেইক ভিডিওতে। এছাড়াও ইউটিউব ভিডিও, ডিসকর্ডে মজার কণ্ঠে আড্ডা—এ ধরনের আরও অনেক কনটেন্টেও এগুলো ব্যবহার হচ্ছে।
সেরা চরিত্র ভয়েস জেনারেটর
এবার আমরা কয়েকটি জনপ্রিয় ভয়েস জেনারেটর অ্যাপের কথা বলব। এখানে বিনামূল্যের কোনো অ্যাপ নেই, কারণ সেরা গুলো সাধারণত প্রিমিয়াম হয়। আমরা তিনটি নাম দিচ্ছি, প্রতিটিই নিজ নিজ ক্ষেত্রে আলাদা করে চোখে পড়ার মতো।
Resemble AI
প্রথমেই আছে Resemble AI। এখানে ২ লাখের বেশি প্রস্তুত ভয়েস টেম্পলেট, নিজের কণ্ঠ ক্লোন ও টিউন করার সুযোগ, আর ইংরেজি ছাড়াও অনেক ভাষার সাপোর্ট রয়েছে। iOS, অ্যান্ড্রয়েড ও পিসিতে ব্যবহার করা যায়।
মূল্যের দিক থেকে Resemble-এর দুটি সংস্করণ আছে—Basic ও Pro, প্রতিটির ফিচার আলাদা। Pro সংস্করণ বেশি উন্নত, তবে দাম তুলনামূলক বেশি এবং আলাদাভাবে আলোচনা করে ঠিক করতে হয়।
Uberduck AI
এরপর আছে Uberduck AI। এখানে আপনি নিজের কণ্ঠ ক্লোন করতে পারেন, আবার চাইলে প্রস্তুত কণ্ঠও ব্যবহার করতে পারেন। ব্যবহার একদম সহজ, আর voice cloning বিভাগে দারুণ কাজ করে।
মূল্য পরিকল্পনা Resemble থেকে ভিন্ন, এখানে চারটি অপশন আছে। একটি ফ্রি, আর তিনটি প্রিমিয়াম—Creator ($96/বছর), Clone ($480/বছর), Enterprise ($300/মাস)।
Murf AI
তৃতীয় অ্যাপ Murf AI। Murf AI অনেকের পছন্দ, কারণ এর API দিয়ে অনেক বাড়তি সুবিধা পাওয়া যায়। নিজের কণ্ঠ বা প্রস্তুত কণ্ঠ ক্লোন করে টেক্সট-টু-স্পিচ চালানো সম্ভব। ব্যবহারও খুব সহজ, লম্বা টিউটোরিয়াল দেখে সময় নষ্ট করতে হয় না।
Murf AI-তে তিনটি প্রিমিয়াম সংস্করণ আছে—Basic ($19/মাস), Pro ($26/মাস), Enterprise ($59/মাস)। এছাড়া নতুনদের জন্য সীমিত ফিচারসহ ফ্রি অপশনও রাখা হয়েছে।
টেক্সট-টু-স্পিচের জন্য AI কণ্ঠ
এ লেখাটি মূলত কার্টুন চরিত্রের ভয়েস জেনারেটর ও সেলিব্রিটি ক্লোনিং নিয়ে। তবে AI কণ্ঠের জগত আরও অনেক বড়। এসব কণ্ঠ টেক্সট-টু-স্পিচ অ্যাপে ব্যবহার হয়, আর সেই Read-Aloud সফটওয়্যারের দুনিয়ায় Speechify নম্বর ১।
Speechify
Speechify সারা বিশ্বের শীর্ষস্থানীয় TTS অ্যাপগুলোর একটি। কৃত্রিম বুদ্ধিমত্তা, মেশিন লার্নিং ও OCR ব্যবহার করে এটা প্রায় যেকোনো লেখা আপনাকে শুনিয়ে দিতে পারে। মূলত পড়ায় অসুবিধা আছে এমনদের জন্য বানানো, তবে নানা প্রয়োজনেই মানুষ এটাকে ব্যবহার করছেন।
Speechify-তে ১৪+ ভাষায় অসংখ্য কণ্ঠ আছে—পুরুষ, নারী আর ভিন্ন ভিন্ন উচ্চারণে। কণ্ঠ এতটাই স্বাভাবিক শোনায় যে প্রায় বাস্তব মনে হয়। গতি বাড়ানো-কমানো, কণ্ঠ টিউনসহ আরও অনেক ফিচারও রয়েছে।
Speechify সব জনপ্রিয় প্ল্যাটফর্মে ব্যবহার করা যায়। Google Chrome, Safari-র জন্য প্লাগইন, iOS ও Android-এর জন্য অ্যাপ, সঙ্গে macOS-এও চলে—অনলাইনে লেখা পড়া একেবারে ঝামেলাহীন করে তোলে।
প্রায়শই জিজ্ঞাসিত প্রশ্ন
কেন একজনের ভয়েস ডিজঅর্ডার হতে পারে?
ভয়েস জেনারেটর ব্যবহারের সাধারণ কারণ, কারও জন্য স্পষ্ট করে কথা বলা কষ্টকর হয়ে ওঠা। বয়স, অ্যালকোহল, ধূমপান, অ্যালার্জি, স্নায়ুজনিত নানা সমস্যার কারণে এমন হতে পারে।

