ক্লোজড ক্যাপশন বানানো বেশ ঝক্কির কাজ। ঠিকঠাক করতে দিন লেগে যেতে পারে। শুধু workflow ধীর হয় না, নানা কারণে কিছু কথা ধরতেও কষ্ট হয়। ব্যাকগ্রাউন্ড নয়েজ, আলাদা উচ্চারণ আর স্ল্যাং থাকলে Google Docs ট্রান্সক্রিপশন অনেক কিছুই গুলিয়ে ফেলে।
সৌভাগ্যবশত, ট্রান্সক্রিপশনিস্টদের জন্য দারুণ সব স্পিচ-টু-টেক্সট অ্যাপ আছে। এগুলোর অনেকই ফ্রি। নিচে আমরা সেরা কয়েকটির কথা বলেছি, যাতে আপনার কাজ হালকা হয়। চলুন, দেখে নেওয়া যাক!
ডেসক্রিপ্ট
যারা কম খরচে ট্রান্সক্রিপশন অ্যাপ খুঁজছেন, তাদের তালিকায় ডেসক্রিপ্ট থাকা চাই। ব্যবহারবান্ধব এই সফটওয়্যার মিটিং, ব্রিফ বা ব্যক্তিগত কথোপকথনের অডিও অল্প সময়েই টেক্সটে বদলে দেয়। ডেসক্রিপ্ট ইংরেজি ছাড়াও আরও ২১টি ভাষা বুঝতে পারে, যেমন স্প্যানিশ, জার্মান ও পর্তুগিজ।
ডেসক্রিপ্ট-এর বড় সুবিধা হলো, এটি অডিও ও ভিডিও—দু’ধরনের ফাইলেই কাজ করে। যেকোনো ফরম্যাটে একাধিক বক্তা থাকলেও, অ্যাপটি সেগুলো আলাদা আলাদা চিহ্নিত করতে পারে—ফলে আপনার ঝামেলা অনেক কমে যায়।
স্বয়ংক্রিয় ট্রান্সক্রিপশন অ্যাপ হলেও, ডেসক্রিপ্ট হাতে এডিট করার সুযোগ রাখে। চাইলে আপনি শব্দের মান ঘষামাজা করে বেড়াতে পারেন, যাতে শুনে যাচাই সহজ হয়। আরও ভালো দিক, নানান সাউন্ড ইফেক্ট ও মিউজিক যোগ করে ফাইলের ফ্লোও পাল্টানো যায়, একদম উন্নত অডিও-ভিডিও সফটওয়্যারের মতো।
ডেসক্রিপ্ট-এর পুরোপুরি ফ্রি ভার্সন আছে, যেখানে প্রতিদিন ৩ ঘণ্টা পর্যন্ত ট্রান্সক্রিপশন করা যায়। এর বেশি দরকার হলে Creator, Pro ও Enterprise—এই তিনটি প্ল্যানের যেকোনো একটিতে যেতে হবে। বার্ষিক বিল যথাক্রমে $১২, $২৪ ও কাস্টম ফি।
ফ্যাথম
জুম জনপ্রিয় হওয়ায় এখন মিটিং রেকর্ড করা একদম স্বাভাবিক ব্যাপার। কথা পরে আবার শোনার জন্য সবাই রেকর্ড রাখে। কিন্তু বারবার শুনে পুরোটা ঝালাই করা বেশ সময়খেকো। ফাইলও বড় হয়, আর একই কথা ঘুরে ফিরে শুনতে হয়।
এখানেই ফ্যাথম কাজে লাগে। এটি এমন এক ট্রান্সক্রিপশন টুল, যা দীর্ঘ জুম মিটিং রেকর্ড করে এক ঝটকায় স্ক্রিপ্টেড টেক্সটে বদলে দেয়। বেসিক ট্রান্সক্রিপশন ছাড়াও এই জুম ইন্টেগ্রেশন নির্দিষ্ট মুহূর্তে টাইমস্ট্যাম্প বসিয়ে রাখে, তাই আপনাকে আলাদা করে নোট নিতে হয় না। ফ্রি অ্যাপ হিসেবে এর ফিচার কিন্তু কম নয়।
ফ্যাথম লম্বা ভিডিও ক্লিপ কেটে ছোট ছোট অংশ বানায়, যা সহজেই সার্চ করা যায় এবং অন্যান্য ক্লাউড অ্যাপে সহকর্মীদের সঙ্গে শেয়ার করা যায়। প্রশ্ন থাকলে সেই অংশ সরাসরি সাপোর্ট টিমে পাঠানো যায়—এসবই হয়, নতুন করে কল সেট আপ না করেই।
ফ্যাথম-এর একটাই সীমাবদ্ধতা—এটি শুধু ইংরেজি সাপোর্ট করে। তবু, বাজেট না থাকলে ফ্রি সফটওয়্যার হিসেবে এটা বেশ কাজে দেয়।
মার্ফ AI
ট্রান্সক্রিপশন সার্ভিস দুই দিকেই কাজ করে। শুধু অডিও থেকে লেখা নয়, কিছু অ্যাপ আবার লেখাকে কথায়ও বদলে দেয়। এগুলোই text-to-speech অ্যাপ, যার মধ্যে জনপ্রিয় একটি হলো মার্ফ AI। ডিসলেক্সিয়া, ADHD বা দৃষ্টিশক্তি-সংক্রান্ত সমস্যায় ভোগা মানুষের জন্য এটি দারুণ সহায়ক টেকনোলজি।
মার্ফ AI ব্যবহারকারীদের জন্য নানান ধরনের কণ্ঠ দেয়, যেগুলো লেখা পড়ে শোনায়। ভিন্ন ভিন্ন উচ্চারণ, পুরুষ-নারী কণ্ঠ আর নানা ভাষার অপশন আছে। সবকটিই বেশ স্বাভাবিক শোনায়—কানে ধরলে আসল মানুষের গলাই মনে হয়, এআই নয়।
শুধু পড়ার সমস্যা আছে এমনদের জন্যই নয়, কনটেন্ট ক্রিয়েটরদের জন্যও মার্ফ AI কাজের জিনিস। তারা চাইলে আলাদা ব্র্যান্ডেড কণ্ঠ তৈরি করতে পারেন, যা ইউটিউব ভিডিও, পডকাস্ট বা অন্য যেকোনো প্রজেক্টে ভয়েসওভার হিসেবে ব্যবহার করা যায়।
মার্ফ AI-এর ফ্রি ভার্সন আছে বলেই এটি আমাদের তালিকায়। ফ্রি হয়েও কাজ চলে যায় অনেক কিছুর। তবে, ফ্রি প্ল্যানে দিনে ১০ মিনিট স্পিচের সীমা আছে। এর চেয়ে বেশি লাগলে প্রিমিয়াম নিতে হবে—Basic $১৩, Pro $২৬, Enterprise $১৬৭ প্রতি মাসে।
স্পিচনোটস
স্পিচনোটস হলো হালকা-পাতলা টুল, যেটা অডিওকে লেখায় রূপান্তর করে। এটি অ্যান্ড্রয়েড অ্যাপ হিসেবে চলে, আবার Chrome ব্রাউজারে অ্যাড-অন হিসেবেও আছে। সবচেয়ে বড় সুবিধা—এটি ফ্রি, আর ফ্রি Speech-to-text সফটওয়্যারের যা যা থাকা দরকার, প্রায় সবই আছে।
অনেক অ্যাপের ফ্রি ভার্সনে হাত-পা বাঁধা থাকে, কিন্তু স্পিচনোটসে সে রকম কড়াকড়ি কম। যে কোনো সাধারণ অডিও ফরম্যাট (WAV, MP3) বুঝে বেশ নিখুঁত ট্রান্সক্রিপ্ট দেয়। যদিও SRT সাবটাইটেল বানানো বা iOS/Mac-এ ব্যবহার করা যায় না। তবু, ফ্রি টুল হিসেবে কাজ চালানোর মতোই।
স্পিচিফাই—স্পিচ রিকগনিশনের বিকল্প
কিছু টুল অডিওকে লেখা বানায়, আবার কিছু লেখাকে কথায় বদলায়। পরের কাজটা হয় text-to-speech সফটওয়্যারের মাধ্যমে, যার সেরা উদাহরণ Speechify।
Speechify ব্যবহারকারীদের জন্য ১৫টির বেশি ভাষায় ৩০টিরও বেশি স্বাভাবিক কণ্ঠ দেয়। এটি বাস্তবসময়ে লেখা বা টেক্সটের ছবি তুলে নিয়ে অডিওতে রূপান্তর করে।
Speechify-এর আরেক সুবিধা, Audible থেকে ইবুক ইমপোর্ট করা যায়, তা-ও আবার ফ্রি ভার্সনেই। শুধু Speechify ব্যবহার করে দেখুন এখনই, বুঝে যাবেন কেন এটি সবচেয়ে জনপ্রিয় টেক্সট-টু-স্পিচ অ্যাপ।
প্রায় জিজ্ঞাসিত প্রশ্ন
ফ্রি-তে কিভাবে অডিও ট্রান্সক্রাইব করবো?
ফ্রি-তে অডিও ট্রান্সক্রাইব করতে চাইলে প্রথমে কোনো ফ্রি স্পিচ-টু-টেক্সট অ্যাপ ইনস্টল করুন বা সাইন আপ করুন। ভাগ্য ভালো, অনলাইনে এমন ফ্রি অপশন এখন প্রচুর।
ফ্রি অডিও-টু-টেক্সট কনভার্টার কি আছে?
- ডেসক্রিপ্ট
- অটার
- রেভ
- ওট্রান্সক্রাইব
- ফ্যাথম
গুগলেও কি ফ্রি ট্রান্সক্রিপশন সফটওয়্যার আছে?
হ্যাঁ, Google Cloud Speech-to-text নির্দিষ্ট সীমার মধ্যে ফ্রি-তে ব্যবহার করতে পারেন।
অডিও ট্রান্সক্রিপশনের উপকারিতা কী?
শ্রবণ-প্রতিবন্ধী ব্যবহারকারীদের সহায়তা ছাড়াও, অডিওকে টেক্সটে রূপান্তর করলে দীর্ঘ জুম মিটিং, ব্রিফ ও নোট পরে দ্রুত ঝালাই করতে অনেক সুবিধা হয়।

