1. হোম
  2. প্রোডাক্টিভিটি
  3. অডিওবুক স্বপ্রকাশে এআই ভয়েসের ব্যবহার: এক সম্পূর্ণ গাইড
প্রকাশের তারিখ প্রোডাক্টিভিটি

অডিওবুক স্বপ্রকাশে এআই ভয়েসের ব্যবহার: এক সম্পূর্ণ গাইড

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

apple logo২০২৫ অ্যাপল ডিজাইন অ্যাওয়ার্ড
৫ কোটি+ ব্যবহারকারী

ডিজিটাল বর্ণনা ও অডিওবুক বাজার বড় হওয়ায় অনেক স্ব-প্রকাশিত লেখক এখন মানসম্মত অডিওবুক বানাতে নতুন উপায় খুঁজছেন। এর মধ্যে এক বড় ধারা হলো কৃত্রিম বুদ্ধিমত্তা (AI) প্রযুক্তি, বিশেষত AI ভয়েস ব্যবহার করে নিজের লেখা পড়ানো। এই প্রবন্ধে AI ভয়েসের ব্যবহার, Audible ও ACX-এর মতো প্ল্যাটফর্ম, এবং অডিওবুক তৈরি ও প্রকাশনার ধাপগুলো নিয়ে বিস্তারিত আলোচনা করা হয়েছে।

ACX কি AI ভয়েস গ্রহণ করে?

ACX, যা স্বাধীন ও স্ব-প্রকাশকদের জন্য অডিওবুক প্রকাশে সহায়তা করে, এতদিন মূলত মানুষের কণ্ঠকেই অগ্রাধিকার দিয়েছে এবং লেখকদের পেশাদার বর্ণনাকারীর সাথে যুক্ত করেছে। যদিও অফিসিয়ালি এখনো AI ভয়েস অনুমোদিত নয়, ভবিষ্যতে নীতিমালা বদলাতে পারে, তাই নিয়মিত হালনাগাদ দেখে নিন।

AI দিয়ে কিভাবে অডিওবুক বানাবেন?

AI দিয়ে অডিওবুক বানাতে হলে প্রথমে এমন একটি টেক্সট-টু-স্পিচ (TTS) সফটওয়্যার বাছুন, যেখানে বিভিন্ন AI ভয়েস আছে। এখন অনেক টুলেই বেশ প্রাকৃতিক ও মানসম্মত কণ্ঠ পাওয়া যায়। পছন্দের ভয়েস বেছে নেওয়ার পর আপনার টেক্সট (উপন্যাস, নন-ফিকশন ইত্যাদি) সফটওয়্যারে দিন, যা সেটিকে অডিও ফাইলে রূপ দেবে। এরপর শোনার অভিজ্ঞতা আরও মসৃণ করতে কিছুটা এডিটিং লাগতে পারে। মনে রাখুন, আধুনিক AI হলেও আবেগ ও ভ্যারিয়েশনে মানুষের কণ্ঠের সমকক্ষ নয়।

কিভাবে অডিওবুক স্বপ্রকাশ করবেন?

অডিওবুক স্বপ্রকাশের শুরুতে বইটি নিজের কণ্ঠে বা (মানুষ বা AI) ভয়েস-ওভার আর্টিস্টের কণ্ঠে রেকর্ড করুন। অডিও সম্পাদিত ও প্রস্তুত হলে, ACX, Findaway Voices কিংবা অন্য প্ল্যাটফর্মে জমা দিন। এসব প্ল্যাটফর্ম Audible, Amazon, Apple Books, Google Play, Kobo-সহ নানা বিক্রেতার কাছে আপনার অডিওবুক পৌঁছে দেবে।

অডিওবুক স্বপ্রকাশে খরচ কত?

স্বপ্রকাশিত অডিওবুকের খরচ নানা কারণে কমবেশি হতে পারে:

  1. বর্ণনা: পেশাদার ভয়েস অভিনেতা নিলে এটি সবচেয়ে ব্যয়বহুল অংশ হতে পারে। অভিজ্ঞতা ও চাহিদা অনুযায়ী PFH (প্রতি ফিনিশড ঘণ্টা) $১০০-$৫০০ বা তার বেশি লাগতে পারে। নিজে বা AI ব্যবহার করলে এই খরচ বেশ কমে যাবে।
  2. এডিটিং ও পোস্ট-প্রডাকশন: বর্ণনার পরে অডিও এডিট ও মাস্টার করতে হবে যেন গুণগতমান ঠিক থাকে। পেশাদার এডিটর প্রতি ঘণ্টা $৫০-$১০০ পর্যন্ত নিতে পারেন। আপনার স্কিল থাকলে এই খরচ অনেকটাই বাঁচাতে পারবেন।
  3. কভার: আপনার মূল কভার ব্যবহার করা গেলেও অনেকে আলাদা আকর্ষণীয় ডিজাইনের জন্য একজন ডিজাইনার নেন। এতে $৫০ থেকে কয়েকশো ডলার পর্যন্ত খরচ হতে পারে।
  4. বিতরণ: ACX বা Findaway Voices-এর মতো প্ল্যাটফর্ম বিক্রয়মূল্যের কিছু অংশ ফি হিসেবে নেয়। যেমন, ACX সাধারণত এক্সক্লুসিভ হলে ৪০-৬০% কেটে রাখে। অন্য প্ল্যাটফর্মের ফি স্ট্রাকচার ভিন্ন।
  5. মার্কেটিং: অডিওবুকের প্রচারের জন্য বিজ্ঞাপন, রিভিউ কপি ইত্যাদি খরচও ধরে রাখুন।

এসব কারণে স্বপ্রকাশিত অডিওবুক বানাতে কয়েকশ’ থেকে কয়েক হাজার ডলার পর্যন্ত খরচ পড়তে পারে। AI ভয়েস ব্যবহার করলে মোট খরচ কমানো যায়, যা সীমিত বাজেটের লেখকদের জন্য বাড়তি সুবিধা। তবে ভালো মানের বর্ণনা ও প্রডাকশনে বিনিয়োগ করলে শ্রোতার অভিজ্ঞতা যেমন ভালো হয়, তেমনি বিক্রিও বাড়ে।

AI ভয়েস দিয়ে অডিওবুক প্রকাশ করা যায়?

হ্যাঁ, আপনি AI-বর্ণিত অডিওবুক প্রকাশ করতে পারেন, যদি এমন প্ল্যাটফর্ম নেন যা AI ভয়েস সমর্থন করে। যেমন, নতুন কিছু প্ল্যাটফর্মে, যেমন Descript-এ, নিজের কণ্ঠভিত্তিক 'Overdub' ভয়েস বানানো যায়। তবে সব সময় প্ল্যাটফর্মের সর্বশেষ নীতিমালা দেখে নিন।

কিভাবে নিজের অডিওবুক প্রকাশ করব?

নিজের অডিওবুক প্রকাশের কয়েকটি মূল ধাপ আছে: রেকর্ডিং, এডিটিং, ফরম্যাটিং এবং শেষ পর্যন্ত বিভিন্ন প্ল্যাটফর্মে বিতরণ। নিচে একটি সাধারণ গাইড দেওয়া হলো:

১. পাণ্ডুলিপি সম্পন্ন করুন: নিশ্চিত করুন এটি পুরোপুরি লেখা, সম্পাদিত ও অডিওর জন্য প্রস্তুত। কিছু ধরনের লেখা অডিওতে ভালো শোনায় না, সেগুলো আগেই ঠিক করে নিন।

২. বর্ণনাকারী নির্বাচন: আপনি নিজে বর্ণনা করবেন, নাকি পেশাদার নেবেন, না কি AI ব্যবহার করবেন—এটি ঠিক করুন। সিদ্ধান্ত নেওয়ার সময় আপনার লক্ষ্য শ্রোতাদের কথা মাথায় রাখুন।

৩. অডিও রেকর্ড করুন: নিরিবিলি ও শব্দমুক্ত পরিবেশে রেকর্ড করুন যেন অডিও কোয়ালিটি ভালো থাকে। পেশাদার বর্ণনাকারী নিলে তারা এ অংশ দেখাশোনা করবেন।

৪. অডিও এডিট ও মাস্টার: কাঁচা অডিও ফাইল থেকে ভুল, অনাকাঙ্ক্ষিত শব্দ, অযথা দীর্ঘ পজ কেটে এডিট করতে হবে। এরপর প্ল্যাটফর্মের টেকনিক্যাল মান পূরণের জন্য মাস্টার করতে হবে।

৫. কভার আর্ট প্রস্তুত করুন: বইয়ের মতো অডিওবুকেরও কভার দরকার। বেশির ভাগ প্ল্যাটফর্ম স্কয়ার কভার চায়, তাই সেই অনুযায়ী কভার অ্যাডাপ্ট করুন।

৬. বিতরণ প্ল্যাটফর্ম নির্বাচন: কোথায় অডিওবুক ছড়িয়ে দেবেন তা ঠিক করুন। ACX (Audiobook Creation Exchange) যেমন Amazon, Audible, iTunes-এ বিতরণ করে। Findaway Voices-ও গুগল প্লে, কোবো, স্পটিফাই-সহ ৪০+ প্ল্যাটফর্মে দেয়।

৭. অডিওবুক আপলোড: বাছাই করা প্ল্যাটফর্মের নির্দেশনা মেনে অডিও ফাইল ও কভার আপলোড করুন। বইয়ের নাম, লেখক, বিবরণসহ প্রয়োজনীয় তথ্য দিন।

৮. মূল্য নির্ধারণ ও প্রকাশ: ACX-এর মতো কিছু প্ল্যাটফর্মে মূল্য স্বয়ংক্রিয়ভাবে নির্ধারিত হয়। Findaway Voices-এ আবার নিজে দাম ঠিক করতে পারেন। সবকিছু ঠিক থাকলে প্রকাশের জন্য সাবমিট করুন, আর প্ল্যাটফর্ম যাচাই শেষে বিক্রির জন্য উন্মুক্ত করবে।

প্রত্যেক অডিওবুক প্ল্যাটফর্মের নিজস্ব নিয়ম ও গাইডলাইন থাকে, তাই সবসময় সেগুলো ভালো করে পড়ুন এবং মেনে চলুন, যাতে আপনার অডিওবুক সহজেই অনুমোদন পায়।

স্বপ্রকাশিত অডিওবুকের খরচ কত?

স্বপ্রকাশিত অডিওবুকের খরচ কয়েকটি প্রধান কারণে ভিন্ন হতে পারে:

১. বর্ণনা: পেশাদার বর্ণনাকারী নিলে এটি সবচেয়ে বড় খরচের অংশ হতে পারে। PFH $১০০-$৫০০ বা তার বেশি লাগতে পারে, যা মূলত বর্ণনাকারীর অভিজ্ঞতা ও সুনামের উপর নির্ভর করে।

২. এডিটিং ও মাস্টারিং: রেকর্ডিং শেষে অডিও থেকে ভুল কাটা, শব্দ পরিষ্কার করা ও মান ঠিক রাখার জন্য এডিট করতে হয়। কোয়ালিটি ধরে রাখতে মাস্টারিংও লাগে। এডিটর রেট ও অডিওর দৈর্ঘ্য মিলিয়ে $৫০-$১০০ বা তার বেশি খরচ পড়তে পারে।

৩. কভার ডিজাইন: পেশাদার ডিজাইনার নিলে সাধারণ ডিজাইন $৫০ থেকে শুরু করে কাস্টম ডিজাইন $৫০০ বা তার বেশি পর্যন্ত হতে পারে।

৪. বিতরণ: অডিওবুক বিতরণে নির্দিষ্ট প্ল্যাটফর্মের ফি বা রয়্যালটি কাটা যেতে পারে। উদাহরণ হিসেবে, ACX রয়্যালটি ভাগাভাগি মডেলে কাজ করে।

৫. প্রচার ও মার্কেটিং: লক্ষ্য শ্রোতাদের কাছে পৌঁছাতে বিজ্ঞাপন, প্রমোশন বা রিভিউ কপি পাঠানোর খরচও যোগ হবে।

AI দিয়ে বর্ণনা করলে বিশেষ করে বর্ণনা ও এডিটিং-এর খরচ কিছুটা কমে যেতে পারে, যদিও AI সফটওয়্যার নিজেরও সাবস্ক্রিপশন বা লাইসেন্স খরচ থাকতে পারে। মনে রাখুন, AI কণ্ঠ যতই উন্নত হোক, মানুষের আবেগ, সুর ও প্রকাশের গভীরতাকে পুরোপুরি ছাড়িয়ে যেতে পারে না।

সব মিলিয়ে, স্ব-প্রকাশিত অডিওবুক বানাতে কয়েকশ’ থেকে কয়েক হাজার ডলার পর্যন্ত খরচ হতে পারে, আর প্রতিটি ধাপে আপনার নেওয়া সিদ্ধান্তের ওপরই তা নির্ভর করবে। খরচ বাঁচানো আর মান বজায় রাখার মধ্যে সঠিক ভারসাম্য করাটাই এখানে আসল।

স্বপ্রকাশিত অডিওবুক তৈরির ধাপ কী?

একটি অডিওবুক তৈরি করে স্ব-প্রকাশ করা বেশ কয়েকটি ধাপের সমন্বয়ে গড়ে ওঠা কাজ, যেখানে আগেই পরিকল্পনা করা খুব জরুরি। নিচে প্রধান ধাপগুলো সংক্ষেপে দেওয়া হলো:

১. প্রস্তুতি: সম্পূর্ণ ও সম্পাদিত পাণ্ডুলিপি নিয়ে শুরু করুন। অডিওতে মানানোর জন্য কিছু পরিবর্তন লাগতে পারে—যেমন অনেক সময় ফুটনোট বা দৃশ্যমান টীকা অডিও ফরম্যাটে অর্থহীন হয়ে যায়।

২. বর্ণনা: কে বর্ণনা করবে ঠিক করুন—নিজে করবেন, পেশাদার নেবেন, না কি AI ব্যবহার করবেন। ভয়েস যেন আপনার বইয়ের ধরন, টোন ও স্টাইলের সঙ্গে মানিয়ে যায়।

৩. রেকর্ডিং: আপনি বা মানুষ বর্ণনা করলে শব্দরোধী বা নিরিবিলি কক্ষে রেকর্ড করতে হবে। AI হলে কেবল লিখিত টেক্সট সফটওয়্যারে দিলেই হবে।

৪. এডিটিং: ভুল উচ্চারণ, অপ্রয়োজনীয় বিরতি, ব্যাকগ্রাউন্ড শব্দ দূর করতে এবং অডিও যেন স্মুথভাবে এগোয়, সে জন্য এডিটিং দরকার। সাধারণত অডিও এডিটিং সফটওয়্যার দিয়ে এটি করা হয়।

৫. মাস্টারিং: এডিট করা অডিওকে নির্দিষ্ট টেকনিক্যাল মানে আনতে মাস্টারিং করতে হবে—ভলিউম লেভেল, ধারাবাহিকতা, সাইলেন্স ইত্যাদি ঠিক আছে কি না, তা চেক করতে হবে।

৬. কভার ডিজাইন: নির্বাচিত প্রকাশন প্ল্যাটফর্মের চাহিদা অনুযায়ী স্কয়ার কভার তৈরি বা মানিয়ে নিন।

৭. প্রকাশনা: ACX, Findaway Voices বা অন্য কোনো প্ল্যাটফর্ম বেছে নিন। তারপর অডিও ফাইল, কভার ও বইয়ের তথ্য আপলোড করুন। প্ল্যাটফর্ম রিভিউ শেষ করলে আপনার অডিওবুক বিভিন্ন স্টোরে লাইভ হবে।

৮. মার্কেটিং: সোশ্যাল মিডিয়া, ইমেইল লিস্ট, ওয়েবসাইট, পডকাস্ট—যা যা আছে সব মিলিয়ে প্রচার চালান। কার্যকর মার্কেটিং বিক্রি ও রিভিউ, দুটোই বাড়াতে সাহায্য করে।

প্রত্যেক ধাপেই মনোযোগ দিন। মানসম্মত প্রোডাকশন, আকর্ষণীয় বর্ণনাকারী (মানুষ বা AI), আর পরিকল্পিত মার্কেটিং—এসবই একটি সফল অডিওবুকের মূল চাবিকাঠি।

শীর্ষ ৮টি AI অডিওবুক বর্ণনা সফটওয়্যার/অ্যাপ

  1. Speechify Voice Over: Speechify Voice Over একটি প্রিমিয়াম AI ভয়েস ওভার অ্যাপ, যেটিতে সহজেই আপনার লেখা প্রায় যেকোনো বইকে অডিওবুকে রূপান্তর করা যায়।
  2. Google Text-to-Speech: প্রাকৃতিক শোনায় এমন AI ভয়েস, বহু ভাষা সমর্থন ও ভয়েস কাস্টমাইজ করার সুবিধা দেয়।
  3. Amazon Polly: নানা ধরনের প্রাণবন্ত ভয়েস, অনেক ভাষা ও উচ্চারণ সমর্থন করে।
  4. IBM Watson Text to Speech: নানাবিধ কণ্ঠ, সূক্ষ্ম টিউনিং, আবেগ ও গুরুত্বের ওপর নিয়ন্ত্রণের সুবিধা আছে।
  5. Microsoft Azure Cognitive Services Speech Service: প্রাকৃতিক TTS ভয়েসসহ বেশ কিছু কাস্টমাইজ অপশন রয়েছে।
  6. Apple-এর Siri: উন্নতমানের AI ভয়েস এবং অ্যাপল ডিভাইসের সঙ্গে চমৎকার ইন্টিগ্রেশন সুবিধা দেয়।
  7. ReadSpeaker: মানসম্পন্ন TTS ভয়েস এবং বিস্তৃত কাস্টমাইজেশন অপশন রয়েছে।
  8. Descript: নিজের কণ্ঠের উপর ভিত্তি করে 'Overdub' ভয়েস তৈরি করা যায়।
  9. iSpeech: উন্নতমানের ভয়েস, বহু ভাষা এবং ভয়েস টোন/স্পিড কাস্টমাইজের সুযোগ দেয়।

সব মিলিয়ে, AI ভয়েসের উত্থান অডিওবুক দুনিয়ায় লেখকদের জন্য এক নতুন দিগন্ত খুলে দিয়েছে। উপন্যাস, নন-ফিকশন বই কিংবা পডকাস্ট—এসব টুল ব্যবহার করে খুব সহজে কাজের অডিও সংস্করণ তৈরি করে বিশ্বজুড়ে শ্রোতাদের কাছে পৌঁছে দিতে পারবেন।

অত্যাধুনিক AI কণ্ঠস্বর, সীমাহীন ফাইল আর ২৪/৭ সহায়তা উপভোগ করুন

বিনামূল্যে ব্যবহার করে দেখুন
tts banner for blog

এই নিবন্ধটি শেয়ার করুন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

ক্লিফ ওয়েইৎজম্যান ডিসলেক্সিয়ার পক্ষে সোচ্চার এবং Speechify-এর সিইও ও প্রতিষ্ঠাতা। Speechify হলো বিশ্বের #1 টেক্সট-টু-স্পিচ অ্যাপ, যার ১,০০,০০০+ ৫-তারকা রিভিউ এবং অ্যাপ স্টোরে সংবাদ ও ম্যাগাজিন শ্রেণিতে শীর্ষ স্থান। ২০১৭ সালে, ওয়েইৎজম্যান Forbes 30 Under 30-এ ছিলেন, ওয়েব আরও সহজলভ্য করতে তার অবদানের জন্য। ক্লিফ ওয়েইৎজম্যান EdSurge, Inc., PC Mag, Entrepreneur, Mashable-সহ নানা শীর্ষ মিডিয়ায় আলোচিত হয়েছেন।

speechify logo

স্পিচিফাই সম্পর্কে

#১ টেক্সট-টু-স্পিচ রিডার

স্পিচিফাই পৃথিবীর শীর্ষস্থানীয় টেক্সট-টু-স্পিচ প্ল্যাটফর্ম, যা ৫ কোটি+ ব্যবহারকারীর কাছে ভরসাযোগ্য এবং এর টেক্সট-টু-স্পিচ iOS, অ্যান্ড্রয়েড, ক্রোম এক্সটেনশন, ওয়েব অ্যাপ আর ম্যাক ডেস্কটপ অ্যাপসে ৫ লক্ষ+ ফাইভ-স্টার রিভিউ পেয়েছে। ২০২৫ সালে অ্যাপল স্পিচিফাই-কে মর্যাদাপূর্ণ অ্যাপল ডিজাইন অ্যাওয়ার্ড প্রদান করে WWDC-তে এবং একে বলে, “মানুষের জীবনে দারুণ সহায়ক একটি গুরুত্বপূর্ণ রিসোর্স।” স্পিচিফাই ৬০+ ভাষায় ১,০০০+ প্রাকৃতিক কণ্ঠ নিয়ে প্রায় ২০০ দেশে ব্যবহৃত হচ্ছে। সেলিব্রিটি কণ্ঠের মধ্যে রয়েছে স্নুপ ডগ আর গুইনেথ পেল্ট্রো। নির্মাতা ও ব্যবসার জন্য স্পিচিফাই স্টুডিও উন্নত সব টুল দেয়, যার মধ্যে রয়েছে AI ভয়েস জেনারেটর, AI ভয়েস ক্লোনিং, AI ডাবিং আর AI ভয়েস চেঞ্জার। স্পিচিফাই-এর উচ্চমানের এবং খরচ-সাশ্রয়ী টেক্সট-টু-স্পিচ API-এর মাধ্যমে অসংখ্য শীর্ষ পণ্য সম্ভব হয়েছে। দ্য ওয়াল স্ট্রিট জার্নাল, CNBC, Forbes, TechCrunch এবং অন্যান্য বড় সংবাদমাধ্যমে স্পিচিফাই নিয়ে প্রতিবেদন প্রকাশিত হয়েছে; এটি বিশ্বের সর্ববৃহৎ টেক্সট-টু-স্পিচ প্রদানকারী। আরও জানতে ভিজিট করুন speechify.com/news, speechify.com/blog এবং speechify.com/press