1. হোম
  2. অডিও ও ভিডিও ট্রান্সক্রিপশন
  3. গুগল ডক্সে অডিও কীভাবে ট্রান্সক্রাইব করবেন
প্রকাশের তারিখ অডিও ও ভিডিও ট্রান্সক্রিপশন

গুগল ডক্সে অডিও কীভাবে ট্রান্সক্রাইব করবেন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

#১ AI ভয়েসওভার জেনারেটর।
রিয়েল টাইমে মানুষের মতো মানের ভয়েসওভার
রেকর্ডিং তৈরি করুন।

apple logo২০২৫ অ্যাপল ডিজাইন অ্যাওয়ার্ড
৫ কোটি+ ব্যবহারকারী

আপনি যদি এমন কোনো প্রোগ্রাম খুঁজে থাকেন যা অডিও ট্রান্সক্রাইবে সাহায্য করবে, গুগল ডক্স ব্যবহার করতে পারেন। এটি গুগল ক্রোমে পাওয়া যায়, তবে অন্যান্য ব্রাউজার ও ডিভাইসেও কাজ করে। স্পিচ-টু-টেক্সটে সাহায্য করতে গুগল এই ট্রান্সক্রিপশন টুল দিয়েছে। নিচে বিস্তারিত জানুন এবং Speechify দিয়ে লেখা থেকে আবার শুনে দেখার সুযোগও ভেবে দেখতে পারেন।

ভয়েস টাইপিং কীভাবে কাজ করে

আপনি যদি অডিও ফাইল বা রেকর্ডিং থেকে ভাষণকে লিখিত টেক্সটে রূপান্তর করতে চান, তাহলে ক্রোম ব্রাউজারে ভয়েস টাইপিং ফিচার ব্যবহার করতে কিছু ধাপ অনুসরণ করুন। ধাপগুলো হলো:

ধাপ ১: নতুন ডকুমেন্ট খুলুন

ভয়েস টাইপিং প্রায় সব ব্রাউজারেই চলে, যেমন Microsoft Edge, তবে গুগল ক্রোমে সবচেয়ে ভালো ফল পাবেন। শুরুতে যদি জিমেইলে থাকেন, সেখান থেকে বেরিয়ে আসুন।

গুগল ডক্স বা গুগল ড্রাইভ থেকে নতুন ডকুমেন্ট খুলুন। উপরের মেনুতে ফাইল থেকে নতুন ডকুমেন্ট ওপেন অপশনটি বেছে নিন। অথবা ড্রাইভে স্ক্রিনে রাইট-ক্লিক করেও নতুন ডকুমেন্ট খুলতে পারেন।

ধাপ ২: মাইক্রোফোনে ক্লিক করুন বা চালু করুন

পরবর্তী ধাপ হলো মাইক্রোফোন আইকনটি নিয়ে আসা এবং চালু করা। আপনি টুলস-এ ক্লিক করে ভয়েস টাইপিং অপশন নিতে পারেন, বা স্ক্রিনে আইকন দেখলে সরাসরি তাতেই ক্লিক করুন।

ক্রোম এক্সটেনশন হলেও একই প্রক্রিয়া। মাইক্রোফোন চালু হলে আইকনটি লাল হয়ে যাবে। বন্ধ থাকলে এটি কালো মাইক্রোফোনসহ ধূসর দেখাবে। চালু থাকলে হবে লাল ব্যাকগ্রাউন্ডে সাদা মাইক্রোফোন।

ধাপ ৩: কথা বলা শুরু করুন

এখন মাইক্রোফোন চালু থাকলে আপনি কথা বলতে পারেন। কারসর যেখানে রাখবেন, সেখান থেকেই লেখা শুরু হবে। কারসর সরাতে পারেন, তবে স্ক্রিনে ক্লিক করলেই মাইক্রোফোন বন্ধ হবে। কিছু সময় পর নিষ্ক্রিয় থাকলে মাইক্রোফোন নিজে নিজেই বন্ধ হয়ে যাবে। ভেবে নিতে কয়েক সেকেন্ড থামতে পারেন, কিন্তু বেশি দেরি হলে মাইক্রোফোন অফ হয়ে যাবে।

ধাপ ৪: গুগল ডক্সের ভয়েস টাইপিং থেকে সর্বোচ্চ সুবিধা নিন

আপনি যদি গুগল ডক্সের ডিক্টেশন টুল পুরোটা কাজে লাগাতে চান, কিছু টিপস অনুসরণ করুন। যেমন:

  • স্পষ্ট ও ধীরে বলুন, ভুল কম হবে।
  • গুগল যদি আপনার কথা ঠিকমতো না বোঝে, বাহ্যিক মাইক্রোফোন ব্যবহার করে দেখুন।
  • সময় বাঁচাতে যতবার কমা, পিরিয়ড, প্রশ্নবোধক চিহ্ন দরকার হবে, মুখে এগুলোর নাম বলুন।
  • "নতুন লাইন" বা "নতুন প্যারাগ্রাফ" বলেও কমান্ড দিতে পারবেন।

নতুন গুগল ডক খুললে CTRL+SHIFT+S শর্টকাটে মাইক্রোফোন চালু করুন। এই টুলটি iOS ও অন্যান্য প্ল্যাটফর্মেও কাজ করে।

এই টিপসগুলো দিয়ে আপনি গুগল ওয়ার্কস্পেসে স্পিচ রেকগনিশন এবং ভয়েস টাইপিং সহজে ব্যবহার করতে পারবেন। আরও ভালোভাবে ব্যবহার করতে নিজের ব্রাউজারের জন্য আলাদা টিউটোরিয়াল দেখে নিন।

প্রায়শই জিজ্ঞাসিত প্রশ্ন

অনেকে জানতে চান গুগল ডক্স কীভাবে পড়ে শোনায়। সেই সাধারণ প্রশ্নগুলোর কয়েকটি হলো:

গুগল ডক্সে কি অডিও আছে?

হ্যাঁ, গুগল ডক্সে অডিও ফিচার আছে, আর এর সাহায্যে লেখা পড়ে শোনানো যায়। কেবল অ্যাপটি কীভাবে চালাতে হয়, তা শিখে নিন। আরও স্বাভাবিক ও সাবলীলভাবে পড়ে শোনার জন্য Speechify আপনাকে সাহায্য করবে, এতে অনেক অপশন আছে যা আপনার টেক্সট-টু-স্পিচ (TTS) অভিজ্ঞতা আরও উন্নত করে।

কীভাবে গুগল ডক্সে লেখার পাঠ শুনবেন? 

আপনি চাইলে এই অ্যাপ দিয়ে লেখা আপনাকে পড়ে শোনাতে পারেন। প্রথমে টুলস-এ যান। এরপর অ্যাক্সেসিবিলিটি সেটিংসে গিয়ে স্ক্রীন রিডার অপশন চালু করুন। তারপর ‘কল্যাবরেটর ঘোষণা’ অন করুন। হয়ে গেলে OK চাপুন। এরপর চাইলে পুরো ডকুমেন্ট বা নির্দিষ্ট অংশ বেছে শুনতে পারবেন। আপনি আপনার TTS নিয়ন্ত্রণ করতে পারবেন।

কীভাবে টেক্সট-টু-স্পিচ ব্যবহার করবেন? 

টেক্সট-টু-স্পিচ ব্যবহারের অন্যতম সেরা প্রোগ্রাম হলো Speechify। এটি ফ্রি ও প্রিমিয়াম ভার্সন—দুইভাবেই পাওয়া যায়, আর ডজন ডজন ভাষায় নানা কণ্ঠে টেক্সট পড়ে শোনাতে পারে। Speechify দিয়ে যে অংশ চান সেটি হাইলাইট করুন এবং যেকোনো সমর্থিত ভাষায় শুনুন, ফলে নতুন ভাষা শিখতে বা সময় বাঁচাতে পারবেন।

গুগল ডক্সের ভয়েস টাইপিং কি ফ্রি?

ভয়েস টাইপিং গুগল ডক্সের ডিক্টেশন টুল, আর এটি ফ্রি। ডক ওপেন থাকলে মাইক্রোফোনে ক্লিক করলেই ডিক্টেশন চালু হবে। অথবা CTRL+SHIFT+S চাপুন। যদিও কিছু প্রিমিয়াম টুলের তুলনায় এতে কিছু সীমাবদ্ধতা আছে, তবুও এটি অন্যতম সেরা ফ্রি অপশন।

১,০০০+ কণ্ঠ ও ১০০+ ভাষায় ভয়েসওভার, ডাবিং আর ক্লোন তৈরি করুন

বিনামূল্যে ব্যবহার করে দেখুন
studio banner faces

এই নিবন্ধটি শেয়ার করুন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

ক্লিফ ওয়েইৎজম্যান ডিসলেক্সিয়ার পক্ষে সোচ্চার এবং Speechify-এর সিইও ও প্রতিষ্ঠাতা। Speechify হলো বিশ্বের #1 টেক্সট-টু-স্পিচ অ্যাপ, যার ১,০০,০০০+ ৫-তারকা রিভিউ এবং অ্যাপ স্টোরে সংবাদ ও ম্যাগাজিন শ্রেণিতে শীর্ষ স্থান। ২০১৭ সালে, ওয়েইৎজম্যান Forbes 30 Under 30-এ ছিলেন, ওয়েব আরও সহজলভ্য করতে তার অবদানের জন্য। ক্লিফ ওয়েইৎজম্যান EdSurge, Inc., PC Mag, Entrepreneur, Mashable-সহ নানা শীর্ষ মিডিয়ায় আলোচিত হয়েছেন।

speechify logo

স্পিচিফাই সম্পর্কে

#১ টেক্সট-টু-স্পিচ রিডার

স্পিচিফাই পৃথিবীর শীর্ষস্থানীয় টেক্সট-টু-স্পিচ প্ল্যাটফর্ম, যা ৫ কোটি+ ব্যবহারকারীর কাছে ভরসাযোগ্য এবং এর টেক্সট-টু-স্পিচ iOS, অ্যান্ড্রয়েড, ক্রোম এক্সটেনশন, ওয়েব অ্যাপ আর ম্যাক ডেস্কটপ অ্যাপসে ৫ লক্ষ+ ফাইভ-স্টার রিভিউ পেয়েছে। ২০২৫ সালে অ্যাপল স্পিচিফাই-কে মর্যাদাপূর্ণ অ্যাপল ডিজাইন অ্যাওয়ার্ড প্রদান করে WWDC-তে এবং একে বলে, “মানুষের জীবনে দারুণ সহায়ক একটি গুরুত্বপূর্ণ রিসোর্স।” স্পিচিফাই ৬০+ ভাষায় ১,০০০+ প্রাকৃতিক কণ্ঠ নিয়ে প্রায় ২০০ দেশে ব্যবহৃত হচ্ছে। সেলিব্রিটি কণ্ঠের মধ্যে রয়েছে স্নুপ ডগ আর গুইনেথ পেল্ট্রো। নির্মাতা ও ব্যবসার জন্য স্পিচিফাই স্টুডিও উন্নত সব টুল দেয়, যার মধ্যে রয়েছে AI ভয়েস জেনারেটর, AI ভয়েস ক্লোনিং, AI ডাবিং আর AI ভয়েস চেঞ্জার। স্পিচিফাই-এর উচ্চমানের এবং খরচ-সাশ্রয়ী টেক্সট-টু-স্পিচ API-এর মাধ্যমে অসংখ্য শীর্ষ পণ্য সম্ভব হয়েছে। দ্য ওয়াল স্ট্রিট জার্নাল, CNBC, Forbes, TechCrunch এবং অন্যান্য বড় সংবাদমাধ্যমে স্পিচিফাই নিয়ে প্রতিবেদন প্রকাশিত হয়েছে; এটি বিশ্বের সর্ববৃহৎ টেক্সট-টু-স্পিচ প্রদানকারী। আরও জানতে ভিজিট করুন speechify.com/news, speechify.com/blog এবং speechify.com/press