1. হোম
  2. টিটিএস
  3. গুগল ডক্স-এ স্পিচ-টু-টেক্সট
প্রকাশের তারিখ টিটিএস

গুগল ডক্স-এ স্পিচ-টু-টেক্সট

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

apple logo২০২৫ অ্যাপল ডিজাইন অ্যাওয়ার্ড
৫ কোটি+ ব্যবহারকারী

আপনি যদি চান আপনার বলা কথা লেখায় পরিণত হোক, তাহলে গুগল ডক্স-এর ভয়েস টাইপিং ফিচার সেই স্বপ্ন সত্যি করতে পারে। আমি আপনাকে সহজ ভাষায় ধাপে ধাপে এই শক্তিশালী টুলটি কীভাবে ব্যবহার করবেন, তা দেখাবো।

গুগল ডক্স ভয়েস টাইপিং শুরু করা

প্রথমে, Chrome ব্রাউজারে গুগল ডক্স খুলুন। এই ফিচার Chrome-এ সবচেয়ে ভালো চলে—সেটি ব্যবহার করছেন কি না, নিশ্চিত হন।

  1. গুগল ডক্স খুলুন। গুগল অ্যাকাউন্ট না থাকলে আগে বানিয়ে নিন। তারপর লগইন করে একটি নতুন ডকুমেন্ট নিন।
  2. উপরে 'Tools' মেনুতে যান এবং 'Voice typing…' ক্লিক করুন। ডকের বাঁ পাশে একটি মাইক্রোফোন আইকন দেখা যাবে।
  3. মাইক্রোফোন আইকনে ক্লিক করে কথা বলা শুরু করুন। খেয়াল রাখুন, আপনার মাইক্রোফোন যেন চালু ও ঠিকমতো কাজ করে।
  4. আপনার পছন্দের ভাষায় স্পষ্ট করে বলুন। গুগল ভয়েস টাইপিং ইংরেজি, ফরাসি, স্প্যানিশ সহ অনেক ভাষা সাপোর্ট করে। কথা বলার সাথে সাথেই তা লেখায় বদলে দেবে।

ভয়েস কমান্ড ব্যবহার করুন

গুগল ডক্স-এর ভয়েস টাইপিং শুধু কথা লিখে দেয় না, ডকুমেন্ট ফরম্যাট করতেও ভয়েস কমান্ড শোনে। নিচে কিছু দরকারি কমান্ড দেওয়া হলো:

  • New line: কার্সরকে নতুন লাইনে নেয়।
  • New paragraph: নতুন প্যারাগ্রাফ শুরু করে।
  • Comma, period, question mark: সংশ্লিষ্ট যতিচিহ্ন বসায়।
  • Bold, italics, underline: নির্বাচিত লেখায় ওই ফরম্যাট প্রয়োগ করে।
  • Select paragraph: বর্তমান প্যারাগ্রাফ সিলেক্ট করে।
  • Go to end of line: কার্সরকে বর্তমান লাইনের শেষে নিয়ে যায়।

চাইলেই আপনি "right-click" বললে কনটেক্সট মেনু আসবে, আর "ctrl+shift+s" প্রেস করে অতিরিক্ত স্পিচ-টু-টেক্সট অপশন দেখতে পারেন।

বিভিন্ন ডিভাইসে ভয়েস টাইপিং

উইন্ডোজ এবং ম্যাক-এ

Chrome ব্রাউজার ব্যবহার করলে Windows আর Mac—দুই প্ল্যাটফর্মেই ভয়েস টাইপিং একইভাবে চলে। নিয়ম এক: Google Docs খুলুন, ভয়েস টাইপিং অন করুন, তারপর বলুন।

অ্যান্ড্রয়েড-এ

অ্যান্ড্রয়েড ডিভাইসে Google Drive অ্যাপ দিয়ে Google Docs খুলুন। ডকুমেন্ট এডিট করতে ট্যাপ করুন এবং কিবোর্ডের ইন-বিল্ট ভয়েস টাইপিং অপশন ব্যবহার করুন।

ভালো ট্রান্সক্রিপশনের টিপস

উচ্চ মানের ট্রান্সক্রিপশনের জন্য:

  • পরিষ্কার ও একটু ধীরে বলুন।
  • ভালো মানের মাইক্রোফোন ব্যবহার করুন।
  • আশেপাশের অপ্রয়োজনীয় শব্দ এড়িয়ে চলুন।

ভয়েস কমান্ড দিয়ে ফরম্যাটিং

গুগল ডক্স-এর ভয়েস টাইপিং-এর বড় সুবিধা হলো, এটি ফরম্যাটিং কমান্ডও বুঝতে পারে। যেমন:

  • "comma" বলুন, কমা দিতে।
  • "new paragraph" বলুন, নতুন প্যারাগ্রাফ শুরু করতে।
  • যে শব্দ আন্ডারলাইন করতে চান, তার আগে ও পরে "underline" বলুন।

এই ফিচার কাজ অনেক সহজ করে—আপনি শুধু লেখা নয়, ফরম্যাটও মুখে বলে নির্ধারণ করতে পারবেন, ফলে সময়ও বাঁচবে।

সেরা ৫টি স্পিচ-টু-টেক্সট অ্যাপ

  1. Google Docs Voice Typing: গুগল ডক্স-এ ইন্টিগ্রেটেড speech recognition ফিচার আছে। Tools-এ গিয়ে dropdown menu থেকে Voice Typing বেছে নিয়ে dictation শুরু করলে খুব সহজে কথাকে লেখায় বদলে ফেলা যায়।
  2. Microsoft Dictate: Microsoft Dictate Office-এ অ্যাড-অন হিসেবে voice recognition টেকনোলজি ব্যবহার করে বলা শব্দকে টেক্সটে রূপান্তর করে। Word, Outlook, PowerPoint-এ চলে, dictation অনেক সহজ করে দেয়।
  3. Otter.ai: Otter.ai রিয়েল-টাইম speech recognition ও ট্রান্সক্রিপশন দেয়। মিটিং, লেকচার, নোটে উচ্চ নির্ভুলতা এবং Google Slides-এ লাইভ ক্যাপশন ইন্টিগ্রেশনের সুবিধা দেয়।
  4. Dragon Anywhere: Nuance-এর Dragon Anywhere মোবাইলে প্রফেশনাল গ্রেড speech recognition অফার করে। এতে দীর্ঘ dictation ও ভয়েস কমান্ডে টেক্সট ফরম্যাট করা যায়, যা Canada সহ প্রায় যেকোনো জায়গায় ব্যবহার করা যায়।
  5. Speechnotes: Speechnotes সহজ speech-to-text অ্যাপ, যা নির্ভুল dictationvoice recognition দেয়। সহজে pop-up বা dropdown menu থেকে ট্রান্সক্রিপশন আর নোট নেওয়া যায়।

এই অ্যাপগুলো উন্নত speech recognition টেকনোলজি ব্যবহার করে dictationকে অনেক সহজ করে, আপনি Google Slides, Microsoft অথবা অন্য যেকোনো প্ল্যাটফর্মেই থাকুন না কেন।

Speechify Speech API

Speechify-এর Text to Speech API একটি শক্তিশালী টুল, যা লিখিত টেক্সটকে কণ্ঠে পড়ে শোনাতে পারে এবং নানা অ্যাপে অ্যাক্সেসিবিলিটি বাড়ায়। উন্নত স্পিচ সিন্থেসিস টেকনোলজি দিয়ে প্রাকৃতিক টোনে বহু ভাষায় ভয়েস জেনারেট করে, ডেভেলপারদের অ্যাপ, ওয়েবসাইট ও ই-লার্নিংয়ে অডিও রিডিং যোগ করতে দারুণ উপযোগী।

সহজ API স্ট্রাকচার দিয়ে Speechify দ্রুত ইন্টিগ্রেশন আর কাস্টমাইজেশন সম্ভব করে, যেমন দৃষ্টিপ্রতিবন্ধীদের জন্য রিডিং এইড বা ইন্টারেক্টিভ ভয়েস রেসপন্স সিস্টেম বানাতে।

সমস্যা সমাধান

যদি ভয়েস টাইপিং কাজ না করে:

  • মাইক্রোফোন সেটিংস পরীক্ষা করুন: Chrome-এ সঠিকভাবে মাইক্রোফোন কানেক্ট ও সক্রিয় আছে কি না, দেখে নিন।
  • ব্রাউজার ক্যাশ ক্লিয়ার করুন: অনেক সময় ক্যাশ ক্লিয়ার করলেই ছোটখাটো সমস্যা ঠিক হয়ে যায়।
  • Chrome আপডেট করুন: সর্বশেষ ভার্সন ব্যবহার করছেন কি না, নিশ্চিত হন।

গুগল ডক্স-এর ভয়েস টাইপিং ফিচার দ্রুত ও যথেষ্ট নির্ভুলভাবে কথা ট্রান্সক্রাইব করে আপনার উৎপাদনশীলতা বাড়াতে পারে। ব্যক্তিগত, অফিস বা পড়াশোনার কাজে—এই ফিচারটি একেবারেই বহুমুখী আর ব্যবহারেও খুব সহজ। ভয়েস কমান্ড কাজে লাগালে গতি আরও বেড়ে যায়।

একবার ট্রাই করে দেখুন, ডকুমেন্ট তৈরি কতটা ঝামেলামুক্ত হয়। আপনি Windows, Mac বা Android—যাই ব্যবহার করুন না কেন, গুগল ডক্স ভয়েস টাইপিং স্পিচ-টু-টেক্সট-এর জন্য এক দুর্দান্ত অপশন।

অত্যাধুনিক AI কণ্ঠস্বর, সীমাহীন ফাইল আর ২৪/৭ সহায়তা উপভোগ করুন

বিনামূল্যে ব্যবহার করে দেখুন
tts banner for blog

এই নিবন্ধটি শেয়ার করুন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

ক্লিফ ওয়েইৎজম্যান ডিসলেক্সিয়ার পক্ষে সোচ্চার এবং Speechify-এর সিইও ও প্রতিষ্ঠাতা। Speechify হলো বিশ্বের #1 টেক্সট-টু-স্পিচ অ্যাপ, যার ১,০০,০০০+ ৫-তারকা রিভিউ এবং অ্যাপ স্টোরে সংবাদ ও ম্যাগাজিন শ্রেণিতে শীর্ষ স্থান। ২০১৭ সালে, ওয়েইৎজম্যান Forbes 30 Under 30-এ ছিলেন, ওয়েব আরও সহজলভ্য করতে তার অবদানের জন্য। ক্লিফ ওয়েইৎজম্যান EdSurge, Inc., PC Mag, Entrepreneur, Mashable-সহ নানা শীর্ষ মিডিয়ায় আলোচিত হয়েছেন।

speechify logo

স্পিচিফাই সম্পর্কে

#১ টেক্সট-টু-স্পিচ রিডার

স্পিচিফাই পৃথিবীর শীর্ষস্থানীয় টেক্সট-টু-স্পিচ প্ল্যাটফর্ম, যা ৫ কোটি+ ব্যবহারকারীর কাছে ভরসাযোগ্য এবং এর টেক্সট-টু-স্পিচ iOS, অ্যান্ড্রয়েড, ক্রোম এক্সটেনশন, ওয়েব অ্যাপ আর ম্যাক ডেস্কটপ অ্যাপসে ৫ লক্ষ+ ফাইভ-স্টার রিভিউ পেয়েছে। ২০২৫ সালে অ্যাপল স্পিচিফাই-কে মর্যাদাপূর্ণ অ্যাপল ডিজাইন অ্যাওয়ার্ড প্রদান করে WWDC-তে এবং একে বলে, “মানুষের জীবনে দারুণ সহায়ক একটি গুরুত্বপূর্ণ রিসোর্স।” স্পিচিফাই ৬০+ ভাষায় ১,০০০+ প্রাকৃতিক কণ্ঠ নিয়ে প্রায় ২০০ দেশে ব্যবহৃত হচ্ছে। সেলিব্রিটি কণ্ঠের মধ্যে রয়েছে স্নুপ ডগ আর গুইনেথ পেল্ট্রো। নির্মাতা ও ব্যবসার জন্য স্পিচিফাই স্টুডিও উন্নত সব টুল দেয়, যার মধ্যে রয়েছে AI ভয়েস জেনারেটর, AI ভয়েস ক্লোনিং, AI ডাবিং আর AI ভয়েস চেঞ্জার। স্পিচিফাই-এর উচ্চমানের এবং খরচ-সাশ্রয়ী টেক্সট-টু-স্পিচ API-এর মাধ্যমে অসংখ্য শীর্ষ পণ্য সম্ভব হয়েছে। দ্য ওয়াল স্ট্রিট জার্নাল, CNBC, Forbes, TechCrunch এবং অন্যান্য বড় সংবাদমাধ্যমে স্পিচিফাই নিয়ে প্রতিবেদন প্রকাশিত হয়েছে; এটি বিশ্বের সর্ববৃহৎ টেক্সট-টু-স্পিচ প্রদানকারী। আরও জানতে ভিজিট করুন speechify.com/news, speechify.com/blog এবং speechify.com/press