1. হোম
  2. API
  3. টেক্সট টু স্পিচ পাইথন: সম্পূর্ণ গাইড
প্রকাশের তারিখ API

টেক্সট টু স্পিচ পাইথন: সম্পূর্ণ গাইড

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

স্পিচিফাই API দেয় ৩০০ মিলিসেকেন্ড 
লেটেন্সি, প্রাকৃতিক মানের কণ্ঠস্বর
এবং ৫০+ ভাষা

apple logo২০২৫ অ্যাপল ডিজাইন অ্যাওয়ার্ড
৫ কোটি+ ব্যবহারকারী

পাইথনের টেক্সট টু স্পিচ (TTS) জগতে স্বাগতম! এই সম্পূর্ণ গাইডে পাইথনে টেক্সটকে স্পিচে রূপান্তর সম্পর্কে ধাপে ধাপে সবকিছু আলোচনা করা হবে। আপনি একদম নতুন হোন বা অভিজ্ঞ ডেভেলপার, এখানে আছে দরকারি টিপস, উদাহরণ ও বাস্তব ব্যবহার।

টেক্সট টু স্পিচ কী?

টেক্সট টু স্পিচ (TTS) প্রযুক্তি লিখিত লেখাকে কথায় রূপান্তর করে। নানা অ্যালগরিদম ও পাইথন লাইব্রেরির কারণে এখন এটি বেশ সহজ এবং শক্তিশালী।

পাইথন TTS দিয়ে শুরু করা

শুরু করতে আপনার কম্পিউটারে পাইথন থাকতে হবে। পাইথন ৩ ব্যবহার করুন, এতে উন্নত ফিচার ও সাপোর্ট আছে। অফিসিয়াল ওয়েবসাইট থেকে Windows, Linux বা অন্য যেকোনো OS-এ ডাউনলোড করুন।

পরিবেশ সেটআপ করুন

  • পাইথন ইনস্টল করুন ও কাজের পরিবেশ প্রস্তুত করুন।
  • কোনো IDE বা টেক্সট এডিটর বাছুন, যেমন Visual Studio Code বা PyCharm।

টেক্সট টু স্পিচের জন্য পাইথন লাইব্রেরি

TTS-এর জন্য পাইথনের বেশ কিছু লাইব্রেরি আছে, প্রতিটির ফিচার ও ব্যবহার আলাদা।

pyttsx3: একটি ক্রস-প্ল্যাটফর্ম লাইব্রেরি

  • pyttsx3 একটি পাইথন লাইব্রেরি, যা অফলাইনে চলে এবং বহু ভাষা ও ভয়েস সাপোর্ট করে (ইংরেজি, ফরাসি, জার্মান, হিন্দি)।
  • ইনস্টলেশন: pip install pyttsx3

মৌলিক ব্যবহার:

```python

import pyttsx3

engine = pyttsx3.init()

engine.say("Hello World")

engine.runAndWait()

```

gTTS: গুগল টেক্সট টু স্পিচ

  • gTTS (Google Text to Speech) একটি পাইথন লাইব্রেরি, যা গুগলের TTS API-র মাধ্যমে টেক্সটকে স্পিচে রূপান্তর করে।
  • এটির জন্য ইন্টারনেট সংযোগ লাগে এবং এটি বিভিন্ন ভাষা ও ডায়ালেক্ট সমর্থন করে।
  • ইনস্টলেশন: pip install gTTS

মৌলিক ব্যবহার:

```python

from gtts import gTTS

tts = gTTS('hello', lang='en')

tts.save('hello.mp3')

```

পাইথনে উন্নত TTS ফিচার

পাইথনের TTS লাইব্রেরিগুলোতে আরও কিছু উন্নত সুবিধা ও কনফিগারেশনের অপশন আছে।

স্পিচ রিকগনিশন ইন্টেগ্রেশন

  • ইন্টার্যাক্টিভ অ্যাপ তৈরি করতে TTS-এর সাথে স্পিচ রিকগনিশন যুক্ত করুন।
  • পাইথনের speech_recognition লাইব্রেরি ব্যবহার করে সম্পূর্ণ অডিও এক্সপিরিয়েন্স তৈরি করতে পারেন।

স্পিচ প্রোপার্টি কাস্টমাইজেশন

  • স্পিকিং রেট, ভলিউম ও ভয়েস pyttsx3 দিয়ে নিয়ন্ত্রণ করুন।
  • যেমন: ভয়েস ও রেট পরিবর্তন করে নিজের মতো সেট করুন।

স্পিচ অডিও ফাইলে সংরক্ষণ

স্পিচকে MP3 বা অন্য অডিও ফরম্যাটে সংরক্ষণ করুন, পরে শোনার জন্য হাতে রাখুন।

পাইথন TTS-এর বাস্তব প্রয়োগ

শুধু শেখার প্রজেক্ট না, বাস্তব জীবনের নানা কাজেও পাইথন TTS ব্যবহার করা যায়।

শিক্ষামূলক সফটওয়্যার

  • দৃষ্টি প্রতিবন্ধীদের জন্য সহায়ক টেকনোলজি।
  • ভাষা শেখার অ্যাপ।

অটোমেশন ও নোটিফিকেশন

  • কাস্টমার সার্ভিসে স্বয়ংক্রিয় ভয়েস রেসপন্স।
  • সফটওয়্যারে সিস্টেম নোটিফিকেশন ও অ্যালার্ট।

এই গাইডটি পাইথনের টেক্সট টু স্পিচে আপনার মজবুত ভিত্তি দেবে। আরও জানতে GitHub বা বিভিন্ন টিউটোরিয়াল সাইট ঘুরে দেখুন। শেখার সেরা উপায় অনুশীলন, তাই আজই নিজের প্রজেক্ট শুরু করে দেখুন!

Speechify টেক্সট টু স্পিচ ব্যবহার করুন

মূল্য: বিনামূল্যে ব্যবহার করে দেখুন

Speechify টেক্সট টু স্পিচ একটি আধুনিক টুল, যা লেখা পড়ার অভিজ্ঞতা বদলে দিয়েছে। আধুনিক TTS প্রযুক্তি দিয়ে Speechify লেখাকে স্বচ্ছন্দ, প্রাকৃতিক স্পিচে রূপান্তর করে—যারা পড়তে কষ্ট পান, দৃষ্টিপ্রতিবন্ধী বা শ্রবণশিক্ষা পছন্দ করেন, তাদের জন্য দারুণ সহায়ক। এর নমনীয়তা বিভিন্ন ডিভাইস ও প্ল্যাটফর্মে ব্যবহার সহজ করে, ফলে চলতে ফিরতেই শুনে ফেলা যায়।

Speechify-এর শীর্ষ ৫ TTS ফিচার:

উচ্চ-মানের ভয়েস: Speechify-এ নানা ভাষার lifelike, উচ্চমানের ভয়েস আছে। অভিজ্ঞতা স্বাভাবিক হওয়ায় শোনা আর বোঝা দুটোই সহজ হয়।

সহজ একত্রিকরণ: Speechify ওয়েব, স্মার্টফোনসহ নানা ডিভাইসে যুক্ত করা যায়। এতে ওয়েবসাইট, ইমেইল, PDF ইত্যাদি থেকে লেখা মুহূর্তে স্পিচে রূপান্তর করা যায়।

স্পিড কন্ট্রোল: ব্যবহারকারীরা স্পিচের গতি নিজেদের মতো সেট করতে পারেন—দ্রুত পড়া বা ধীরে মনোযোগ দিয়ে শোনার জন্য সুবিধাজনক।

অফলাইন শোনা: Speechify-এর বড় সুবিধা হলো, লেখাকে অডিও ফাইলে সেভ করে পরে অফলাইনে শোনা যায়, তাই ইন্টারনেট না থাকলেও সমস্যা নেই।

লেখা হাইলাইট: স্পিচ চলার সাথে সাথে সংশ্লিষ্ট লেখা অংশ হাইলাইট হয়, ফলে ব্যবহারকারী চোখে পড়ে আর কানে শুনে—দুইভাবে অনুসরণ করতে পারেন; এতে অনেকের পড়া আর মনে রাখার ক্ষমতা বাড়ে।

পাইথন টেক্সট টু স্পিচ FAQ

পাইথনে ফ্রি টেক্সট টু স্পিচ লাইব্রেরি কোনটি?

pyttsx3 এবং gTTS (Google Text to Speech) পাইথনের জনপ্রিয় ফ্রি TTS লাইব্রেরি। pyttsx3 অফলাইনে চলে, আর gTTS ইন্টারনেট ছাড়া কাজ করে না।

gTTS-এ ইন্টারনেট দরকার কি?

হ্যাঁ, gTTS (Google Text to Speech) টেক্সটকে স্পিচে রূপান্তরের জন্য গুগলের API ব্যবহার করে, তাই ইন্টারনেট সংযোগ প্রয়োজন।

gTTS কি পাইথন লাইব্রেরি?

হ্যাঁ, gTTS একটি পাইথন লাইব্রেরি, যা গুগলের টেক্সট টু স্পিচ সেবার ইন্টারফেস দেয় এবং পাইথন কোড থেকে সরাসরি টেক্সটকে স্পিচে রূপান্তরে সাহায্য করে।

pyttsx3 কি নিরাপদ?

হ্যাঁ, pyttsx3 সাধারণভাবে নিরাপদ ধরা হয়। এটি বহুল ব্যবহৃত একটি পাইথন TTS লাইব্রেরি, GitHub-এ পাবেন এবং ভালো কমিউনিটি সাপোর্টও আছে।

পাইথনে কীভাবে টেক্সট টু স্পিচ করবেন?

পাইথনে TTS করতে pyttsx3 বা gTTS ব্যবহার করতে পারেন। লাইব্রেরি ইমপোর্ট করে ইঞ্জিন ইনিশিয়ালাইজ করুন, এরপর say দিয়ে টেক্সট স্পিচে বদলান। উদাহরণ:

```python

import pyttsx3

engine = pyttsx3.init()

engine.say("Your text here")

engine.runAndWait()

```

স্পিচ সিন্থেসিস কী কাজ করে?

স্পিচ সিন্থেসিস মানুষের কণ্ঠ কৃত্রিমভাবে তৈরি করে। এটি লেখাকে কথায় রূপান্তর করে, বিভিন্ন অ্যালগরিদম ব্যবহার করে; ভয়েস, স্পিকিং রেট, ভাষা ইত্যাদি পরিবর্তনযোগ্য, যা TTS সিস্টেমে কাজে লাগে।

সেরা পাইথন TTS লাইব্রেরি কোনটি?

"সেরা" TTS লাইব্রেরি আসলে আপনার প্রয়োজনের ওপর নির্ভর করে। pyttsx3 অফলাইনে ও ক্রস-প্ল্যাটফর্মে ভালো কাজ করে, এবং বহু ভাষা (যেমন ইংরেজি, হিন্দি ইত্যাদি) সাপোর্ট করে। অন্যদিকে gTTS সহজে ব্যবহারযোগ্য, Google-এর উন্নত রিসোর্স ব্যবহার করে উচ্চমানের স্পিচ দেয়, তবে ইন্টারনেট লাগবে।

স্পিচিফাইয়ের জনপ্রিয় কণ্ঠ দ্রুত, স্কেলযোগ্য ও ডেভেলপার-বান্ধব API-র মাধ্যমে ব্যবহার করুন

API অ্যাক্সেস নিন
api access banner

এই নিবন্ধটি শেয়ার করুন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

ক্লিফ ওয়েইৎজম্যান ডিসলেক্সিয়ার পক্ষে সোচ্চার এবং Speechify-এর সিইও ও প্রতিষ্ঠাতা। Speechify হলো বিশ্বের #1 টেক্সট-টু-স্পিচ অ্যাপ, যার ১,০০,০০০+ ৫-তারকা রিভিউ এবং অ্যাপ স্টোরে সংবাদ ও ম্যাগাজিন শ্রেণিতে শীর্ষ স্থান। ২০১৭ সালে, ওয়েইৎজম্যান Forbes 30 Under 30-এ ছিলেন, ওয়েব আরও সহজলভ্য করতে তার অবদানের জন্য। ক্লিফ ওয়েইৎজম্যান EdSurge, Inc., PC Mag, Entrepreneur, Mashable-সহ নানা শীর্ষ মিডিয়ায় আলোচিত হয়েছেন।

speechify logo

স্পিচিফাই সম্পর্কে

#১ টেক্সট-টু-স্পিচ রিডার

স্পিচিফাই পৃথিবীর শীর্ষস্থানীয় টেক্সট-টু-স্পিচ প্ল্যাটফর্ম, যা ৫ কোটি+ ব্যবহারকারীর কাছে ভরসাযোগ্য এবং এর টেক্সট-টু-স্পিচ iOS, অ্যান্ড্রয়েড, ক্রোম এক্সটেনশন, ওয়েব অ্যাপ আর ম্যাক ডেস্কটপ অ্যাপসে ৫ লক্ষ+ ফাইভ-স্টার রিভিউ পেয়েছে। ২০২৫ সালে অ্যাপল স্পিচিফাই-কে মর্যাদাপূর্ণ অ্যাপল ডিজাইন অ্যাওয়ার্ড প্রদান করে WWDC-তে এবং একে বলে, “মানুষের জীবনে দারুণ সহায়ক একটি গুরুত্বপূর্ণ রিসোর্স।” স্পিচিফাই ৬০+ ভাষায় ১,০০০+ প্রাকৃতিক কণ্ঠ নিয়ে প্রায় ২০০ দেশে ব্যবহৃত হচ্ছে। সেলিব্রিটি কণ্ঠের মধ্যে রয়েছে স্নুপ ডগ আর গুইনেথ পেল্ট্রো। নির্মাতা ও ব্যবসার জন্য স্পিচিফাই স্টুডিও উন্নত সব টুল দেয়, যার মধ্যে রয়েছে AI ভয়েস জেনারেটর, AI ভয়েস ক্লোনিং, AI ডাবিং আর AI ভয়েস চেঞ্জার। স্পিচিফাই-এর উচ্চমানের এবং খরচ-সাশ্রয়ী টেক্সট-টু-স্পিচ API-এর মাধ্যমে অসংখ্য শীর্ষ পণ্য সম্ভব হয়েছে। দ্য ওয়াল স্ট্রিট জার্নাল, CNBC, Forbes, TechCrunch এবং অন্যান্য বড় সংবাদমাধ্যমে স্পিচিফাই নিয়ে প্রতিবেদন প্রকাশিত হয়েছে; এটি বিশ্বের সর্ববৃহৎ টেক্সট-টু-স্পিচ প্রদানকারী। আরও জানতে ভিজিট করুন speechify.com/news, speechify.com/blog এবং speechify.com/press