1. হোম
  2. API
  3. Speechify টেক্সট-টু-স্পিচ API কীভাবে SSML সাপোর্ট করে
প্রকাশের তারিখ API

Speechify টেক্সট-টু-স্পিচ API কীভাবে SSML সাপোর্ট করে

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

স্পিচিফাই API দেয় ৩০০ মিলিসেকেন্ড 
লেটেন্সি, প্রাকৃতিক মানের কণ্ঠস্বর
এবং ৫০+ ভাষা

apple logo২০২৫ অ্যাপল ডিজাইন অ্যাওয়ার্ড
৫ কোটি+ ব্যবহারকারী

Speechify টেক্সট-টু-স্পিচ (TTS) API কাস্টমাইজযোগ্য স্পিচ টেকনোলজির অন্যতম অগ্রগামী সমাধান, যা শক্তিশালী Speech Synthesis Markup Language (SSML) সাপোর্ট দেয়। এই উন্নত ফিচার দিয়ে ডেভেলপাররা সরাসরি কোড থেকেই স্পিচের টোন, ছন্দ আর আবেগ খুব স্বচ্ছন্দে নিয়ন্ত্রণ করতে পারেন। এখানে দেখানো হচ্ছে, কীভাবে Speechify টেক্সট-টু-স্পিচ API, SSML ব্যবহার করে সাধারণ টেক্সটকে প্রাণবন্ত, প্রাঞ্জল voice আউটপুটে বদলে দেয়, ফলে নানান খাতে আরও স্বাভাবিক ও আকর্ষণীয় ইউজার এক্সপেরিয়েন্স তৈরি করা যায়।

Speechify-এর টেক্সট-টু-স্পিচ API এক নজরে

Speechify টেক্সট-টু-স্পিচ API এমন একটি শক্তিশালী টুল, যা লিখিত টেক্সটকে স্বাভাবিক কথায় রূপ দেয়। উন্নত নিউরাল নেটওয়ার্ক আর মেশিন লার্নিং প্রযুক্তি ব্যবহার করে এটি প্রায় মানুষে মানুষে কথোপকথনের মতো স্পিচ তৈরি করতে পারে। ডজনেরও বেশি ভাষা ও ডায়ালেক্ট সাপোর্ট, পুরুষ ও মহিলা উভয় কণ্ঠে ভয়েস বেছে নেওয়ার সুবিধা—কোনো অ্যাপ, ওয়েবসাইট বা ইন্টারেক্টিভ সার্ভিসে ইউনিক এক্সপেরিয়েন্স যোগ করতে চাইলে ডেভেলপারদের জন্য এটি দারুণ আর সহজলভ্য সমাধান।

SSML কী?

Speech Synthesis Markup Language (SSML) একটি XML-ভিত্তিক মার্কআপ ল্যাঙ্গুয়েজ, যার সাহায্যে ডেভেলপাররা নির্ধারণ করেন টেক্সট-টু-স্পিচ সিস্টেমে লেখা কীভাবে পড়া হবে। SSML দিয়ে বক্তৃতার পিচ, গতি, ভলিউম, উচ্চারণ ইত্যাদি পছন্দমতো সেট করা যায়। এতে স্পিচ আরও মানবসদৃশ, স্পষ্ট আর সাবলীল শোনায়, যা শিক্ষামূলক কনটেন্ট, ইন্টারেক্টিভ সিস্টেম বা গল্প বলার মতো কাজে বিশেষভাবে জরুরি।

টেক্সট-টু-স্পিচ-এ SSML-এর ভূমিকা

SSML যোগ হওয়ার ফলে টেক্সট-টু-স্পিচ প্রযুক্তি অনেকটাই এগিয়ে গেছে; এখন বক্তৃতার সূক্ষ্ম দিকগুলোও নিয়ন্ত্রণ করা যায়—যা পুরনো টেক্সট-টু-স্পিচ সিস্টেমে ছিল না। এতে সংলাপ আরও স্বাভাবিক, প্রেক্ষিতভিত্তিক আর গতিময় করা যায়—মাঝে বিরতি, নাটকীয়তা, খুব দ্রুত বা ধীরে কথা বলার মতো নানা এফেক্ট যোগ করা সম্ভব। এই উন্নতি মানব কণ্ঠ আর মেশিন ভয়েসের ব্যবধান কমিয়ে এনেছে এবং ডিজিটাল ইন্টারঅ্যাকশনকে অনেক বেশি বোধ্য, কথোপকথনসুলভ করে তুলেছে।

Speechify SSML সাপোর্ট করে কীভাবে?

Speechify টেক্সট-টু-স্পিচ API উন্নত অডিও এক্সপেরিয়েন্স দেওয়ার লক্ষ্যে তৈরি। SSML ইন্টিগ্রেশন থাকায় টেক্সট-টু-স্পিচ আরও সূক্ষ্মভাবে টিউন করে রূপান্তর করা যায়। SSML ব্যবহার করে ডেভেলপাররা চাইলে টোন–স্ট্রেসসহ শব্দের ধরণ নিয়ন্ত্রণ করে স্পিচে আবেগ আর উদ্দেশ্য আরও পরিষ্কারভাবে তুলে ধরতে পারেন। Speechify টেক্সট-টু-স্পিচ API-এর SSML সাপোর্ট ইউজারকে আরও নিখুঁত, প্রসঙ্গভিত্তিক অডিও অভিজ্ঞতা শোনাতে সাহায্য করে।

Speechify-এ SSML ব্যবহারের উপকারিতা

SSML Speechify টেক্সট-টু-স্পিচ API-এর সঙ্গে ব্যবহার করলে নিচের সুবিধাগুলো মেলে: 

  • কাস্টমাইজেশন: SSML স্পিচ আউটপুট পুরোপুরি অ্যাপ বা ব্যবহারের প্রেক্ষিতে ঢেলে সাজাতে দেয়, ফলে ইউজার এক্সপেরিয়েন্স আরও ব্যক্তিগত হয়ে যায়।
  • ইউজার ইনভলভমেন্ট: SSML নিশ্চিত করে স্পষ্ট, প্রাণবন্ত কণ্ঠস্বর, যা শুনতে আরামদায়ক ও মনোযোগ ধরে রাখে।
  • প্রবেশগম্যতা বৃদ্ধি: SSMLটেক্সট-টু-স্পিচ প্রযুক্তি কনটেন্টকে সবার জন্য, বিশেষত প্রতিবন্ধী ইউজারদের জন্য, আরও ব্যবহারবান্ধব করে তোলে।
  • কার্যকারিতার উন্নতি: যেখানে কথা বলার গুণমান ও স্পষ্টতা খুব জরুরি, সেখানে SSML যোগাযোগকে আরও ফলপ্রসূ ও লক্ষ্যমুখী করে।

Speechify টেক্সট-টু-স্পিচ API-এর SSML এর মৌলিক ধারণা 

Speechify টেক্সট-টু-স্পিচ API শক্তিশালী Speech Synthesis Markup Language ব্যবহার করে স্পিচ আউটপুটকে আরও নিয়ন্ত্রিত ও মানুষ-সদৃশ করে তোলে। এই SSML ক্ষমতাগুলো ভালোভাবে কাজে লাগাতে পারলে আপনার টেক্সট-টু-স্পিচ অ্যাপ্লিকেশন আরও প্রাঞ্জল ও কার্যকর হবে। অ্যাক্সেসিবিলিটি, বিনোদন বা শিক্ষার যে কোনো ক্ষেত্রেই SSML দিয়ে আরও বাস্তবসম্মত ডিজিটাল ভয়েস তৈরি করা যায়। কিছু মৌলিক ধারণা:

SSML-এ এস্কেপড ক্যারেক্টার

SSML কোড যেন parser ঠিকভাবে পড়তে পারে, সে জন্য টেক্সটে থাকা কিছু বিশেষ ক্যারেক্টার এস্কেপ করা জরুরি। এতে সেগুলো মার্কআপ ট্যাগ হিসেবে ভুল ব্যাখ্যা হবে না। নিচে মূল ক্যারেক্টার আর এদের এস্কেপড রূপ দেওয়া হলো:

  • Ampersand (&) হবে &
  • Greater-than (>) হবে >
  • Less-than (<) হবে &lt;
  • Double quote (") হবে &quot;
  • Apostrophe (') হবে &apos;

উদাহরণ: বিশেষ ক্যারেক্টারসহ কোনো লাইন পরিবর্তন:

const escapeSSMLChars = (text: string) =>

  text

    .replaceAll('&', '&amp;')

    .replaceAll('<', '&lt;')

    .replaceAll('>', '&gt;')

    .replaceAll('"', '&quot;')

    .replaceAll('\'', '&apos;')

উদাহরণ: Some "text" with 5 < 6 & 4 > 8 লিখলে: <speak>Some &quot;text&quot; with 5 &lt; 6 &amp; 4 &gt; 8 in it</speak>

স্পিচের এক্সপ্রেশন

SSML দিয়ে পিচ, স্পিড আর ভলিউম কন্ট্রোল করা যায়—ফলে শোনার অভিজ্ঞতা আরও সমৃদ্ধ হয়:

  1. পিচ: অতিরিক্ত নিচু (x-low) থেকে অতিরিক্ত উঁচু (x-high) পর্যন্ত, বা শতাংশ নির্ভর ভ্যালু দিয়ে কণ্ঠের উচ্চতা বদলানো যায়।
  2. স্পিড: এক্সট্রা স্লো থেকে এক্সট্রা ফাস্ট, কিংবা নির্দিষ্ট শতাংশে স্পিড সেট করা যায়।
  3. ভলিউম: প্রায় নীরব থেকে অতিরিক্ত জোরালো (x-loud) পর্যন্ত, বা ডেসিবেল/পার্সেন্টেজে কনটেক্সট অনুযায়ী সেট করা যায়।

উদাহরণ:

<speak>

    এটি সাধারণ স্পিচ প্যাটার্ন।

    <prosody pitch="high" rate="fast" volume="+20%">

        আমি এখন বেশি পিচে, দ্রুত আর জোরে কথা বলছি!

    </prosody>

    আবার সাধারণ স্টাইলে ফিরে এলাম।

</speak>

স্পিচ বিরতি ও জোর

SSML-এর <break> আর <emphasis> ট্যাগ বক্তৃতাকে আরও প্রাকৃতিক ও প্রাণবন্ত করতে দারুণ কাজে লাগে:

  • Break: নির্দিষ্ট "strength" বা সময় ধরে বিরতি দিন, যাতে মূল কথাগুলো বেশি করে চোখে পড়ে বা অংশগুলো আলাদা করে বোঝা যায়।
  • Emphasis: নির্দিষ্ট শব্দে বাড়তি জোর দিয়ে আবেগ বা গুরুত্ব স্পষ্ট করুন, শ্রোতাকে আরও ভালোভাবে ধরে রাখুন।

<speak>

    কখনও শেষের বাক্যে একটু বেশি বিরতি রাখা বেশ কাজে দেয়।

    <break strength="medium" />

    বা <break time="100ms" /> মাঝেমাঝে <break time="1s" /> কথার ফাঁকে ব্যবহার করতে পারেন।

</speak>

উন্নত স্পিচ কন্ট্রোল

Speechify-এর নিজস্ব <speechify:style> ট্যাগ দিয়ে বক্তৃতার আবেগ বা ছন্দ বদলে স্পিচকে আরও সম্পর্কিত, বাস্তবসম্মত আর প্রভাবশালী করা যায়।

উদাহরণ:

<speak>

    <speechify:style emotion="angry" cadence="fast">

        কতবার তুমি আমাকে এটা জিজ্ঞেস করতে পারো?

    </speechify:style>

</speak>

Speechify-তে SSML ব্যবহার

ডেভেলপাররা Speechify API-তে SSML যোগ করতে পারেন এভাবে:

  1. এনভায়রনমেন্ট সেটআপ: ডেভেলপমেন্ট এনভায়রনমেন্টে HTTP রিকোয়েস্ট সাপোর্ট নিশ্চিত করুন।
  2. API অথেন্টিকেশন: Speechify থেকে API কী নিয়ে রিকোয়েস্ট হেডারে যোগ করুন।
  3. SSML কনটেন্ট তৈরি: অ্যাপ্লিকেশনের নির্দিষ্ট ভয়েস ও স্টাইল অনুযায়ী SSML স্ক্রিপ্ট লিখুন।
  4. API রিকোয়েস্ট: SSML স্ক্রিপ্ট POST রিকোয়েস্টে পাঠিয়ে Speechify API কল করুন।
  5. Response প্রসেস: অডিও আউটপুট গ্রহণ করে যাচাই করুন, আপনার অ্যাপের মান বজায় রাখুন।

Speechify টেক্সট-টু-স্পিচ API-র SSML ব্যবহার ক্ষেত্র

Speechify টেক্সট-টু-স্পিচ API-এর SSML সাপোর্ট একে আলাদা করে তোলে, কারণ এটি একঘেয়ে বক্তৃতাকে নির্দিষ্ট প্রসঙ্গ আর প্রয়োজন অনুযায়ী রূপ বদলে দেয়। এবার দেখে নিন কীভাবে SSML Speechify API-তে বিভিন্ন কাজে ব্যবহার হয়:

  1. প্রবেশগম্যতা: SSML ভিজ্যুয়াল প্রতিবন্ধকতা বা পড়তে কষ্ট হয় এমন ইউজারদের জন্য প্রযুক্তি ব্যবহার আরও সহজ করে তোলে।
  2. ই-লার্নিং প্ল্যাটফর্ম: SSML পাঠ্যবস্তুর ভেতরে টোন ও ইমফ্যাসিস যোগ করে ছাত্রদের মনোযোগ ধরে রাখতে সাহায্য করে।
  3. ভার্চুয়াল অ্যাসিস্ট্যান্ট: SSML ভার্চুয়াল কথোপকথনকে আরও মানবসদৃশ করে, ইউজার স্যাটিসফ্যাকশন বাড়ায়।
  4. অডিওবুক: SSML আলাদা কণ্ঠ আর আবেগ যোগ করে গল্পকে যেন জীবন্ত করে তোলে।
  5. কাস্টমার সার্ভিস বট: SSML সুস্পষ্ট, আরামদায়ক ভয়েসে তথ্য পৌঁছে দিয়ে সেবার মান বাড়ায়।
  6. ভাষা শেখার টুল: SSML উচ্চারণ স্পষ্ট করে, শুনে অনুশীলন করা সহজ হয়।
  7. পাবলিক ঘোষণা: SSML তথ্য আরও স্পষ্ট, গুছিয়ে ও কার্যকরভাবে উপস্থাপন করতে সহায়তা করে।
  8. ভিডিও গেম: SSML ডায়ালগে নাটকীয়তা ও প্রাণ যোগ করে।
  9. পডকাস্ট: SSML বিভিন্ন ধরনের প্রাণবন্ত অডিও কনটেন্ট বানানো সহজ করে।
  10. হেলথকেয়ার: SSML রোগীর সঙ্গে শান্ত, আশ্বাসব্যঞ্জক ভয়েসে তথ্য ভাগ করে নিতে সাহায্য করে।
  11. নেভিগেশন সিস্টেম: SSML স্পষ্ট ও জরুরি দিকনির্দেশে বাড়তি জোর দিতে পারে।
  12. টেলিফোনি: SSML আইভিআর সিস্টেমে আরও প্রাকৃতিক, কম রোবোটিক ভয়েস দেয়।
  13. মাল্টিমিডিয়া উপস্থাপনা: SSML পেশাদার ধারাভাষ্যের মান অনেকটাই বাড়িয়ে দেয়।
  14. স্মার্ট হোম ডিভাইস: SSML আরও দ্রুত, স্বজ্ঞাত ভয়েস ইন্টারঅ্যাকশন গড়ে তুলতে সাহায্য করে।

ডেভেলপারদের জন্য সেরা SSML অভ্যাস 

আপনি ইন্টারঅ্যাক্টিভ ভয়েস রেসপন্স, অডিওবুক বা ভার্চুয়াল অ্যাসিস্ট্যান্ট–যাই বানান না কেন, SSML ঠিকভাবে কাজে লাগাতে পারলে আপনার স্পিচ সিন্থেসিসের মান অনেক বেড়ে যাবে। কিছু টিপস:

  • বিভিন্ন SSML ট্যাগ আর সেটিং নিয়ে পরীক্ষা করুন, কোন কম্বিনেশন সবচেয়ে ভালো শোনায় তা খুঁজে নিন।
  • ইউজার ফিডব্যাকের ভিত্তিতে নিয়মিত SSML স্ক্রিপ্ট আপডেট ও উন্নত করুন।
  • SSML ট্যাগগুলো যেন সঠিকভাবে নেস্টেড থাকে এবং XML মান মেনে চলে, তা নিশ্চিত করুন; না হলে প্রসেসিং এরর হতে পারে।

উপসংহার

SSML-এর সূক্ষ্ম নিয়ন্ত্রণ Speechify-তে থাকার ফলে ডেভেলপাররা আরও প্রাণবন্ত, স্বাভাবিক আর মানবসদৃশ স্পিচ এক্সপেরিয়েন্স বানাতে পারেন। পিচ, স্পিড, ভলিউম, কিংবা আবেগ ও ছন্দের নিয়ন্ত্রণ—সবই হাতের মুঠোয়। Speechify-এর SSML সাপোর্ট আর শক্তিশালী TTS প্রযুক্তি মিলিয়ে ভয়েস-এনাবল্ড অ্যাপ্লিকেশনের সুযোগ ও প্রবেশগম্যতা দুই-ই বাড়ায়—ডিজিটাল কমিউনিকেশনকে আরও সহজ, অন্তর্ভুক্তিমূলক আর উদ্ভাবনী করে তোলে।

FAQ

Speechify টেক্সট-টু-স্পিচ API কি SSML সাপোর্ট করে?

হ্যাঁ, Speechify টেক্সট-টু-স্পিচ API সম্পূর্ণভাবে Speech Synthesis Markup Language (SSML) সাপোর্ট করে, যাতে স্পিচ আরও প্রাণবন্ত, স্বাভাবিক আর কাস্টমাইজযোগ্য হয়।

SSML কি বোঝায়? 

SSML হলো Speech Synthesis Markup Language; এই মার্কআপ ল্যাঙ্গুয়েজ ডেভেলপারদের স্পিচের পিচ, স্পিড আর টোন নিয়ন্ত্রণ করতে দেয়।

SSML টেক্সট-টু-স্পিচে কীভাবে উপকারে আসে? 

SSML টেক্সট-টু-স্পিচ-এ খুব সূক্ষ্ম নিয়ন্ত্রণ দেয়, যাতে স্পিচ আরও মানুষের মতো শোনায় এবং প্রেক্ষিত/ইউজারের প্রয়োজন অনুযায়ী মানিয়ে নেওয়া যায়।

SSML এর গুরুত্ব কী? 

SSML স্পিচে সূক্ষ্ম নিয়ন্ত্রণের সুযোগ দেয়, ফলে কথাবার্তা আরও স্পষ্ট, আকর্ষণীয় আর কার্যকর হয়—বিভিন্ন ধরনের অ্যাপ্লিকেশনের জন্য এটা প্রায় অপরিহার্য।

Speechify টেক্সট-টু-স্পিচ API-র SSML কোথায় শিখতে পারি?

Speechify টেক্সট-টু-স্পিচ API-র SSML ফিচার আর ইমপ্লিমেন্টেশন জানতে Speechify-এর অফিসিয়াল API ডকুমেন্টেশন ও ওয়েবসাইট ভিজিট করুন।

স্পিচিফাইয়ের জনপ্রিয় কণ্ঠ দ্রুত, স্কেলযোগ্য ও ডেভেলপার-বান্ধব API-র মাধ্যমে ব্যবহার করুন

API অ্যাক্সেস নিন
api access banner

এই নিবন্ধটি শেয়ার করুন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

ক্লিফ ওয়েইৎজম্যান ডিসলেক্সিয়ার পক্ষে সোচ্চার এবং Speechify-এর সিইও ও প্রতিষ্ঠাতা। Speechify হলো বিশ্বের #1 টেক্সট-টু-স্পিচ অ্যাপ, যার ১,০০,০০০+ ৫-তারকা রিভিউ এবং অ্যাপ স্টোরে সংবাদ ও ম্যাগাজিন শ্রেণিতে শীর্ষ স্থান। ২০১৭ সালে, ওয়েইৎজম্যান Forbes 30 Under 30-এ ছিলেন, ওয়েব আরও সহজলভ্য করতে তার অবদানের জন্য। ক্লিফ ওয়েইৎজম্যান EdSurge, Inc., PC Mag, Entrepreneur, Mashable-সহ নানা শীর্ষ মিডিয়ায় আলোচিত হয়েছেন।

speechify logo

স্পিচিফাই সম্পর্কে

#১ টেক্সট-টু-স্পিচ রিডার

স্পিচিফাই পৃথিবীর শীর্ষস্থানীয় টেক্সট-টু-স্পিচ প্ল্যাটফর্ম, যা ৫ কোটি+ ব্যবহারকারীর কাছে ভরসাযোগ্য এবং এর টেক্সট-টু-স্পিচ iOS, অ্যান্ড্রয়েড, ক্রোম এক্সটেনশন, ওয়েব অ্যাপ আর ম্যাক ডেস্কটপ অ্যাপসে ৫ লক্ষ+ ফাইভ-স্টার রিভিউ পেয়েছে। ২০২৫ সালে অ্যাপল স্পিচিফাই-কে মর্যাদাপূর্ণ অ্যাপল ডিজাইন অ্যাওয়ার্ড প্রদান করে WWDC-তে এবং একে বলে, “মানুষের জীবনে দারুণ সহায়ক একটি গুরুত্বপূর্ণ রিসোর্স।” স্পিচিফাই ৬০+ ভাষায় ১,০০০+ প্রাকৃতিক কণ্ঠ নিয়ে প্রায় ২০০ দেশে ব্যবহৃত হচ্ছে। সেলিব্রিটি কণ্ঠের মধ্যে রয়েছে স্নুপ ডগ আর গুইনেথ পেল্ট্রো। নির্মাতা ও ব্যবসার জন্য স্পিচিফাই স্টুডিও উন্নত সব টুল দেয়, যার মধ্যে রয়েছে AI ভয়েস জেনারেটর, AI ভয়েস ক্লোনিং, AI ডাবিং আর AI ভয়েস চেঞ্জার। স্পিচিফাই-এর উচ্চমানের এবং খরচ-সাশ্রয়ী টেক্সট-টু-স্পিচ API-এর মাধ্যমে অসংখ্য শীর্ষ পণ্য সম্ভব হয়েছে। দ্য ওয়াল স্ট্রিট জার্নাল, CNBC, Forbes, TechCrunch এবং অন্যান্য বড় সংবাদমাধ্যমে স্পিচিফাই নিয়ে প্রতিবেদন প্রকাশিত হয়েছে; এটি বিশ্বের সর্ববৃহৎ টেক্সট-টু-স্পিচ প্রদানকারী। আরও জানতে ভিজিট করুন speechify.com/news, speechify.com/blog এবং speechify.com/press