WWDC 2023-এ অ্যাপল বহু প্রতীক্ষিত iOS 17 ও iPadOS 17 উন্মোচন করেছে, যা তাদের অপারেটিং সিস্টেমে বড় এক অগ্রগতি। পার্সোনাল ভয়েস ও লাইভ স্পিচ এমন বিশেষ ফিচার, যা iPhone, iPad ও Apple Watch-সহ সব ডিভাইসে যোগাযোগ ও অ্যাক্সেসিবিলিটি আরও বাড়াতে বানানো হয়েছে।
iOS 17-এ পার্সোনাল ভয়েস চালু করবেন যেভাবে
পার্সোনাল ভয়েস চালু করতে ‘Settings’-এ যান, ‘Accessibility’ সিলেক্ট করুন, তারপর ‘Voice Control’-এ ট্যাপ করুন। এখান থেকে ‘Personal Voice’ বেছে নিয়ে স্ক্রিনে দেওয়া ধাপগুলো অনুসরণ করুন।
iOS 17-এ পার্সোনাল ভয়েস বানাবেন কীভাবে
iOS 17-এ পার্সোনাল ভয়েস বানাতে কিছুটা সময় লাগতে পারে। অ্যাপল শক্তিশালী অন-ডিভাইস মেশিন লার্নিং দিয়ে আলাদা ভোকাল মডেল বানায়। সাধারণত ২০–৩০ মিনিট লাগে, ব্যবহারকারীর নিজস্ব কথা বলার ধরন অনুযায়ী সময় কমবেশি হতে পারে।
iPhone-এ পার্সোনাল ভয়েস ব্যবহার করবেন কীভাবে?
প্রক্রিয়াটা একদম সোজা। আগে ডিভাইসটা iOS 17-এ আপডেট করুন, তারপর আগের মতোই ‘Accessibility’ সেটিংসে গিয়ে ফিচারটা অন করুন।
iOS 17-এ লাইভ স্পিচ কীভাবে কাজ করে
লাইভ স্পিচ এমন এক নতুন ফিচার, যা সরাসরি কথোপকথন, ফেসটাইম কল, পডকাস্ট আর সোশ্যাল মিডিয়া ভিডিও খুব দ্রুত ট্রান্সক্রাইব করতে পারে। এতে দ্রুত বুঝে নেওয়া ও জবাব দেওয়া অনেক সহজ হয়।
পার্সোনাল ভয়েসের সুবিধা
পার্সোনাল ভয়েস ফিচারে বেশ কিছু বড় সুবিধা রয়েছে:
- অ্যাক্সেসিবিলিটি: বাক্জনিত প্রতিবন্ধকতা বা ALS-এ আক্রান্তদের যোগাযোগে বড় সহায়তা দেয়।
- ব্যক্তিগতকরণ: নিজের কণ্ঠেই Siri ও অন্যান্য ভয়েস-চালিত সেবার সঙ্গে কথা বলা যায়।
- গোপনতা: সবকিছু ডিভাইসেই হয়, তাই ব্যক্তিগত ডেটা আরও সুরক্ষিত থাকে।
ভয়েস ক্লোনিং কী?
ভয়েস ক্লোনিং মানে এআই দিয়ে কারও কণ্ঠ প্রায় হুবহু অনুকরণ বা “ক্লোন” করা। অ্যাপলের পার্সোনাল ভয়েসও এক ধরনের ভয়েস ক্লোনিং।
পার্সোনাল ভয়েস আর লাইভ স্পিচের মধ্যে পার্থক্য
দুই ফিচারই জরুরি, তবে কাজ আলাদা। পার্সোনাল ভয়েসে নিজের কণ্ঠকে ইন্টারফেস হিসেবে ব্যবহার করা যায়। অন্যদিকে, লাইভ স্পিচ তাৎক্ষণিক কথোপকথন বা অডিওর লেখা বানিয়ে দেয়, ফলে আলোচনা ধরা ও জবাব দেওয়া আরও সহজ হয়।
ভয়েস ক্লোনিং ও স্পিচ-টু-টেক্সটের শীর্ষ ৯ সফটওয়্যার/অ্যাপ
- Speechify Voice Cloning: Speechify voice cloning-এ আপনার কণ্ঠ একদম মুহূর্তেই ক্লোন হয়। শুধু ব্রাউজারে ৩০ সেকেন্ড রেকর্ড করুন—AI সঙ্গে সঙ্গে কণ্ঠ বানিয়ে ফেলবে।
- Apple-এর পার্সোনাল ভয়েস ও লাইভ স্পিচ: iOS 17-এর নেটিভ ভয়েস ক্লোনিং আর লাইভ ট্রান্সক্রিপশন ফিচার।
- Microsoft Azure Cognitive Services: Text-to-Speech-এর মাধ্যমে ভয়েস ক্লোনিংয়ের সুবিধা দেয়।
- Amazon Polly: ডিপ লার্নিং ব্যবহার করে বেশ বাস্তবঘনিষ্ঠ ভয়েস তৈরি করে।
- Apple-এর VoiceOver: দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীদের জন্য স্ক্রিন রিডার ও ভয়েস গাইড।
- Apple Vision Pro: Vision অ্যাপের উন্নত রূপ, আরও ভালো ম্যাগনিফায়ার আর ভয়েসওভার সাপোর্টসহ।
- Google-এর Live Transcribe: অ্যান্ড্রয়েড ডিভাইসে রিয়েল-টাইম ট্রান্সক্রিপশন দেয়।
- Lyrebird: AI দিয়ে নিজের মতো শোনায় এমন ডিজিটাল কণ্ঠ বানাতে সাহায্য করে।
- Resemble AI: আরও বাস্তবধর্মী সিন্থেটিক কণ্ঠের জন্য কাস্টম ভয়েস ক্লোনিং সল্যুশন।
অ্যাপল নতুন অ্যাক্সেসিবিলিটি ফিচার যোগ করায়, iOS 17 এমন এক ভবিষ্যতের ইঙ্গিত দেয় যেখানে প্রযুক্তি সত্যিই সবার জন্য। পাবলিক বেটা আর iPhone 15 রিলিজের সময় এই আপডেটের খোঁজ রাখুন।

