অ্যাপল ভয়েস ক্লোন ফিচারটি কী? এই নতুন প্রযুক্তি অ্যাপল ব্যবহারকারীদের কৃত্রিম বুদ্ধিমত্তা (AI) ব্যবহার করে কারও কণ্ঠস্বর ক্লোন করতে সক্ষম করে। WWDC 2023-এ এটি উন্মোচিত হয় এবং এটি মেশিন লার্নিংয়ের মাধ্যমে এমন একটি কৃত্রিম কণ্ঠ তৈরি করে, যা আপনার বা প্রিয়জনের আসল কণ্ঠের স্বর, টোন ও উচ্চারণের সঙ্গে বেশ মিল রেখে শোনায়।
অ্যাপল ভয়েস ক্লোন ফিচারটি কী?
অ্যাপল ভয়েস ক্লোন ফিচারটি এক ধরনের নতুন প্রযুক্তিগত অগ্রগতি, যা WWDC 2023-এ ঘোষণা করা হয়। কৃত্রিম বুদ্ধিমত্তা ও মেশিন লার্নিং ব্যবহার করে, ব্যবহারকারী চাইলে নিজের বা প্রিয়জনের কণ্ঠের একটি কৃত্রিম সংস্করণ তৈরি করতে পারে। এই ক্লোনকৃত কণ্ঠ বিভিন্ন অ্যাপল ডিভাইস জুড়ে নানান কাজে ব্যবহার করা যায়।
কীভাবে কারও কণ্ঠ ক্লোন করবেন?
অ্যাপল ভয়েস ক্লোন ফিচার দিয়ে কণ্ঠ ক্লোন করতে হলে নিচের ধাপগুলো অনুসরণ করতে হয়:
- প্রাকৃতিক ও স্পষ্ট উচ্চারণে বলা কয়েক মিনিটের অডিও রেকর্ড করুন।
- AI সেই অডিও বিশ্লেষণ করে, বক্তার কণ্ঠের বিশেষ বৈশিষ্ট্যগুলো শনাক্ত করে।
- এরপর সিস্টেমটি এমন একটি কৃত্রিম কণ্ঠ তৈরি করে, যা আসল কণ্ঠের সঙ্গে বেশ মিল রেখে শোনায়।
সেরা ফল পেতে আইফোন, আইপ্যাড বা ম্যাকে স্পষ্ট, স্বাভাবিক ব্যক্তিগত কথোপকথনের অডিও রেকর্ড করার পরামর্শ দেওয়া হয়।
অ্যাপল কি অফিসিয়ালি অন-ডিভাইস ভয়েস ক্লোনিং চালু করছে?
হ্যাঁ, অ্যাপল WWDC 2023-এ অফিসিয়ালি ভয়েস ক্লোনিং ঘোষণা করেছে। এ ফিচারটি বিশেষভাবে অ্যাক্সেসিবিলিটি বাড়াতে এবং ALS-এর মতো সংবেদনশীল শারীরিক অবস্থায় থাকা ব্যবহারকারীদের নিজেদের কণ্ঠে কথা বলতে সাহায্য করার জন্য ডিজাইন করা হয়েছে।
ভয়েস ক্লোনিং দিয়ে কী করতে পারেন?
ভয়েস ক্লোনিং-এর ব্যবহার ক্ষেত্র অনেক:
- ফোন ও ফেসটাইম কলকে আরও ব্যক্তিগত করে তোলা।
- নিজের কণ্ঠে পডকাস্ট ও সোশ্যাল মিডিয়া কনটেন্ট তৈরি করা।
- সিরির মতো ভয়েস-কন্ট্রোলড ফিচার আরও স্বচ্ছন্দে ব্যবহার করা।
- 'লাইভ স্পিচ'-এ টেক্সট-টু-স্পিচ সুবিধা নেওয়া।
ভয়েস ক্লোনিং ও ভয়েস রিকগনিশনের মাঝে পার্থক্য কী?
ভয়েস রিকগনিশন হলো কোনো কণ্ঠকে শনাক্ত ও যাচাই করার প্রযুক্তি, যা সিরি বা গুগল অ্যাসিস্ট্যান্টের মতো অ্যাপসে ব্যবহৃত হয়। অন্যদিকে, ভয়েস ক্লোনিং AI ব্যবহার করে নির্দিষ্ট কারও মতোই কৃত্রিম কণ্ঠ তৈরি করে।
ভয়েস ক্লোনিং ব্যবহারের সুবিধা কী?
ভয়েস ক্লোনিংয়ের কিছু বড় সুবিধা:
- কথা বলায় অসুবিধা থাকলে যোগাযোগের পথ আরও সহজ হয়।
- ডিজিটাল ইন্টার্যাকশন অনেক বেশি ব্যক্তিগত ও মানবিক লাগে।
- বিভিন্ন প্ল্যাটফর্মে আন্তরিক ও আকর্ষণীয় যোগাযোগ সম্ভব হয়।
ভয়েস ক্লোনিং কীভাবে কাজ করে?
ভয়েস ক্লোনিং AI এবং মেশিন লার্নিং দিয়ে রেকর্ড করা কণ্ঠের ইউনিক বৈশিষ্ট্য (স্বর, টোন, উচ্চারণ) বিশ্লেষণ করে। এরপর, AI সেই বৈশিষ্ট্যগুলো ক্লোনকৃত কণ্ঠে যতটা সম্ভব হুবহু অনুকরণ করার চেষ্টা করে।
কীভাবে আপনি অ্যাপল ভয়েস ক্লোন পাবেন?
WWDC 2023-এ ঘোষণার পর, আইওএস ১৭ ও আইপ্যাডওএস-এ—আইফোন, আইপ্যাড, ম্যাক ও অ্যাপল ওয়াচে এ ফিচার পাওয়া যাবে। সঠিক ব্যবহারবিধি ও শর্তাবলি অ্যাপল অফিসিয়াল রিলিজের সময় জানাবে।
অ্যাপল ছাড়া সেরা ৮টি ভয়েস ক্লোনিং অ্যাপ/সফটওয়্যারের তালিকা
- Resemble AI: গভীর শিক্ষাভিত্তিক টেক্সট-টু-স্পিচ ও ভয়েস ক্লোনিং।
- Descript's Overdub: সহজে পডকাস্ট/ভিডিও এডিটে কণ্ঠ ক্লোন করা যায়।
- Microsoft's Custom Neural Voice: উন্নতমানের ভয়েস সিন্থেসিস সুবিধা।
- CereProc: বহু ভাষা সমর্থন ও আবেগময় কণ্ঠে প্রসিদ্ধ।
- iSpeech: ক্লাউড-ভিত্তিক টেক্সট-টু-স্পিচ সার্ভিস ও এপিআই।
- Acapela's My-Own-Voice: কণ্ঠ হারানোর ঝুঁকিতে থাকা ব্যক্তিদের কণ্ঠ সংরক্ষণে সহায়ক।
- Replica Studios: গেম ডেভেলপমেন্টে ভয়েস-ওভারের জন্য ব্যবহৃত।
- Google's Tacotron: মেশিন লার্নিং-ভিত্তিক ওপেন সোর্স ভয়েস টুল।
ভয়েস ক্লোনিংয়ের আবির্ভাবে প্রতারণা ও অপব্যবহারের ঝুঁকিও বেড়েছে। তাই প্রযুক্তিটি দায়িত্বশীলভাবে ব্যবহার করা জরুরি। নৈতিক নির্দেশিকা থাকা দরকার, যাতে কারও ক্ষতি না হয় এবং অপব্যবহার ঠেকানো যায়।
নতুন অ্যাক্সেসিবিলিটি ফিচারগুলো iOS 17, iPadOS এবং বিভিন্ন অ্যাপল ডিভাইসে (অ্যাপল ওয়াচ, ম্যাকবুক) কাজ করে। ম্যাগনিফায়ার ফিচার, 'পয়েন্ট অ্যান্ড স্পিক' অপশন ও ভিশন প্রো অ্যাপে ভিজুয়াল প্রতিবন্ধীদের সহায়তা আরও বাড়ছে। ব্যক্তিগত কণ্ঠ ফিচার সরাসরি এগুলোর সঙ্গে যুক্ত না হলেও, অ্যাপল তার ইকোসিস্টেমে সার্বিকভাবে অ্যাক্সেসিবিলিটি বাড়ানোর চেষ্টা চালিয়ে যাচ্ছে।
এই প্রযুক্তির অগ্রগতি আমাদের ডিজিটাল যোগাযোগের ভবিষ্যৎ আমূল বদলে দিতে পারে। আপনি হোন ফিলিপ গ্রিন বা অন্য কেউ—মনে রাখুন, পডকাস্ট, ফেসটাইম, কিংবা সাধারণ আলাপে—ভয়েস ক্লোনিং আপনাকে দিচ্ছে একেবারে নতুন মাত্রার শক্তি।

