เสียงปลอมด้วยเทคโนโลยีดีพเฟค
กำลังมองหา โปรแกรมอ่านออกเสียงข้อความของเราอยู่หรือเปล่า?
แนะนำใน
- ดีพเฟคคืออะไร? การโคลนนิ่งเสียงคืออะไร?
- ความเป็นไปได้ของการปลอมเสียงและการโคลนนิ่งเสียง
- การสร้างเสียงปลอมและการโคลนนิ่งเสียง
- การโคลนนิ่งเสียง vs การปลอมเสียง
- การตรวจจับเสียงปลอมและการโคลนนิ่งเสียง
- แง่มุมทางกฎหมายของดีพเฟค
- ประโยชน์ของการโคลนนิ่งเสียงและผลกระทบของดีพเฟค
- 9 ซอฟต์แวร์หรือแอปยอดนิยมสำหรับเสียงปลอมและการโคลนนิ่งเสียง
เทคโนโลยีดีพเฟคได้ก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมา นอกจากวิดีโอดีพเฟคแล้ว เสียงปลอมหรือการโคลนนิ่งเสียงก็เป็นอีกหนึ่งสาขาที่กำลังพัฒนาอย่างรวดเร็ว...
เทคโนโลยีดีพเฟคได้ก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมา นอกจากวิดีโอดีพเฟคแล้ว เสียงปลอมหรือการโคลนนิ่งเสียงก็เป็นอีกหนึ่งสาขาที่กำลังพัฒนาอย่างรวดเร็ว โดยใช้ปัญญาประดิษฐ์ (AI) และอัลกอริธึมการเรียนรู้ของเครื่อง
ดีพเฟคคืออะไร? การโคลนนิ่งเสียงคืออะไร?
ดีพเฟคหมายถึงสื่อสังเคราะห์ที่มีการแทนที่ลักษณะของบุคคลหนึ่งด้วยบุคคลอื่น สร้างคลิปเสียงหรือวิดีโอปลอมที่น่าเชื่อถือ ในขณะที่การโคลนนิ่งเสียงเกี่ยวข้องกับการสร้างเสียงมนุษย์ที่มีคุณภาพสูงโดยใช้ระบบแปลงข้อความเป็นเสียง (TTS) ทั้งสองเทคนิคใช้การเรียนรู้เชิงลึก ซึ่งเป็นส่วนย่อยของ AI ที่เลียนแบบการทำงานของสมองมนุษย์ในการประมวลผลข้อมูลเพื่อการตัดสินใจ
ความเป็นไปได้ของการปลอมเสียงและการโคลนนิ่งเสียง
การปลอมเสียงหรือการโคลนนิ่งเสียงเป็นไปได้จริง ระบบเหล่านี้ใช้การเรียนรู้ของเครื่องในการวิเคราะห์ชุดข้อมูลขนาดใหญ่ของการบันทึกเสียง เมื่อได้รับการฝึกฝนแล้ว อัลกอริธึมสามารถสร้างเสียงที่ตรงกับโทนเสียง ความสูง และลักษณะของเสียงต้นฉบับ กระบวนการนี้เรียกว่าการสังเคราะห์เสียง
การสร้างเสียงปลอมและการโคลนนิ่งเสียง
การสร้างเสียงปลอมประกอบด้วยสามขั้นตอน: การเก็บข้อมูล การฝึกฝน และการสร้างเสียง ขั้นแรก ระบบต้องการตัวอย่างเสียงจำนวนมากของเสียงเป้าหมาย ยิ่งมีข้อมูลมาก ผลลัพธ์ก็จะยิ่งดีขึ้น ขั้นที่สอง ตัวอย่างเสียงจะถูกใช้ในการฝึกฝนโมเดลการเรียนรู้เชิงลึก สุดท้าย โมเดลจะสร้างเสียงใหม่ที่คล้ายกับเสียงเป้าหมาย แพลตฟอร์มโอเพนซอร์สบน Github มีทรัพยากรต่างๆ สำหรับการดำเนินการเหล่านี้
การโคลนนิ่งเสียง vs การปลอมเสียง
แม้ว่าการโคลนนิ่งเสียงและการปลอมเสียงจะใช้การเรียนรู้อัลกอริธึมที่คล้ายกัน แต่มีวัตถุประสงค์ที่แตกต่างกัน การโคลนนิ่งเสียงมักมีการใช้งานในทางปฏิบัติ เช่น การสร้างเสียงพากย์สำหรับพอดแคสต์ หนังสือเสียง หรือช่วยเหลือผู้ที่มีปัญหาการพูด ในขณะที่ดีพเฟคมักถูกใช้เพื่อสร้างเสียงปลอมที่น่าเชื่อถือเพื่อวัตถุประสงค์ที่อาจเป็นอันตราย
การตรวจจับเสียงปลอมและการโคลนนิ่งเสียง
การตรวจจับเสียงปลอมหรือการโคลนนิ่งเสียงอาจเป็นเรื่องท้าทายเนื่องจากเสียงที่สร้างขึ้นมีคุณภาพสูง อย่างไรก็ตาม มีสัญญาณบางอย่างที่อาจบ่งบอกได้ เช่น การเน้นเสียงหรือจังหวะที่ไม่เป็นธรรมชาติ หรือเสียงพื้นหลังที่แปลก การฝังเมตริกในโมเดลการเรียนรู้เชิงลึกช่วยในการตรวจจับเสียงปลอมแบบเรียลไทม์ หลายบริษัทและนักวิจัยได้พัฒนาวิธีการตรวจจับดีพเฟค โดยใช้การเรียนรู้ของเครื่องในการตรวจจับความแตกต่างที่ละเอียดอ่อนที่มนุษย์อาจมองข้าม
แง่มุมทางกฎหมายของดีพเฟค
ความถูกต้องตามกฎหมายของดีพเฟคแตกต่างกันไปทั่วโลก ในบางที่ การสร้างดีพเฟคเพื่อการหลอกลวง การให้ข้อมูลผิด หรือเพื่อก่อให้เกิดอันตรายถือเป็นสิ่งผิดกฎหมาย นิวยอร์ก ตัวอย่างเช่น ได้ออกกฎหมายต่อต้านการปลอมแปลงดิจิทัล อย่างไรก็ตาม เส้นแบ่งอาจไม่ชัดเจน และกฎหมายปัจจุบันมักไม่ทันกับความก้าวหน้าทางเทคโนโลยีที่รวดเร็ว
ประโยชน์ของการโคลนนิ่งเสียงและผลกระทบของดีพเฟค
แม้ว่าดีพเฟคอาจก่อให้เกิดภัยคุกคาม โดยเฉพาะเมื่อใช้สร้างเสียงปลอมสำหรับการโทรศัพท์หรือโพสต์ในโซเชียลมีเดีย การโคลนนิ่งเสียงสามารถมีประโยชน์มากมาย เช่น การสร้างเสียงพากย์ ช่วยในการถอดความ หรือสร้างเสียงสังเคราะห์สำหรับระบบ AI
ในทางกลับกัน มีความเสี่ยงที่จะถูกใช้ในทางที่ผิด ด้วยเสียงปลอมที่ทำได้ดี ผู้ไม่หวังดีอาจปลอมตัวเป็นบุคคลอื่นได้อย่างน่าเชื่อถือผ่านโทรศัพท์หรือการประชุมวิดีโอ ซึ่งอาจนำไปสู่การหลอกลวงและการแพร่กระจายข้อมูลผิด
9 ซอฟต์แวร์หรือแอปยอดนิยมสำหรับเสียงปลอมและการโคลนนิ่งเสียง
- Speechify Voice Cloning: Speechify voice cloning เป็นบริการที่ดีที่สุดที่คุณจะหาได้ มันสามารถโคลนเสียงของคุณได้ทันที เพียงกดบันทึกในเบราว์เซอร์ของคุณและพูดเป็นเวลา 30 วินาที Speechify AI จะโคลนเสียงของคุณทันที
- Resemble AI: ให้บริการสร้างเสียง AI ที่ปรับแต่งได้
- Descript: มีชุดเครื่องมือแก้ไขเสียงที่ทรงพลังพร้อมกับ เครื่องสร้างเสียง deepfake
- Lyrebird: เป็นแผนกวิจัย AI ของ Descript ที่เชี่ยวชาญด้านการสังเคราะห์เสียง
- iSpeech: ให้บริการ TTS และโคลนเสียงคุณภาพสูง
- CereProc: เชี่ยวชาญในการสร้างเสียงที่ไม่ซ้ำใครด้วย AI
- Real-Time Voice Cloning: เป็นโครงการโอเพนซอร์สบน Github ที่โคลนเสียงได้แบบเรียลไทม์
- Azure Cognitive Services: ให้บริการด้านเสียงจาก Microsoft รวมถึง TTS และการแปลงเสียง
- Voicery: สร้างเสียงสังเคราะห์ที่ฟังดูเป็นธรรมชาติสำหรับการใช้งานในแอปพลิเคชันต่างๆ
แต่ละบริการเหล่านี้มีคุณสมบัติ ราคา และคุณภาพที่แตกต่างกัน ดังนั้นจึงจำเป็นต้องตรวจสอบแต่ละบริการตามความต้องการเฉพาะของคุณ
เมื่อ AI ยังคงพัฒนาไปเรื่อย ๆ เราอาจเห็นการเพิ่มขึ้นของ deepfake เสียงและการโคลนเสียง การทำความเข้าใจเทคโนโลยีนี้ ประโยชน์ที่อาจเกิดขึ้น และผลกระทบที่อาจมีต่อสังคมเป็นสิ่งสำคัญในโลกดิจิทัลที่เพิ่มขึ้นของเรา
คลิฟ ไวซ์แมน
คลิฟ ไวซ์แมน เป็นผู้สนับสนุนด้านดิสเล็กเซียและเป็น CEO และผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับ 1 ของโลก ที่มีรีวิว 5 ดาวมากกว่า 100,000 รีวิว และครองอันดับหนึ่งใน App Store ในหมวดข่าวและนิตยสาร ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาในการทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอใน EdSurge, Inc., PC Mag, Entrepreneur, Mashable และสื่อชั้นนำอื่น ๆ