Social Proof

เสียงปลอมด้วยเทคโนโลยีดีพเฟค

Speechify เป็นโปรแกรมสร้างเสียง AI อันดับ 1 สร้างเสียงบรรยายคุณภาพสูงในเวลาจริง บรรยายข้อความ วิดีโอ อธิบาย – ทุกอย่างที่คุณมี – ในสไตล์ใดก็ได้

กำลังมองหา โปรแกรมอ่านออกเสียงข้อความของเราอยู่หรือเปล่า?

แนะนำใน

forbes logocbs logotime magazine logonew york times logowall street logo

ฟังบทความนี้ด้วย Speechify!
Speechify

เทคโนโลยีดีพเฟคได้ก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมา นอกจากวิดีโอดีพเฟคแล้ว เสียงปลอมหรือการโคลนนิ่งเสียงก็เป็นอีกหนึ่งสาขาที่กำลังพัฒนาอย่างรวดเร็ว...

เทคโนโลยีดีพเฟคได้ก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมา นอกจากวิดีโอดีพเฟคแล้ว เสียงปลอมหรือการโคลนนิ่งเสียงก็เป็นอีกหนึ่งสาขาที่กำลังพัฒนาอย่างรวดเร็ว โดยใช้ปัญญาประดิษฐ์ (AI) และอัลกอริธึมการเรียนรู้ของเครื่อง

ดีพเฟคคืออะไร? การโคลนนิ่งเสียงคืออะไร?

ดีพเฟคหมายถึงสื่อสังเคราะห์ที่มีการแทนที่ลักษณะของบุคคลหนึ่งด้วยบุคคลอื่น สร้างคลิปเสียงหรือวิดีโอปลอมที่น่าเชื่อถือ ในขณะที่การโคลนนิ่งเสียงเกี่ยวข้องกับการสร้างเสียงมนุษย์ที่มีคุณภาพสูงโดยใช้ระบบแปลงข้อความเป็นเสียง (TTS) ทั้งสองเทคนิคใช้การเรียนรู้เชิงลึก ซึ่งเป็นส่วนย่อยของ AI ที่เลียนแบบการทำงานของสมองมนุษย์ในการประมวลผลข้อมูลเพื่อการตัดสินใจ

ความเป็นไปได้ของการปลอมเสียงและการโคลนนิ่งเสียง

การปลอมเสียงหรือการโคลนนิ่งเสียงเป็นไปได้จริง ระบบเหล่านี้ใช้การเรียนรู้ของเครื่องในการวิเคราะห์ชุดข้อมูลขนาดใหญ่ของการบันทึกเสียง เมื่อได้รับการฝึกฝนแล้ว อัลกอริธึมสามารถสร้างเสียงที่ตรงกับโทนเสียง ความสูง และลักษณะของเสียงต้นฉบับ กระบวนการนี้เรียกว่าการสังเคราะห์เสียง

การสร้างเสียงปลอมและการโคลนนิ่งเสียง

การสร้างเสียงปลอมประกอบด้วยสามขั้นตอน: การเก็บข้อมูล การฝึกฝน และการสร้างเสียง ขั้นแรก ระบบต้องการตัวอย่างเสียงจำนวนมากของเสียงเป้าหมาย ยิ่งมีข้อมูลมาก ผลลัพธ์ก็จะยิ่งดีขึ้น ขั้นที่สอง ตัวอย่างเสียงจะถูกใช้ในการฝึกฝนโมเดลการเรียนรู้เชิงลึก สุดท้าย โมเดลจะสร้างเสียงใหม่ที่คล้ายกับเสียงเป้าหมาย แพลตฟอร์มโอเพนซอร์สบน Github มีทรัพยากรต่างๆ สำหรับการดำเนินการเหล่านี้

การโคลนนิ่งเสียง vs การปลอมเสียง

แม้ว่าการโคลนนิ่งเสียงและการปลอมเสียงจะใช้การเรียนรู้อัลกอริธึมที่คล้ายกัน แต่มีวัตถุประสงค์ที่แตกต่างกัน การโคลนนิ่งเสียงมักมีการใช้งานในทางปฏิบัติ เช่น การสร้างเสียงพากย์สำหรับพอดแคสต์ หนังสือเสียง หรือช่วยเหลือผู้ที่มีปัญหาการพูด ในขณะที่ดีพเฟคมักถูกใช้เพื่อสร้างเสียงปลอมที่น่าเชื่อถือเพื่อวัตถุประสงค์ที่อาจเป็นอันตราย

การตรวจจับเสียงปลอมและการโคลนนิ่งเสียง

การตรวจจับเสียงปลอมหรือการโคลนนิ่งเสียงอาจเป็นเรื่องท้าทายเนื่องจากเสียงที่สร้างขึ้นมีคุณภาพสูง อย่างไรก็ตาม มีสัญญาณบางอย่างที่อาจบ่งบอกได้ เช่น การเน้นเสียงหรือจังหวะที่ไม่เป็นธรรมชาติ หรือเสียงพื้นหลังที่แปลก การฝังเมตริกในโมเดลการเรียนรู้เชิงลึกช่วยในการตรวจจับเสียงปลอมแบบเรียลไทม์ หลายบริษัทและนักวิจัยได้พัฒนาวิธีการตรวจจับดีพเฟค โดยใช้การเรียนรู้ของเครื่องในการตรวจจับความแตกต่างที่ละเอียดอ่อนที่มนุษย์อาจมองข้าม

แง่มุมทางกฎหมายของดีพเฟค

ความถูกต้องตามกฎหมายของดีพเฟคแตกต่างกันไปทั่วโลก ในบางที่ การสร้างดีพเฟคเพื่อการหลอกลวง การให้ข้อมูลผิด หรือเพื่อก่อให้เกิดอันตรายถือเป็นสิ่งผิดกฎหมาย นิวยอร์ก ตัวอย่างเช่น ได้ออกกฎหมายต่อต้านการปลอมแปลงดิจิทัล อย่างไรก็ตาม เส้นแบ่งอาจไม่ชัดเจน และกฎหมายปัจจุบันมักไม่ทันกับความก้าวหน้าทางเทคโนโลยีที่รวดเร็ว

ประโยชน์ของการโคลนนิ่งเสียงและผลกระทบของดีพเฟค

แม้ว่าดีพเฟคอาจก่อให้เกิดภัยคุกคาม โดยเฉพาะเมื่อใช้สร้างเสียงปลอมสำหรับการโทรศัพท์หรือโพสต์ในโซเชียลมีเดีย การโคลนนิ่งเสียงสามารถมีประโยชน์มากมาย เช่น การสร้างเสียงพากย์ ช่วยในการถอดความ หรือสร้างเสียงสังเคราะห์สำหรับระบบ AI

ในทางกลับกัน มีความเสี่ยงที่จะถูกใช้ในทางที่ผิด ด้วยเสียงปลอมที่ทำได้ดี ผู้ไม่หวังดีอาจปลอมตัวเป็นบุคคลอื่นได้อย่างน่าเชื่อถือผ่านโทรศัพท์หรือการประชุมวิดีโอ ซึ่งอาจนำไปสู่การหลอกลวงและการแพร่กระจายข้อมูลผิด

9 ซอฟต์แวร์หรือแอปยอดนิยมสำหรับเสียงปลอมและการโคลนนิ่งเสียง

  1. Speechify Voice Cloning: Speechify voice cloning เป็นบริการที่ดีที่สุดที่คุณจะหาได้ มันสามารถโคลนเสียงของคุณได้ทันที เพียงกดบันทึกในเบราว์เซอร์ของคุณและพูดเป็นเวลา 30 วินาที Speechify AI จะโคลนเสียงของคุณทันที
  2. Resemble AI: ให้บริการสร้างเสียง AI ที่ปรับแต่งได้
  3. Descript: มีชุดเครื่องมือแก้ไขเสียงที่ทรงพลังพร้อมกับ เครื่องสร้างเสียง deepfake
  4. Lyrebird: เป็นแผนกวิจัย AI ของ Descript ที่เชี่ยวชาญด้านการสังเคราะห์เสียง
  5. iSpeech: ให้บริการ TTS และโคลนเสียงคุณภาพสูง
  6. CereProc: เชี่ยวชาญในการสร้างเสียงที่ไม่ซ้ำใครด้วย AI
  7. Real-Time Voice Cloning: เป็นโครงการโอเพนซอร์สบน Github ที่โคลนเสียงได้แบบเรียลไทม์
  8. Azure Cognitive Services: ให้บริการด้านเสียงจาก Microsoft รวมถึง TTS และการแปลงเสียง
  9. Voicery: สร้างเสียงสังเคราะห์ที่ฟังดูเป็นธรรมชาติสำหรับการใช้งานในแอปพลิเคชันต่างๆ

แต่ละบริการเหล่านี้มีคุณสมบัติ ราคา และคุณภาพที่แตกต่างกัน ดังนั้นจึงจำเป็นต้องตรวจสอบแต่ละบริการตามความต้องการเฉพาะของคุณ

เมื่อ AI ยังคงพัฒนาไปเรื่อย ๆ เราอาจเห็นการเพิ่มขึ้นของ deepfake เสียงและการโคลนเสียง การทำความเข้าใจเทคโนโลยีนี้ ประโยชน์ที่อาจเกิดขึ้น และผลกระทบที่อาจมีต่อสังคมเป็นสิ่งสำคัญในโลกดิจิทัลที่เพิ่มขึ้นของเรา

Cliff Weitzman

คลิฟ ไวซ์แมน

คลิฟ ไวซ์แมน เป็นผู้สนับสนุนด้านดิสเล็กเซียและเป็น CEO และผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับ 1 ของโลก ที่มีรีวิว 5 ดาวมากกว่า 100,000 รีวิว และครองอันดับหนึ่งใน App Store ในหมวดข่าวและนิตยสาร ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาในการทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอใน EdSurge, Inc., PC Mag, Entrepreneur, Mashable และสื่อชั้นนำอื่น ๆ