Social Proof

เราควรกังวลเกี่ยวกับการเลียนเสียงหรือไม่?

Speechify เป็นโปรแกรมสร้างเสียง AI อันดับ 1 สร้างเสียงบรรยายคุณภาพสูงในเวลาจริง บรรยายข้อความ วิดีโอ อธิบาย – ทุกอย่างที่คุณมี – ในสไตล์ใดก็ได้

กำลังมองหา โปรแกรมอ่านออกเสียงข้อความของเราอยู่หรือเปล่า?

แนะนำใน

forbes logocbs logotime magazine logonew york times logowall street logo

ฟังบทความนี้ด้วย Speechify!
Speechify

การเลียนเสียงคืออะไรและทำงานอย่างไร? การเลียนเสียงเป็นเทคโนโลยีใหม่ที่ใช้ปัญญาประดิษฐ์ (AI) ออกแบบมาเพื่อเลียนแบบเสียงของบุคคล...

การเลียนเสียงคืออะไรและทำงานอย่างไร?

การเลียนเสียงเป็นเทคโนโลยีใหม่ที่ใช้ปัญญาประดิษฐ์ (AI) ออกแบบมาเพื่อเลียนแบบเสียงของบุคคลด้วยความแม่นยำที่น่าทึ่ง กระบวนการเริ่มต้นด้วยตัวอย่างเสียงของบุคคลนั้น ๆ ซึ่งมักจะเป็นคำพูดหรือประโยคที่ถูกบันทึกไว้ จากนั้นจะถูกประมวลผลผ่านอัลกอริทึมการเรียนรู้ของเครื่องที่ซับซ้อน เทคโนโลยี AI สร้างสรรค์นี้ ซึ่งเป็นสาขาหนึ่งของเทคโนโลยี deepfake ช่วยให้สามารถผลิตเสียงสังเคราะห์ที่ฟังดูเกือบเหมือนกับเสียงต้นฉบับ

ความสำคัญของการเลียนเสียง

ความสำคัญของ การเลียนเสียง มีความกว้างขวางและพัฒนาอย่างต่อเนื่อง ในอุตสาหกรรมบันเทิง การเลียนเสียงสามารถเป็นตัวเปลี่ยนเกมสำหรับนักพากย์และพอดแคสต์ พวกเขาสามารถเลียนเสียงของตนเองได้ในทางทฤษฎี ทำให้ทำงานได้อย่างมีประสิทธิภาพมากขึ้น นอกจากนี้ยังสามารถเปิดโอกาสใหม่ ๆ ในโลกของหนังสือเสียงและแชทบอท ช่วยให้การสังเคราะห์เสียงมีความเป็นธรรมชาติและเหมือนมนุษย์มากขึ้น

การเลียนเสียงยังมีผลกระทบอย่างลึกซึ้งในระดับบุคคล ลองนึกภาพการเก็บรักษาเสียงของคนที่คุณรักหรือสมาชิกในครอบครัว เทคโนโลยีนี้สามารถสร้างเสียงของปู่ย่าตายายให้คนรุ่นหลังได้ยิน หรือช่วยผู้ที่สูญเสียการพูดให้สามารถสื่อสารด้วยเสียงของตนเอง

อนาคตของการเลียนเสียง

เมื่อ AI และการเรียนรู้ของเครื่องยังคงพัฒนาไปข้างหน้า อนาคตของเทคโนโลยีการเลียนเสียงดูมีแนวโน้มดี เทคโนโลยีนี้สามารถมีส่วนร่วมอย่างมากในด้านต่าง ๆ เช่น แอปพลิเคชัน TTS (text-to-speech) แพลตฟอร์มโซเชียลมีเดียอย่าง TikTok, Alexa ของ Amazon, Siri ของ Apple และแม้กระทั่ง ChatGPT ของ Microsoft

นักวิจัยที่สถาบันต่าง ๆ เช่น MIT และ ElevenLabs กำลังสำรวจวิธีการปรับปรุงคุณภาพและความเป็นธรรมชาติของเสียงที่ถูกเลียนแบบ เป้าหมายของพวกเขาคือการพัฒนาเครื่องมือการเลียนเสียงคุณภาพสูงที่สามารถเข้าใจและเลียนแบบรูปแบบการพูดและน้ำเสียงที่ละเอียดอ่อน

เราควรกังวลเกี่ยวกับการเลียนเสียงหรือไม่?

การเพิ่มขึ้นของเทคโนโลยีการเลียนเสียงนั้นไม่ปราศจากความกังวล ตัวอย่างเช่น ผู้หลอกลวงอาจใช้เทคโนโลยีนี้เพื่อเลียนแบบเสียงของใครบางคนในสายโทรศัพท์ คลิปเสียง หรือแม้กระทั่งโพสต์ในโซเชียลมีเดียเพื่อดำเนินการหลอกลวง

การเลียนเสียง vs การจดจำเสียง

สิ่งสำคัญคือต้องแยกแยะการเลียนเสียงจากการจดจำเสียง การเลียนเสียงสร้างสำเนาของเสียงบุคคล ในขณะที่การจดจำเสียง ซึ่งมักใช้เพื่อการยืนยันตัวตน จะระบุบุคคลตามรูปแบบเสียงที่เป็นเอกลักษณ์ ดังนั้น การจดจำเสียงอาจทำหน้าที่เป็นแนวป้องกันการเลียนเสียงได้

การป้องกันตัวเองจากการเลียนเสียง

คณะกรรมาธิการการค้าของรัฐบาลกลาง (FTC) ได้ออกคำเตือนเกี่ยวกับความเสี่ยงที่เกี่ยวข้องกับการเลียนเสียง โดยกระตุ้นให้ผู้คนระมัดระวัง การปกป้องเสียงของคุณเริ่มต้นด้วยการระมัดระวังเกี่ยวกับสถานที่และวิธีการบันทึกและแชร์เสียงของคุณ ระวังคำขอที่ดูเหมือนไม่มีพิษภัยสำหรับตัวอย่างเสียง ไม่ว่าจะเป็นการบันทึกเสียงสำหรับ "การทดสอบเสียง" หรือการโทรศัพท์จากหมายเลขที่ไม่รู้จัก

ความเสี่ยงของการเลียนเสียง

ความเสี่ยงหลักที่เกี่ยวข้องกับการเลียนเสียงอยู่ที่การใช้งานในทางที่ผิด ผู้หลอกลวงอาจปลอมตัวเป็นบุคคล แม้กระทั่งบุคคลที่มีชื่อเสียงอย่างประธานาธิบดีไบเดน เพื่อวัตถุประสงค์ที่เป็นอันตราย นอกจากนี้ การจัดการข้อมูลเสียงอาจนำไปสู่การเพิ่มขึ้นของเนื้อหาเสียง deepfake ทำให้เกิดข้อมูลที่ผิดและทำลายความไว้วางใจในการสื่อสารดิจิทัล

เสียงของคุณสามารถถูกเลียนแบบได้หรือไม่?

ใช่ เสียงของคุณสามารถถูกเลียนแบบได้ด้วยความก้าวหน้าทางเทคโนโลยีในปัจจุบัน กระบวนการนี้ต้องการข้อมูลเสียงของคุณในปริมาณหนึ่ง มักจะอยู่ในรูปแบบของตัวอย่างเสียง ยิ่งระบบมีข้อมูลมากเท่าใด เสียงที่ถูกเลียนแบบก็จะยิ่งดีและแม่นยำมากขึ้นเท่านั้น อย่างไรก็ตาม ควรกล่าวว่า ณ ข้อมูลที่ฉันมีถึงปี 2021 การเลียนแบบเสียงของใครบางคนอย่างสมบูรณ์แบบจนสามารถหลอกสมาชิกในครอบครัวใกล้ชิดหรือระบบจดจำเสียงได้ยังคงเป็นงานที่ท้าทาย อย่างไรก็ตาม ความก้าวหน้าในด้านนี้ยังคงดำเนินไปอย่างรวดเร็ว

ความเสี่ยงบางประการของการเลียนเสียงคืออะไร?

ความเสี่ยงที่เกี่ยวข้องกับการเลียนเสียงส่วนใหญ่เกิดจากการใช้งานในทางที่ผิด โดยเฉพาะอย่างยิ่งในมือของผู้ที่มีเจตนาร้าย:

  1. การปลอมแปลงและการฉ้อโกง: หนึ่งในความเสี่ยงที่สำคัญคือการที่มิจฉาชีพอาจใช้การเลียนเสียงเพื่อปลอมแปลงบุคคลเพื่อกิจกรรมฉ้อโกง เช่น ใช้เสียงปลอมโทรศัพท์แกล้งเป็นสมาชิกครอบครัวที่กำลังเดือดร้อน ซึ่งเป็นกลยุทธ์ที่มักใช้ในกลโกง
  2. เนื้อหาเสียงปลอม: การสร้างเนื้อหาเสียงปลอมสามารถก่อให้เกิดความเสียหายได้มาก เช่น การกล่าวสุนทรพจน์ปลอมจากบุคคลทางการเมืองที่อาจสร้างความสับสนหรือแพร่กระจายข้อมูลที่ผิดพลาด
  3. การขโมยข้อมูลส่วนตัว: การเลียนเสียงอาจมีส่วนทำให้ปัญหาการขโมยข้อมูลส่วนตัวเพิ่มขึ้น เมื่อระบบควบคุมด้วยเสียงกลายเป็นเรื่องปกติ เสียงปลอมอาจถูกใช้เพื่อผ่านมาตรการรักษาความปลอดภัย
  4. การสูญเสียความเชื่อมั่น: เมื่อการแยกแยะระหว่างเสียงจริงและเสียงปลอมยากขึ้น ความเชื่อมั่นในระบบดิจิทัลและการสื่อสารโทรคมนาคมอาจถูกบั่นทอน ซึ่งอาจมีผลกระทบทางสังคมและการเมืองอย่างลึกซึ้ง

แม้ว่าความเสี่ยงเหล่านี้จะน่ากังวล แต่การวิจัยเกี่ยวกับการยืนยันตัวตนด้วยเสียงและนิติวิทยาศาสตร์ดิจิทัลกำลังดำเนินการเพื่อรับมือกับการใช้เทคโนโลยีในทางที่ผิด เป้าหมายคือเพื่อให้แน่ใจว่าเมื่อเทคโนโลยีการเลียนเสียงพัฒนาไปข้างหน้า วิธีการตรวจจับและป้องกันการใช้งานในทางที่ผิดก็พัฒนาตามไปด้วย

ซอฟต์แวร์และแอปเลียนเสียงยอดนิยม 8 อันดับ

  1. Resemble AI: ให้แพลตฟอร์มสำหรับสร้างเสียง AI ที่ไม่ซ้ำใครโดยใช้เทคโนโลยีแปลงข้อความเป็นเสียง
  2. iSpeech: เสนอการบริการเลียนเสียงพร้อมห้องสมุดเสียงที่มีอยู่แล้ว
  3. Microsoft Azure Text to Speech: ให้บริการ TTS ครบวงจรโดยใช้ AI เพื่อสร้างเสียงที่เหมือนมนุษย์
  4. Google Text-to-Speech: อนุญาตให้นักพัฒนารวมความสามารถเสียงสังเคราะห์เข้ากับแอปพลิเคชันของพวกเขา
  5. Amazon Polly: เสนอการบริการ TTS ที่เปลี่ยนข้อความเป็นเสียงที่เหมือนจริงโดยใช้เทคโนโลยีการเรียนรู้เชิงลึกขั้นสูง
  6. Lyrebird: ช่วยให้ผู้ใช้สร้างเสียงดิจิทัลที่ไม่ซ้ำใครโดยใช้ตัวอย่างเสียงของพวกเขาเพียงเล็กน้อย
  7. IBM Watson Text to Speech: แปลงข้อความเป็นเสียงที่ฟังดูเป็นธรรมชาติในหลากหลายภาษาและเสียง
  8. Baidu's Deep Voice: ระบบที่ใช้การเรียนรู้เชิงลึกสามารถเลียนเสียงได้ด้วยเสียงเพียง 3.7 วินาที

แม้ว่าเทคโนโลยีการเลียนเสียงจะน่าทึ่งและมีการประยุกต์ใช้ที่หลากหลาย แต่ก็มีความเสี่ยงที่เราต้องเข้าใจและป้องกัน เมื่อเราก้าวเข้าสู่ภูมิทัศน์เทคโนโลยีใหม่นี้ การมีวิธีการที่ระมัดระวังและมีข้อมูลจะเป็นประโยชน์ที่สุด

Cliff Weitzman

คลิฟ ไวซ์แมน

คลิฟ ไวซ์แมน เป็นผู้สนับสนุนด้านดิสเล็กเซียและเป็น CEO และผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับ 1 ของโลก ที่มีรีวิว 5 ดาวมากกว่า 100,000 รีวิว และครองอันดับหนึ่งใน App Store ในหมวดข่าวและนิตยสาร ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาในการทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอใน EdSurge, Inc., PC Mag, Entrepreneur, Mashable และสื่อชั้นนำอื่น ๆ