เสียง Deepfake คืออะไร และคุณจะสังเกตได้อย่างไร?
กำลังมองหา โปรแกรมอ่านออกเสียงข้อความของเราอยู่หรือเปล่า?
แนะนำใน
- เสียง Deepfake คืออะไร?
- เสียง Deepfake ถูกสร้างขึ้นอย่างไร?
- เสียง Deepfake แตกต่างจากเสียงสังเคราะห์อื่นอย่างไร?
- การใช้งานและการใช้ในทางที่ผิดของเสียง Deepfake มีอะไรบ้าง?
- คนทั่วไปจะแยกแยะระหว่างเสียง Deepfake กับเสียงจริงได้อย่างไร?
- ความท้าทายทางเทคโนโลยีในปัจจุบันในการสร้างเสียง Deepfake ที่สมจริงมากคืออะไร?
- ตัวอย่างเสียง Deepfake ที่สมจริงที่สุดคืออะไร?
- ประเภทต่าง ๆ ของ Deepfake
- 9 ดีพเฟคที่หลอกคนได้สำเร็จ
- 9 เว็บไซต์เสียงดีพเฟคยอดนิยม:
- ส่วนคำถามที่พบบ่อย:
- เสียง AI สามารถตรวจจับได้หรือไม่?
- คุณตรวจจับดีพเฟคได้อย่างไร?
- ผู้คนใช้เครื่องมืออะไรในการทำเสียงดีพเฟค?
- ประโยชน์ของการใช้เสียงดีพเฟคคืออะไร?
- ความเสี่ยงของดีพเฟคคืออะไร?
- สามารถพิสูจน์ว่าเสียงดีพเฟคเป็นของปลอมได้หรือไม่?
- ผลกระทบของเสียงดีพเฟคคืออะไร?
- ดีพเฟคทำงานอย่างไร?
- วัตถุประสงค์ของเสียงดีพเฟคคืออะไร?
- เสียงดีพเฟคถูกใช้อย่างไร?
เสียง Deepfake คืออะไร? เสียง Deepfake คือเสียงสังเคราะห์ที่สร้างขึ้นโดยใช้เทคโนโลยีการเรียนรู้ของเครื่องขั้นสูงเพื่อเลียนแบบเสียงของบุคคลจริง แตกต่างจาก...
เสียง Deepfake คืออะไร?
เสียง Deepfake คือเสียงสังเคราะห์ที่สร้างขึ้นโดยใช้เทคโนโลยีการเรียนรู้ของเครื่องขั้นสูงเพื่อเลียนแบบเสียงของบุคคลจริง แตกต่างจากวิธีการแปลงข้อความเป็นเสียงแบบดั้งเดิม เสียง Deepfake สามารถสร้างเนื้อหาเสียงที่สมจริงมากจนแทบจะแยกไม่ออกจากเสียงจริงของบุคคลที่ถูกเลียนแบบ
เสียง Deepfake ถูกสร้างขึ้นอย่างไร?
เสียง Deepfake ถูกสร้างขึ้นโดยใช้การเรียนรู้เชิงลึกและอัลกอริทึมปัญญาประดิษฐ์ อัลกอริทึมเหล่านี้จะใช้ชุดข้อมูลของการบันทึกเสียงจากบุคคลเฉพาะ แล้ววิเคราะห์และจำลองความละเอียดอ่อนและคุณภาพเสียงของบุคคลนั้น เมื่อฝึกฝนแล้ว อัลกอริทึมสามารถสร้างเสียงพูดในเสียงนั้นจากข้อความที่ป้อนเข้าไป
เสียง Deepfake แตกต่างจากเสียงสังเคราะห์อื่นอย่างไร?
ระบบแปลงข้อความเป็นเสียงแบบดั้งเดิมพึ่งพารูปแบบเสียงที่กำหนดไว้ล่วงหน้าและไม่ได้มุ่งเลียนแบบเสียงของบุคคลเฉพาะ เทคโนโลยี Deepfake ใช้เครือข่ายประสาทเทียมและชุดข้อมูลเสียงขนาดใหญ่เพื่อสร้างรูปแบบเฉพาะสำหรับบุคคล ทำให้เสียง Deepfake ฟังดูสมจริงกว่าเสียงสังเคราะห์ทั่วไป
การใช้งานและการใช้ในทางที่ผิดของเสียง Deepfake มีอะไรบ้าง?
การใช้งานที่เป็นไปได้รวมถึงความบันเทิง (เช่น การฟื้นฟูเสียงของนักแสดงที่เสียชีวิต) พอดแคสต์ที่ไม่มีบุคคลจริงสำหรับการบันทึก หรือผู้ช่วยเสียงที่มีเสียงเฉพาะตัว การใช้ในทางที่ผิดรวมถึงการหลอกลวง ข้อมูลเท็จ ข่าวปลอม การปลอมแปลง และอื่น ๆ บนโซเชียลมีเดีย ผู้หลอกลวงสามารถใช้เสียง Deepfake เพื่อเผยแพร่ข้อมูลเท็จหรือสร้างวิดีโอปลอม
คนทั่วไปจะแยกแยะระหว่างเสียง Deepfake กับเสียงจริงได้อย่างไร?
การฟังหาความไม่สม่ำเสมอ เสียงรบกวนพื้นหลัง หรือความผิดปกติใด ๆ ในการพูดสามารถช่วยได้ อีกวิธีหนึ่งคือการใช้เครื่องมือตรวจจับ Deepfake ซึ่งวิเคราะห์เนื้อหาเสียงเพื่อหาสัญญาณของการปรับแต่ง
ความท้าทายทางเทคโนโลยีในปัจจุบันในการสร้างเสียง Deepfake ที่สมจริงมากคืออะไร?
แม้จะมีความสมจริง เสียง Deepfake อาจมีปัญหาในการสร้างเสียงที่มีน้ำเสียงธรรมชาติหรือจัดการคำที่มีหลายพยางค์ที่ซับซ้อน เสียงรบกวนพื้นหลังและความสม่ำเสมอของคุณภาพเสียงยังคงเป็นความท้าทาย
ตัวอย่างเสียง Deepfake ที่สมจริงที่สุดคืออะไร?
ตัวอย่างที่น่าสนใจรวมถึงคลิปเสียง Deepfake ของ Barack Obama และ Donald Trump คลิปเหล่านี้สมจริงมากจนถูกใช้ในวิดีโอ ทำให้ผู้ฟังแยกไม่ออกจากเสียงจริงของพวกเขา
ประเภทต่าง ๆ ของ Deepfake
เทคโนโลยี Deepfake ใช้การเรียนรู้ของเครื่องและเครือข่ายประสาทเทียมเพื่อสร้างเนื้อหาเสียงและวิดีโอปลอมที่เลียนแบบคนจริง นี่คือประเภทต่าง ๆ ของ Deepfake:
- วิดีโอ Deepfake: เป็นวิดีโอที่ใบหน้าและบางครั้งแม้แต่การเคลื่อนไหวของร่างกายของบุคคลถูกแทนที่ด้วยของบุคคลอื่น พวกเขาใช้เทคโนโลยีการเรียนรู้เชิงลึกเพื่อทำเช่นนี้
- เสียง Deepfake: หรือที่รู้จักในชื่อ การโคลนนิ่งเสียง เป็นการบันทึกเสียงที่สร้างขึ้นเพื่อเลียนแบบเสียงของบุคคลจริงโดยใช้การเรียนรู้ของเครื่อง
- ภาพ Deepfake: เป็นภาพนิ่งที่ถูกปรับแต่งให้ดูเหมือนว่าพวกเขาแสดงเหตุการณ์หรือบุคคลจริงเมื่อพวกเขาไม่ได้เป็นเช่นนั้น
- ข้อความเป็นเสียง Deepfake: เป็นเสียงสังเคราะห์ที่สร้างขึ้นผ่านเทคโนโลยีแปลงข้อความเป็นเสียงที่สามารถอ่านออกเสียงข้อความใด ๆ ในเสียงที่ฟังดูเหมือนคนจริง มักจะเป็นคนดัง
- พอดแคสต์ Deepfake: เป็นพอดแคสต์ที่ใช้เสียงสังเคราะห์เพื่อจำลองการสนทนาระหว่างคนจริง
- ข่าวปลอม Deepfake: เป็นกรณีที่เทคโนโลยี Deepfake ถูกใช้เพื่อเผยแพร่ข้อมูลเท็จหรือข้อมูลผิดผ่านโซเชียลมีเดีย มักเกี่ยวข้องกับบุคคลสาธารณะเช่น Donald Trump หรือ Barack Obama
- การยืนยันตัวตน Deepfake: เป็น Deepfake ที่ใช้เพื่อหลีกเลี่ยงระบบรักษาความปลอดภัยทางชีวมิติ
- Deepfake แบบเรียลไทม์: เป็น Deepfake ที่ถูกสร้างขึ้นแบบเรียลไทม์ระหว่างการแชทวิดีโอหรือแพลตฟอร์มที่คล้ายกัน
Google Reverse Image
Google Reverse Image เป็นฟีเจอร์การค้นหาที่ช่วยให้ผู้ใช้สามารถค้นหาแหล่งที่มาของภาพได้ มันมีประโยชน์ในกระบวนการยืนยันเพื่อดูว่าภาพเป็นของจริงหรือเป็น Deepfake
กฎหมายที่ควบคุม Deepfake
ในแคลิฟอร์เนียและบางเขตอำนาจศาลอื่น ๆ มีกฎหมายต่อต้านการใช้ดีพเฟคเพื่อหลอกลวงหรือฉ้อโกงผู้คน สภาพแวดล้อมทางกฎหมายยังคงพัฒนาอยู่ แต่ก็มีกฎหมายหลายฉบับที่สามารถนำมาใช้กับการใช้ดีพเฟคที่เป็นการฉ้อโกงหรือเป็นอันตราย เช่น กฎหมายหมิ่นประมาทหรือกฎหมายต่อต้านการขโมยข้อมูลส่วนบุคคล
9 ดีพเฟคที่หลอกคนได้สำเร็จ
โปรดทราบว่านี่เป็นเรื่องที่มีการเปลี่ยนแปลงอย่างต่อเนื่อง แต่จากการอัปเดตล่าสุดของฉัน:
- ดีพเฟคของบารัค โอบามา: ดีพเฟคที่มีบารัค โอบามาทำให้ผู้คนเข้าใจผิดว่าอดีตประธานาธิบดีสหรัฐฯ พูดในสิ่งที่เขาไม่ได้พูดจริง
- ดีพเฟคของโดนัลด์ ทรัมป์: คล้ายกับดีพเฟคของโอบามา ดีพเฟคของโดนัลด์ ทรัมป์ก็ทำให้ผู้ชมเข้าใจผิดเช่นกัน
- ดีพเฟคเสียงของ CEO: ในกรณีหนึ่ง เสียงดีพเฟคถูกใช้เพื่อแอบอ้างเป็น CEO และหลอกลวงบริษัทให้สูญเสียเงินหลายแสนดอลลาร์
- ดีพเฟคของสมาชิกสภาผู้แทนราษฎร: วิดีโอที่ถูกปรับแต่งของสมาชิกสภาผู้แทนราษฎรสหรัฐฯ ทำให้ดูเหมือนว่าพวกเขาเมา
- ข่าวปลอม: ดีพเฟคถูกใช้ในการสร้างข่าวปลอม
- ดีพเฟคของคนดัง: ดีพเฟคหลายตัวมีคนดังในสถานการณ์ที่พวกเขาไม่เคยอยู่จริง ส่งผลต่อภาพลักษณ์สาธารณะของพวกเขา
- ดีพเฟคในการเลือกตั้งการเมือง: ดีพเฟคถูกใช้ในการแพร่กระจายข้อมูลเท็จในช่วงการเลือกตั้ง
- ดีพเฟคในวงการบันเทิง: ดีพเฟคถูกใช้ในการแทนที่นักแสดงในภาพยนตร์หรือรายการ ทำให้ผู้ชมเข้าใจผิด
- สัมภาษณ์สังเคราะห์: เทคโนโลยีดีพเฟคถูกใช้ในการสร้างสัมภาษณ์ที่ถูกสร้างขึ้นทั้งหมดกับบุคคลสาธารณะ
เครื่องมือสำหรับตรวจจับดีพเฟค
บริษัทอย่าง Microsoft และ Amazon กำลังพัฒนาเครื่องมือตรวจจับดีพเฟค เครื่องมือเหล่านี้มักใช้การเรียนรู้ของเครื่องในการวิเคราะห์เนื้อหาเสียง เสียงรบกวนพื้นหลัง และองค์ประกอบอื่น ๆ เพื่อกำหนดความถูกต้องของคลิปเสียงหรือการบันทึกเสียง ชุดข้อมูลที่ใช้มักประกอบด้วยทั้งเสียงจริงและเสียงที่สร้างขึ้นเทียม รวมถึงการบันทึกเสียงประเภทอื่น ๆ
ดังนั้น แม้ว่าดีพเฟคจะเป็นความท้าทายที่สำคัญในแง่ของการบิดเบือนข้อมูลและการฉ้อโกง แต่ก็มีความพยายามในการต่อต้านพวกมัน
9 เว็บไซต์เสียงดีพเฟคยอดนิยม:
- Descript’s Overdub
- คุณสมบัติ: การฝึกเสียงผู้ใช้ การโคลนนิ่งเสียงคุณภาพสูง หลายเสียง การตัดต่อพอดแคสต์ และการแปลงข้อความเป็นเสียง
- ค่าใช้จ่าย: เริ่มต้นที่ $14/เดือน
- Deepware Scanner
- คุณสมบัติ: การตรวจจับดีพเฟค การโคลนนิ่งเสียง อินเทอร์เฟซที่ใช้งานง่าย การประมวลผลที่ปลอดภัย และชุดข้อมูลที่กว้างขวาง
- ค่าใช้จ่าย: ใช้ฟรีพร้อมฟีเจอร์พรีเมียมที่มีค่าใช้จ่าย
- Modulate
- คุณสมบัติ: สกินเสียงเรียลไทม์ การรวมเกม การประมวลผลที่ปลอดภัย เสียงที่กำหนดเอง และไบโอเมตริกเสียง
- ค่าใช้จ่าย: ราคาขึ้นอยู่กับความต้องการ
- iSpeech
- คุณสมบัติ: การแปลงข้อความเป็นเสียง การโคลนนิ่งเสียง หลายภาษา การเข้าถึง API และเสียงที่กำหนดเอง
- ค่าใช้จ่าย: เริ่มต้นที่ $20/เดือน
- Deep Voice
- คุณสมบัติ: การประมวลผลที่รวดเร็ว การฝึกเสียงผู้ใช้ ผลลัพธ์คุณภาพสูง ตัวเลือกเสียงหลายแบบ และการรวม API
- ค่าใช้จ่าย: ขึ้นอยู่กับการใช้งาน
- Replica Studios
- คุณสมบัติ: การแทนที่การแสดงเสียง เสียงที่ขับเคลื่อนด้วย AI การรวมเกม การปรับแต่งเสียง และผลลัพธ์คุณภาพสตูดิโอ
- ค่าใช้จ่าย: รูปแบบการจ่ายตามการใช้งาน
- CereVoice Me
- คุณสมบัติ: การโคลนนิ่งเสียง กรณีการใช้งานด้านสุขภาพ อินเทอร์เฟซที่ง่าย การปรับแต่ง และโมเดลเสียงภาษาอังกฤษแบบสหราชอาณาจักร
- ค่าใช้จ่าย: เริ่มต้นที่ $1,500
- Sonantic
- คุณสมบัติ: การออกแบบเสียงสำหรับฮอลลีวูด เสียงที่เต็มไปด้วยอารมณ์ ฐานข้อมูลนักแสดงเสียง การป้อนสคริปต์ และการปรับแต่ง
- ค่าใช้จ่าย: ติดต่อเพื่อขอราคา
- WellSaid Labs
- คุณสมบัติ: เสียงที่ฟังดูเป็นธรรมชาติ การเข้าถึง API การสร้างที่รวดเร็ว การเลือกเสียงที่หลากหลาย และการรวมที่ง่าย
- ค่าใช้จ่าย: เริ่มต้นที่ $60/เดือน
ส่วนคำถามที่พบบ่อย:
เสียง AI สามารถตรวจจับได้หรือไม่?
ใช่ ด้วยซอฟต์แวร์เฉพาะทางและวิธีการตรวจจับดีพเฟค
คุณตรวจจับดีพเฟคได้อย่างไร?
วิเคราะห์เนื้อหาเสียง มองหาความไม่สอดคล้อง และใช้เครื่องมือ AI ในการตรวจจับ
ผู้คนใช้เครื่องมืออะไรในการทำเสียงดีพเฟค?
เครื่องมือเช่น Descript’s Overdub และ Replica Studios
ประโยชน์ของการใช้เสียงดีพเฟคคืออะไร?
ความบันเทิง การเข้าถึง การปรับแต่ง และการสร้างเนื้อหาโดยไม่ต้องใช้เสียงนักแสดงต้นฉบับ
ความเสี่ยงของดีพเฟคคืออะไร?
ข้อมูลเท็จ การหลอกลวง การปลอมแปลง และการใช้ในข่าวปลอม
สามารถพิสูจน์ว่าเสียงดีพเฟคเป็นของปลอมได้หรือไม่?
ได้ โดยการวิเคราะห์ทางนิติวิทยาศาสตร์และเครื่องมือ AI
ผลกระทบของเสียงดีพเฟคคืออะไร?
การสูญเสียความเชื่อถือ ผลทางกฎหมาย และการใช้ในหลอกลวง
ดีพเฟคทำงานอย่างไร?
ใช้การเรียนรู้ของเครื่องและอัลกอริธึมการเรียนรู้เชิงลึกเพื่อเลียนแบบเสียงจริง
วัตถุประสงค์ของเสียงดีพเฟคคืออะไร?
ตั้งแต่ความบันเทิงไปจนถึงผู้ช่วยเสียงส่วนตัว การใช้งานมีความหลากหลาย
เสียงดีพเฟคถูกใช้อย่างไร?
ในความบันเทิง สื่อสังเคราะห์ พอดแคสต์ และอาจใช้ในแคมเปญข้อมูลเท็จ
คลิฟ ไวซ์แมน
คลิฟ ไวซ์แมน เป็นผู้สนับสนุนด้านดิสเล็กเซียและเป็น CEO และผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับ 1 ของโลก ที่มีรีวิว 5 ดาวมากกว่า 100,000 รีวิว และครองอันดับหนึ่งใน App Store ในหมวดข่าวและนิตยสาร ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาในการทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอใน EdSurge, Inc., PC Mag, Entrepreneur, Mashable และสื่อชั้นนำอื่น ๆ