1. หน้าแรก
  2. การสร้างเสียงด้วย AI
  3. คู่มือฉบับสมบูรณ์เกี่ยวกับฟีเจอร์การโคลนเสียงส่วนตัวของ Apple

คู่มือฉบับสมบูรณ์เกี่ยวกับฟีเจอร์การโคลนเสียงส่วนตัวของ Apple

Cliff Weitzman

คลิฟ ไวซ์แมน

ซีอีโอ/ผู้ก่อตั้ง Speechify

#1 โปรแกรมอ่าน Text to Speech.
ให้ Speechify อ่านให้คุณฟัง

รางวัลออกแบบ Apple 2025
ผู้ใช้กว่า 50 ล้านคน
ฟังบทความนี้ด้วย Speechify!
speechify logo

ฟีเจอร์โคลนเสียงของ Apple คืออะไร? เทคโนโลยีที่ล้ำสมัยนี้ช่วยให้ผู้ใช้ Apple สามารถโคลนเสียงของบุคคลโดยใช้ปัญญาประดิษฐ์ (AI) เปิดตัวที่ WWDC 2023 ฟีเจอร์การเข้าถึงใหม่นี้ใช้การเรียนรู้ของเครื่องเพื่อสร้างเสียงสังเคราะห์ที่เลียนแบบเสียง โทน และการเน้นเสียงของคุณหรือคนที่คุณรักได้อย่างใกล้เคียง

ฟีเจอร์โคลนเสียงของ Apple คืออะไร?

ฟีเจอร์โคลนเสียงของ Apple เป็นความก้าวหน้าทางเทคโนโลยีที่นวัตกรรมซึ่งประกาศโดย Apple ที่ WWDC 2023 โดยใช้การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ (AI) ช่วยให้ผู้ใช้สามารถสร้างเสียงสังเคราะห์ของตนเองหรือของคนที่รักได้ เสียงที่โคลนสามารถใช้ในอุปกรณ์ Apple ต่างๆ สำหรับฟังก์ชันที่หลากหลาย

วิธีการโคลนเสียงของบุคคล?

การโคลนเสียงของบุคคลโดยใช้ฟีเจอร์โคลนเสียงของ Apple มีขั้นตอนดังนี้:

  • บันทึกเสียงหลายๆ นาทีที่บุคคลพูดอย่างเป็นธรรมชาติและชัดเจน
  • AI วิเคราะห์เสียงนี้เพื่อเข้าใจลักษณะเฉพาะและคุณสมบัติของเสียงผู้พูด
  • ระบบจะสร้างเสียงสังเคราะห์ที่เลียนแบบเสียงต้นฉบับให้ใกล้เคียงที่สุด

แนะนำให้ใช้เสียงสนทนาที่ชัดเจนและบันทึกด้วย iPhone, iPad หรือ Mac เพื่อผลลัพธ์ที่ดีที่สุด

Apple เปิดตัวการโคลนเสียงบนอุปกรณ์อย่างเป็นทางการหรือไม่?

ใช่ Apple ประกาศเปิดตัวการโคลนเสียงบนอุปกรณ์อย่างเป็นทางการที่ WWDC 2023 ฟีเจอร์นี้มุ่งเน้นการเพิ่มการเข้าถึงและออกแบบมาเพื่อช่วยผู้ใช้ที่มีความบกพร่องทางการรับรู้ เช่น ALS (Amyotrophic Lateral Sclerosis) ให้สามารถสื่อสารด้วยเสียงของตนเอง

คุณสามารถใช้การโคลนเสียงทำอะไรได้บ้าง?

การโคลนเสียงมีการใช้งานหลายอย่าง:

  • ปรับแต่งการโทรศัพท์และ Facetime
  • สร้างพอดแคสต์และเนื้อหาสื่อสังคมออนไลน์ด้วยเสียงของคุณเอง
  • ใช้งานฟีเจอร์ควบคุมด้วยเสียงเช่น Siri ด้วยเสียงของคุณ
  • สำหรับ 'การพูดสด' ในแอปที่รองรับฟีเจอร์แปลงข้อความเป็นเสียง

ความแตกต่างระหว่างการโคลนเสียงและการรู้จำเสียงคืออะไร?

การรู้จำเสียงเป็นเทคโนโลยีที่ระบุหรือยืนยันเสียงของบุคคล ใช้ในผู้ช่วยควบคุมด้วยเสียงเช่น Siri หรือ Google Assistant ในขณะที่การโคลนเสียงใช้ AI เพื่อสร้างเสียงสังเคราะห์ที่ฟังดูเหมือนเสียงของบุคคลเฉพาะ

ประโยชน์ของการใช้การโคลนเสียงคืออะไร?

ประโยชน์ของการโคลนเสียงคือ:

  • เพิ่มการเข้าถึงสำหรับบุคคลที่มีความบกพร่องทางการพูด
  • การโต้ตอบดิจิทัลที่เป็นส่วนตัวมากขึ้น
  • ช่วยให้การสื่อสารบนแพลตฟอร์มต่างๆ เป็นธรรมชาติและน่าสนใจยิ่งขึ้น

การโคลนเสียงทำงานอย่างไร?

การโคลนเสียงทำงานโดยใช้ AI และการเรียนรู้ของเครื่องเพื่อวิเคราะห์ลักษณะเฉพาะของเสียงบุคคลจากคลิปเสียงที่บันทึกไว้ ซึ่งรวมถึงระดับเสียง โทน และการเน้นเสียง AI จะสร้างเสียงสังเคราะห์ที่เลียนแบบลักษณะเหล่านี้ให้ใกล้เคียงที่สุด

คุณจะได้รับการโคลนเสียงของ Apple ได้อย่างไร?

ตามประกาศที่ WWDC 2023 คุณจะสามารถเข้าถึงฟีเจอร์การโคลนเสียงใน iOS 17 และ iPadOS บนอุปกรณ์ Apple เช่น iPhone, iPad, Mac และ Apple Watch กระบวนการเฉพาะและข้อกำหนดเบื้องต้นสำหรับการใช้ฟีเจอร์นี้จะมีการให้รายละเอียดโดย Apple ในเวลาที่เปิดตัวอย่างเป็นทางการ

แอปหรือซอฟต์แวร์โคลนเสียง 8 อันดับแรก นอกเหนือจากของ Apple เอง ได้แก่:

  1. Resemble AI: ให้บริการการสร้างเสียงและการแปลงข้อความเป็นเสียงคุณภาพสูงโดยใช้การเรียนรู้เชิงลึก
  2. Descript's Overdub: ช่วยให้คุณสามารถสร้างเสียงของตัวเองเพื่อแก้ไขพอดแคสต์หรือการบรรยายวิดีโอได้ง่ายขึ้น
  3. Microsoft's Custom Neural Voice: เครื่องมือที่ทรงพลังที่ให้การสังเคราะห์เสียงคุณภาพสูง
  4. CereProc: เป็นที่รู้จักในด้านการสนับสนุนภาษาที่หลากหลายและการสร้างเสียงที่มีอารมณ์
  5. iSpeech: เป็นที่นิยมสำหรับ API การแปลงข้อความเป็นเสียงและการสร้างเสียงบนคลาวด์
  6. Acapela's My-Own-Voice: ช่วยผู้ที่สูญเสียการพูดในการสร้างเสียงของตนเองในรูปแบบดิจิทัล
  7. Replica Studios: ใช้บ่อยในงานพากย์เสียงสำหรับการพัฒนาเกม
  8. Google's Tacotron: เครื่องมือโอเพนซอร์สที่แปลงข้อความเป็นเสียงโดยใช้การเรียนรู้ของเครื่อง

ด้วยแนวโน้มการสร้างเสียงที่กำลังเกิดขึ้น มีความกังวลเกี่ยวกับการใช้งานในทางที่ผิด เช่น ในการหลอกลวง ดังนั้นจึงจำเป็นต้องใช้เทคโนโลยีนี้อย่างรับผิดชอบ ควรมีกฎเกณฑ์ทางจริยธรรมเพื่อปกป้องผลประโยชน์ของบุคคลและป้องกันการใช้งานเสียงที่สร้างขึ้นในทางที่ผิด

ฟีเจอร์การเข้าถึงใหม่เข้ากันได้กับ iOS 17, iPadOS และอุปกรณ์ Apple ทั้งหมดรวมถึง Apple Watch และ MacBook การพัฒนาการเข้าถึงยังขยายไปถึงฟีเจอร์ Magnifier, ตัวเลือก 'Point and Speak' และแอป Vision Pro ที่ช่วยผู้ใช้ที่มีปัญหาทางสายตา แม้ว่าฟีเจอร์เสียงส่วนตัวจะไม่เชื่อมโยงโดยตรงกับเครื่องมือเหล่านี้ แต่ก็แสดงถึงความมุ่งมั่นของ Apple ในการพัฒนาการเข้าถึงของระบบนิเวศของตน

ในขณะที่ข่าวเทคโนโลยีที่กำลังเป็นที่นิยมนี้กำลังเผยแพร่ อย่าลืมถึงศักยภาพของฟีเจอร์นี้ในการกำหนดอนาคตของการสื่อสารดิจิทัล ไม่ว่าจะเป็นการช่วยให้ Philip Green สนทนา สร้างพอดแคสต์ที่น่าดื่มด่ำ หรือให้เสียงของคุณได้ยินในการโทร Facetime พลังของการสร้างเสียงอยู่ในมือคุณ

เพลิดเพลินกับเสียง AI ที่ล้ำสมัยที่สุด ไฟล์ไม่จำกัด และการสนับสนุนตลอด 24/7

ทดลองฟรี
tts banner for blog

แชร์บทความนี้

Cliff Weitzman

คลิฟ ไวซ์แมน

ซีอีโอ/ผู้ก่อตั้ง Speechify

คลิฟ ไวซ์แมน เป็นผู้สนับสนุนผู้มีภาวะดิสเล็กเซียและซีอีโอผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับหนึ่งของโลก ซึ่งได้รับรีวิว 5 ดาวมากกว่า 100,000 ครั้ง และครองอันดับหนึ่งในหมวดข่าวและนิตยสารบน App Store ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาที่ทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอในสื่อชั้นนำต่างๆ เช่น EdSurge, Inc., PC Mag, Entrepreneur, Mashable เป็นต้น