Social Proof

คู่มือฉบับสมบูรณ์เกี่ยวกับฟีเจอร์การโคลนเสียงส่วนตัวของ Apple

Speechify เป็นโปรแกรมสร้างเสียง AI อันดับ 1 สร้างเสียงบรรยายคุณภาพสูงในเวลาจริง บรรยายข้อความ วิดีโอ อธิบาย – ทุกอย่างที่คุณมี – ในสไตล์ใดก็ได้

กำลังมองหา โปรแกรมอ่านออกเสียงข้อความของเราอยู่หรือเปล่า?

แนะนำใน

forbes logocbs logotime magazine logonew york times logowall street logo

ฟังบทความนี้ด้วย Speechify!
Speechify

ฟีเจอร์โคลนเสียงของ Apple คืออะไร? เทคโนโลยีที่ล้ำสมัยนี้ช่วยให้ผู้ใช้ Apple สามารถโคลนเสียงของบุคคลโดยใช้ปัญญาประดิษฐ์ (AI) เปิดตัว...

ฟีเจอร์โคลนเสียงของ Apple คืออะไร? เทคโนโลยีที่ล้ำสมัยนี้ช่วยให้ผู้ใช้ Apple สามารถโคลนเสียงของบุคคลโดยใช้ปัญญาประดิษฐ์ (AI) เปิดตัวที่ WWDC 2023 ฟีเจอร์การเข้าถึงใหม่นี้ใช้การเรียนรู้ของเครื่องเพื่อสร้างเสียงสังเคราะห์ที่เลียนแบบเสียง โทน และการเน้นเสียงของคุณหรือคนที่คุณรักได้อย่างใกล้เคียง

ฟีเจอร์โคลนเสียงของ Apple คืออะไร?

ฟีเจอร์โคลนเสียงของ Apple เป็นความก้าวหน้าทางเทคโนโลยีที่นวัตกรรมซึ่งประกาศโดย Apple ที่ WWDC 2023 โดยใช้การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ (AI) ช่วยให้ผู้ใช้สามารถสร้างเสียงสังเคราะห์ของตนเองหรือของคนที่รักได้ เสียงที่โคลนสามารถใช้ในอุปกรณ์ Apple ต่างๆ สำหรับฟังก์ชันที่หลากหลาย

วิธีการโคลนเสียงของบุคคล?

การโคลนเสียงของบุคคลโดยใช้ฟีเจอร์โคลนเสียงของ Apple มีขั้นตอนดังนี้:

  • บันทึกเสียงหลายๆ นาทีที่บุคคลพูดอย่างเป็นธรรมชาติและชัดเจน
  • AI วิเคราะห์เสียงนี้เพื่อเข้าใจลักษณะเฉพาะและคุณสมบัติของเสียงผู้พูด
  • ระบบจะสร้างเสียงสังเคราะห์ที่เลียนแบบเสียงต้นฉบับให้ใกล้เคียงที่สุด

แนะนำให้ใช้เสียงสนทนาที่ชัดเจนและบันทึกด้วย iPhone, iPad หรือ Mac เพื่อผลลัพธ์ที่ดีที่สุด

Apple เปิดตัวการโคลนเสียงบนอุปกรณ์อย่างเป็นทางการหรือไม่?

ใช่ Apple ประกาศเปิดตัวการโคลนเสียงบนอุปกรณ์อย่างเป็นทางการที่ WWDC 2023 ฟีเจอร์นี้มุ่งเน้นการเพิ่มการเข้าถึงและออกแบบมาเพื่อช่วยผู้ใช้ที่มีความบกพร่องทางการรับรู้ เช่น ALS (Amyotrophic Lateral Sclerosis) ให้สามารถสื่อสารด้วยเสียงของตนเอง

คุณสามารถใช้การโคลนเสียงทำอะไรได้บ้าง?

การโคลนเสียงมีการใช้งานหลายอย่าง:

  • ปรับแต่งการโทรศัพท์และ Facetime
  • สร้างพอดแคสต์และเนื้อหาสื่อสังคมออนไลน์ด้วยเสียงของคุณเอง
  • ใช้งานฟีเจอร์ควบคุมด้วยเสียงเช่น Siri ด้วยเสียงของคุณ
  • สำหรับ 'การพูดสด' ในแอปที่รองรับฟีเจอร์แปลงข้อความเป็นเสียง

ความแตกต่างระหว่างการโคลนเสียงและการรู้จำเสียงคืออะไร?

การรู้จำเสียงเป็นเทคโนโลยีที่ระบุหรือยืนยันเสียงของบุคคล ใช้ในผู้ช่วยควบคุมด้วยเสียงเช่น Siri หรือ Google Assistant ในขณะที่การโคลนเสียงใช้ AI เพื่อสร้างเสียงสังเคราะห์ที่ฟังดูเหมือนเสียงของบุคคลเฉพาะ

ประโยชน์ของการใช้การโคลนเสียงคืออะไร?

ประโยชน์ของการโคลนเสียงคือ:

  • เพิ่มการเข้าถึงสำหรับบุคคลที่มีความบกพร่องทางการพูด
  • การโต้ตอบดิจิทัลที่เป็นส่วนตัวมากขึ้น
  • ช่วยให้การสื่อสารบนแพลตฟอร์มต่างๆ เป็นธรรมชาติและน่าสนใจยิ่งขึ้น

การโคลนเสียงทำงานอย่างไร?

การโคลนเสียงทำงานโดยใช้ AI และการเรียนรู้ของเครื่องเพื่อวิเคราะห์ลักษณะเฉพาะของเสียงบุคคลจากคลิปเสียงที่บันทึกไว้ ซึ่งรวมถึงระดับเสียง โทน และการเน้นเสียง AI จะสร้างเสียงสังเคราะห์ที่เลียนแบบลักษณะเหล่านี้ให้ใกล้เคียงที่สุด

คุณจะได้รับการโคลนเสียงของ Apple ได้อย่างไร?

ตามประกาศที่ WWDC 2023 คุณจะสามารถเข้าถึงฟีเจอร์การโคลนเสียงใน iOS 17 และ iPadOS บนอุปกรณ์ Apple เช่น iPhone, iPad, Mac และ Apple Watch กระบวนการเฉพาะและข้อกำหนดเบื้องต้นสำหรับการใช้ฟีเจอร์นี้จะมีการให้รายละเอียดโดย Apple ในเวลาที่เปิดตัวอย่างเป็นทางการ

แอปหรือซอฟต์แวร์โคลนเสียง 8 อันดับแรก นอกเหนือจากของ Apple เอง ได้แก่:

  1. Resemble AI: ให้บริการการสร้างเสียงและการแปลงข้อความเป็นเสียงคุณภาพสูงโดยใช้การเรียนรู้เชิงลึก
  2. Descript's Overdub: ช่วยให้คุณสามารถสร้างเสียงของตัวเองเพื่อแก้ไขพอดแคสต์หรือการบรรยายวิดีโอได้ง่ายขึ้น
  3. Microsoft's Custom Neural Voice: เครื่องมือที่ทรงพลังที่ให้การสังเคราะห์เสียงคุณภาพสูง
  4. CereProc: เป็นที่รู้จักในด้านการสนับสนุนภาษาที่หลากหลายและการสร้างเสียงที่มีอารมณ์
  5. iSpeech: เป็นที่นิยมสำหรับ API การแปลงข้อความเป็นเสียงและการสร้างเสียงบนคลาวด์
  6. Acapela's My-Own-Voice: ช่วยผู้ที่สูญเสียการพูดในการสร้างเสียงของตนเองในรูปแบบดิจิทัล
  7. Replica Studios: ใช้บ่อยในงานพากย์เสียงสำหรับการพัฒนาเกม
  8. Google's Tacotron: เครื่องมือโอเพนซอร์สที่แปลงข้อความเป็นเสียงโดยใช้การเรียนรู้ของเครื่อง

ด้วยแนวโน้มการสร้างเสียงที่กำลังเกิดขึ้น มีความกังวลเกี่ยวกับการใช้งานในทางที่ผิด เช่น ในการหลอกลวง ดังนั้นจึงจำเป็นต้องใช้เทคโนโลยีนี้อย่างรับผิดชอบ ควรมีกฎเกณฑ์ทางจริยธรรมเพื่อปกป้องผลประโยชน์ของบุคคลและป้องกันการใช้งานเสียงที่สร้างขึ้นในทางที่ผิด

ฟีเจอร์การเข้าถึงใหม่เข้ากันได้กับ iOS 17, iPadOS และอุปกรณ์ Apple ทั้งหมดรวมถึง Apple Watch และ MacBook การพัฒนาการเข้าถึงยังขยายไปถึงฟีเจอร์ Magnifier, ตัวเลือก 'Point and Speak' และแอป Vision Pro ที่ช่วยผู้ใช้ที่มีปัญหาทางสายตา แม้ว่าฟีเจอร์เสียงส่วนตัวจะไม่เชื่อมโยงโดยตรงกับเครื่องมือเหล่านี้ แต่ก็แสดงถึงความมุ่งมั่นของ Apple ในการพัฒนาการเข้าถึงของระบบนิเวศของตน

ในขณะที่ข่าวเทคโนโลยีที่กำลังเป็นที่นิยมนี้กำลังเผยแพร่ อย่าลืมถึงศักยภาพของฟีเจอร์นี้ในการกำหนดอนาคตของการสื่อสารดิจิทัล ไม่ว่าจะเป็นการช่วยให้ Philip Green สนทนา สร้างพอดแคสต์ที่น่าดื่มด่ำ หรือให้เสียงของคุณได้ยินในการโทร Facetime พลังของการสร้างเสียงอยู่ในมือคุณ

Cliff Weitzman

คลิฟ ไวซ์แมน

คลิฟ ไวซ์แมน เป็นผู้สนับสนุนด้านดิสเล็กเซียและเป็น CEO และผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับ 1 ของโลก ที่มีรีวิว 5 ดาวมากกว่า 100,000 รีวิว และครองอันดับหนึ่งใน App Store ในหมวดข่าวและนิตยสาร ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาในการทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอใน EdSurge, Inc., PC Mag, Entrepreneur, Mashable และสื่อชั้นนำอื่น ๆ