1. หน้าแรก
  2. การสร้างเสียงด้วย AI
  3. คู่มือฉบับสมบูรณ์เกี่ยวกับฟีเจอร์การโคลนเสียงส่วนตัวของ Apple

คู่มือฉบับสมบูรณ์เกี่ยวกับฟีเจอร์การโคลนเสียงส่วนตัวของ Apple

Cliff Weitzman

คลิฟ ไวซ์แมน

ซีอีโอ/ผู้ก่อตั้ง Speechify

#1 โปรแกรมอ่าน Text to Speech.
ให้ Speechify อ่านให้คุณฟัง

apple logoรางวัลออกแบบยอดเยี่ยมจาก Apple ปี 2025
ผู้ใช้กว่า 50 ล้านคน
ฟังบทความนี้ด้วย Speechify!
speechify logo

ฟีเจอร์โคลนเสียงของ Apple คืออะไร? เทคโนโลยีที่ล้ำสมัยนี้ช่วยให้ผู้ใช้ Apple สามารถโคลนเสียงของบุคคลโดยใช้ปัญญาประดิษฐ์ (AI) เปิดตัวที่ WWDC 2023 ฟีเจอร์การเข้าถึงใหม่นี้ใช้การเรียนรู้ของเครื่องเพื่อสร้างเสียงสังเคราะห์ที่เลียนแบบเสียง โทน และการเน้นเสียงของคุณหรือคนที่คุณรักได้อย่างใกล้เคียง

ฟีเจอร์โคลนเสียงของ Apple คืออะไร?

ฟีเจอร์โคลนเสียงของ Apple เป็นความก้าวหน้าทางเทคโนโลยีที่นวัตกรรมซึ่งประกาศโดย Apple ที่ WWDC 2023 โดยใช้การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ (AI) ช่วยให้ผู้ใช้สามารถสร้างเสียงสังเคราะห์ของตนเองหรือของคนที่รักได้ เสียงที่โคลนสามารถใช้ในอุปกรณ์ Apple ต่างๆ สำหรับฟังก์ชันที่หลากหลาย

วิธีการโคลนเสียงของบุคคล?

การโคลนเสียงของบุคคลโดยใช้ฟีเจอร์โคลนเสียงของ Apple มีขั้นตอนดังนี้:

  • บันทึกเสียงหลายๆ นาทีที่บุคคลพูดอย่างเป็นธรรมชาติและชัดเจน
  • AI วิเคราะห์เสียงนี้เพื่อเข้าใจลักษณะเฉพาะและคุณสมบัติของเสียงผู้พูด
  • ระบบจะสร้างเสียงสังเคราะห์ที่เลียนแบบเสียงต้นฉบับให้ใกล้เคียงที่สุด

แนะนำให้ใช้เสียงสนทนาที่ชัดเจนและบันทึกด้วย iPhone, iPad หรือ Mac เพื่อผลลัพธ์ที่ดีที่สุด

Apple เปิดตัวการโคลนเสียงบนอุปกรณ์อย่างเป็นทางการหรือไม่?

ใช่ Apple ประกาศเปิดตัวการโคลนเสียงบนอุปกรณ์อย่างเป็นทางการที่ WWDC 2023 ฟีเจอร์นี้มุ่งเน้นการเพิ่มการเข้าถึงและออกแบบมาเพื่อช่วยผู้ใช้ที่มีความบกพร่องทางการรับรู้ เช่น ALS (Amyotrophic Lateral Sclerosis) ให้สามารถสื่อสารด้วยเสียงของตนเอง

คุณสามารถใช้การโคลนเสียงทำอะไรได้บ้าง?

การโคลนเสียงมีการใช้งานหลายอย่าง:

  • ปรับแต่งการโทรศัพท์และ Facetime
  • สร้างพอดแคสต์และเนื้อหาสื่อสังคมออนไลน์ด้วยเสียงของคุณเอง
  • ใช้งานฟีเจอร์ควบคุมด้วยเสียงเช่น Siri ด้วยเสียงของคุณ
  • สำหรับ 'การพูดสด' ในแอปที่รองรับฟีเจอร์แปลงข้อความเป็นเสียง

ความแตกต่างระหว่างการโคลนเสียงและการรู้จำเสียงคืออะไร?

การรู้จำเสียงเป็นเทคโนโลยีที่ระบุหรือยืนยันเสียงของบุคคล ใช้ในผู้ช่วยควบคุมด้วยเสียงเช่น Siri หรือ Google Assistant ในขณะที่การโคลนเสียงใช้ AI เพื่อสร้างเสียงสังเคราะห์ที่ฟังดูเหมือนเสียงของบุคคลเฉพาะ

ประโยชน์ของการใช้การโคลนเสียงคืออะไร?

ประโยชน์ของการโคลนเสียงคือ:

  • เพิ่มการเข้าถึงสำหรับบุคคลที่มีความบกพร่องทางการพูด
  • การโต้ตอบดิจิทัลที่เป็นส่วนตัวมากขึ้น
  • ช่วยให้การสื่อสารบนแพลตฟอร์มต่างๆ เป็นธรรมชาติและน่าสนใจยิ่งขึ้น

การโคลนเสียงทำงานอย่างไร?

การโคลนเสียงทำงานโดยใช้ AI และการเรียนรู้ของเครื่องเพื่อวิเคราะห์ลักษณะเฉพาะของเสียงบุคคลจากคลิปเสียงที่บันทึกไว้ ซึ่งรวมถึงระดับเสียง โทน และการเน้นเสียง AI จะสร้างเสียงสังเคราะห์ที่เลียนแบบลักษณะเหล่านี้ให้ใกล้เคียงที่สุด

คุณจะได้รับการโคลนเสียงของ Apple ได้อย่างไร?

ตามประกาศที่ WWDC 2023 คุณจะสามารถเข้าถึงฟีเจอร์การโคลนเสียงใน iOS 17 และ iPadOS บนอุปกรณ์ Apple เช่น iPhone, iPad, Mac และ Apple Watch กระบวนการเฉพาะและข้อกำหนดเบื้องต้นสำหรับการใช้ฟีเจอร์นี้จะมีการให้รายละเอียดโดย Apple ในเวลาที่เปิดตัวอย่างเป็นทางการ

แอปหรือซอฟต์แวร์โคลนเสียง 8 อันดับแรก นอกเหนือจากของ Apple เอง ได้แก่:

  1. Resemble AI: ให้บริการการสร้างเสียงและการแปลงข้อความเป็นเสียงคุณภาพสูงโดยใช้การเรียนรู้เชิงลึก
  2. Descript's Overdub: ช่วยให้คุณสามารถสร้างเสียงของตัวเองเพื่อแก้ไขพอดแคสต์หรือการบรรยายวิดีโอได้ง่ายขึ้น
  3. Microsoft's Custom Neural Voice: เครื่องมือที่ทรงพลังที่ให้การสังเคราะห์เสียงคุณภาพสูง
  4. CereProc: เป็นที่รู้จักในด้านการสนับสนุนภาษาที่หลากหลายและการสร้างเสียงที่มีอารมณ์
  5. iSpeech: เป็นที่นิยมสำหรับ API การแปลงข้อความเป็นเสียงและการสร้างเสียงบนคลาวด์
  6. Acapela's My-Own-Voice: ช่วยผู้ที่สูญเสียการพูดในการสร้างเสียงของตนเองในรูปแบบดิจิทัล
  7. Replica Studios: ใช้บ่อยในงานพากย์เสียงสำหรับการพัฒนาเกม
  8. Google's Tacotron: เครื่องมือโอเพนซอร์สที่แปลงข้อความเป็นเสียงโดยใช้การเรียนรู้ของเครื่อง

ด้วยแนวโน้มการสร้างเสียงที่กำลังเกิดขึ้น มีความกังวลเกี่ยวกับการใช้งานในทางที่ผิด เช่น ในการหลอกลวง ดังนั้นจึงจำเป็นต้องใช้เทคโนโลยีนี้อย่างรับผิดชอบ ควรมีกฎเกณฑ์ทางจริยธรรมเพื่อปกป้องผลประโยชน์ของบุคคลและป้องกันการใช้งานเสียงที่สร้างขึ้นในทางที่ผิด

ฟีเจอร์การเข้าถึงใหม่เข้ากันได้กับ iOS 17, iPadOS และอุปกรณ์ Apple ทั้งหมดรวมถึง Apple Watch และ MacBook การพัฒนาการเข้าถึงยังขยายไปถึงฟีเจอร์ Magnifier, ตัวเลือก 'Point and Speak' และแอป Vision Pro ที่ช่วยผู้ใช้ที่มีปัญหาทางสายตา แม้ว่าฟีเจอร์เสียงส่วนตัวจะไม่เชื่อมโยงโดยตรงกับเครื่องมือเหล่านี้ แต่ก็แสดงถึงความมุ่งมั่นของ Apple ในการพัฒนาการเข้าถึงของระบบนิเวศของตน

ในขณะที่ข่าวเทคโนโลยีที่กำลังเป็นที่นิยมนี้กำลังเผยแพร่ อย่าลืมถึงศักยภาพของฟีเจอร์นี้ในการกำหนดอนาคตของการสื่อสารดิจิทัล ไม่ว่าจะเป็นการช่วยให้ Philip Green สนทนา สร้างพอดแคสต์ที่น่าดื่มด่ำ หรือให้เสียงของคุณได้ยินในการโทร Facetime พลังของการสร้างเสียงอยู่ในมือคุณ

เพลิดเพลินกับเสียง AI ที่ล้ำสมัยที่สุด ไฟล์ไม่จำกัด และการสนับสนุนตลอด 24/7

ทดลองฟรี
tts banner for blog

แชร์บทความนี้

Cliff Weitzman

คลิฟ ไวซ์แมน

ซีอีโอ/ผู้ก่อตั้ง Speechify

คลิฟ ไวซ์แมน เป็นผู้สนับสนุนผู้มีภาวะดิสเล็กเซียและซีอีโอผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับหนึ่งของโลก ซึ่งได้รับรีวิว 5 ดาวมากกว่า 100,000 ครั้ง และครองอันดับหนึ่งในหมวดข่าวและนิตยสารบน App Store ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาที่ทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอในสื่อชั้นนำต่างๆ เช่น EdSurge, Inc., PC Mag, Entrepreneur, Mashable เป็นต้น

speechify logo

เกี่ยวกับ Speechify

#1 โปรแกรมอ่าน Text to Speech

Speechify เป็นแพลตฟอร์ม แปลงข้อความเป็นเสียง ชั้นนำของโลกที่มีผู้ใช้มากกว่า 50 ล้านคนและได้รับรีวิวระดับห้าดาวมากกว่า 500,000 รีวิวในแอปพลิเคชัน iOS, Android, Chrome Extension, เว็บแอป และ แอปบน Mac ในปี 2025 Apple ได้มอบรางวัล Apple Design Award ให้กับ Speechify ที่ WWDC โดยเรียกมันว่า “ทรัพยากรสำคัญที่ช่วยให้ผู้คนใช้ชีวิตได้ดีขึ้น” Speechify มีเสียงที่ฟังดูเป็นธรรมชาติกว่า 1,000 เสียงในกว่า 60 ภาษาและถูกใช้ในเกือบ 200 ประเทศ เสียงของคนดังที่มีให้เลือกได้แก่ Snoop Dogg, Mr. Beast และ Gwyneth Paltrow สำหรับผู้สร้างและธุรกิจ Speechify Studio มีเครื่องมือขั้นสูงรวมถึง AI Voice Generator, AI Voice Cloning, AI Dubbing และ AI Voice Changer Speechify ยังสนับสนุนผลิตภัณฑ์ชั้นนำด้วย text to speech API ที่มีคุณภาพสูงและคุ้มค่า ได้รับการนำเสนอใน The Wall Street Journal, CNBC, Forbes, TechCrunch และสื่อข่าวใหญ่ๆ อื่นๆ Speechify เป็นผู้ให้บริการแปลงข้อความเป็นเสียงที่ใหญ่ที่สุดในโลก เยี่ยมชม speechify.com/news, speechify.com/blog และ speechify.com/press เพื่อเรียนรู้เพิ่มเติม