Social Proof

แปลงภาพเป็นเสียง—วิธีถ่ายภาพหน้าเอกสารแล้วให้ระบบอ่านออกเสียง

Speechify เป็นโปรแกรมอ่านเสียงอันดับ 1 ของโลก อ่านหนังสือ เอกสาร บทความ PDF อีเมล - ทุกอย่างที่คุณอ่าน - ได้เร็วขึ้น

แนะนำใน

forbes logocbs logotime magazine logonew york times logowall street logo
ฟังบทความนี้ด้วย Speechify!
Speechify

เรียนรู้พื้นฐานของการแปลงภาพเป็นเสียง - วิธีถ่ายภาพหน้าเอกสารแล้วให้ระบบอ่านออกเสียงได้บนอุปกรณ์มือถือหรือคอมพิวเตอร์ทุกระบบปฏิบัติการ

แปลงภาพเป็นเสียง—วิธีถ่ายภาพหน้าเอกสารแล้วให้ระบบอ่านออกเสียง

เครื่องอ่าน TTS กำลังเป็นที่ต้องการสูง แต่ไม่ได้หมายความว่าเทคโนโลยี แปลงข้อความเป็นเสียง ทุกชนิดจะให้ประสิทธิภาพเหมือนกัน เครื่องอ่าน TTS หลายตัวสามารถประมวลผลข้อความดิจิทัลจากเอกสาร Microsoft Word หน้าเว็บ HTML หรือข้อความที่คัดลอกมาจากไฟล์อื่น ๆ แต่มีเพียงไม่กี่ตัวที่สามารถแปลงข้อความดิจิทัลที่ล็อกไว้และข้อความจากภาพให้เป็นเสียงบรรยายที่ฟังดูเป็นธรรมชาติได้ ซึ่งต้องใช้การรู้จำอักขระด้วยแสง (OCR)

OCR คืออะไร?

OCR หรือการรู้จำอักขระด้วยแสง เป็นเทคโนโลยีที่ออกแบบมาเพื่อการดึงข้อมูลเฉพาะทาง มีการใช้งานในธุรกิจและความบันเทิงมากมาย เทคโนโลยีนี้มักมีสองส่วนประกอบ คือ ส่วนฮาร์ดแวร์สำหรับสแกนภาพ และส่วนซอฟต์แวร์สำหรับดึงและปรับใช้ข้อมูล แต่ส่วนซอฟต์แวร์เป็นส่วนที่น่าตื่นเต้นและซับซ้อนที่สุด ซอฟต์แวร์ OCR สามารถแยกแยะตัวอักษรและคำทั้งหมดและจัดเรียงเป็นประโยค นอกจากนี้ยังช่วยให้ผู้ใช้แก้ไขเนื้อหาที่ล็อกไว้เดิมได้ คล้ายกับการแก้ไขไฟล์ PDF ที่มีเนื้อหาข้อความล็อกไว้

OCR ทำงานอย่างไร

กระบวนการจริงนั้นน่าทึ่ง แม้ว่าจะมีวิธีการสองสีอื่น ๆ อยู่ แต่ซอฟต์แวร์ OCR จะเปลี่ยนเอกสารทางกายภาพให้เป็นสำเนาดิจิทัลขาวดำ จากนั้นแอป OCR จะวิเคราะห์พื้นที่มืดและสว่างในภาพ โดยรู้ว่าพื้นที่มืดเป็นตัวแทนของอักขระ ขึ้นอยู่กับความซับซ้อนของซอฟต์แวร์ มันสามารถมุ่งเน้นไปที่อักขระ คำ หรือบล็อกข้อความพร้อมกัน จากนั้นซอฟต์แวร์จะระบุอักขระโดยใช้การรู้จำคุณลักษณะหรืออัลกอริธึมการรู้จำรูปแบบ อัลกอริธึมการตรวจจับคุณลักษณะใช้กระบวนการที่ซับซ้อนมากขึ้นที่เกี่ยวข้องกับการเชื่อมโยงเส้นและโค้งและการแปลงรหัส ASCII ไม่ว่าอัลกอริธึมของแอป OCR จะเป็นอย่างไร มันจะวิเคราะห์โครงสร้างเอกสารเพื่อแยกแยะระหว่างข้อความ ตาราง รูปภาพ และองค์ประกอบอื่น ๆ เพื่อให้สิ่งที่ดึงออกมาได้คือข้อความเท่านั้น ประโยชน์หลักของเทคโนโลยีนี้คือความสามารถในการนำหนังสือนิยายปกอ่อน เอกสารทางกายภาพ และตำราเรียนที่เป็นสำเนาแข็งและแปลงแต่ละหน้าให้เป็นข้อความดิจิทัลที่เครื่องอ่านได้ เทคนิคการประมวลผลขั้นสูงนี้มีพลังในตัวเองอยู่แล้ว มันสามารถทำให้กระบวนการป้อนข้อมูลเป็นอัตโนมัติและปรับปรุงการทำงานในหลายอุตสาหกรรม อย่างไรก็ตาม มันให้ข้อได้เปรียบมากยิ่งขึ้นเมื่อรวมกับปัญญาประดิษฐ์ (AI) และอัลกอริธึมการเรียนรู้ของเครื่อง OCR ที่เปิดใช้งาน AI สามารถไปไกลกว่าการประมวลผลข้อความมาตรฐานและระบุภาษาต่าง ๆ รูปแบบลายมือ ฯลฯ เมื่อรวมกับเทคโนโลยีแปลงข้อความเป็นเสียง ซอฟต์แวร์ OCR สามารถสแกนเอกสารทางกายภาพ ประมวลผลข้อความ และอนุญาตให้ เครื่องอ่าน TTS แปลงข้อความดิจิทัลนั้นเป็นเสียง

การใช้งาน OCR แปลงข้อความเป็นเสียง

การรวมเทคโนโลยี OCR และ TTS เปิดโอกาสมากมายในการทำให้ข้อมูลเข้าถึงได้ง่ายขึ้นและบริโภคได้ในสถานการณ์ต่าง ๆ นี่คือการใช้งานบางส่วนของ OCR แปลงข้อความเป็นเสียง:

  • เทคโนโลยีช่วยเหลือสำหรับผู้พิการทางสายตา: แปลงเนื้อหาที่เขียนจากหนังสือ เอกสาร หรือหน้าจอเป็นคำพูด ช่วยให้ผู้พิการทางสายตาหรือคนตาบอด "อ่าน" เนื้อหาได้
  • การเรียนรู้และการศึกษา:
    • ช่วยนักเรียนที่มีปัญหาด้านการอ่าน: ช่วยนักเรียนที่มีปัญหาด้านการอ่านหรือดิสเล็กเซียโดยแปลงข้อความที่เขียนเป็นเสียง
    • การเรียนรู้หลายรูปแบบ: ช่วยให้ผู้เรียนสามารถอ่านและฟังเนื้อหาได้พร้อมกัน เพิ่มความเข้าใจและการจดจำ
  • การแปลและการเรียนรู้ภาษา: แปลงข้อความภาษาต่างประเทศที่เขียนเป็นคำพูด ช่วยในการออกเสียงและความเข้าใจ
  • การบริโภคเนื้อหาดิจิทัล: แปลงหนังสือ บทความข่าว และเนื้อหาข้อความที่พิมพ์อื่น ๆ เป็นหนังสือเสียงหรือพอดแคสต์สำหรับการบริโภคขณะเดินทาง
  • การเข้าถึงเอกสาร: ทำให้ PDF เอกสารที่สแกน และรูปแบบที่ไม่สามารถแก้ไขได้อื่น ๆ เข้าถึงได้สำหรับผู้ที่ชอบหรือจำเป็นต้องใช้เนื้อหาเสียง
  • การวิเคราะห์เอกสารประวัติศาสตร์: แปลงต้นฉบับเก่าหรือเอกสารจดหมายเหตุเป็นเนื้อหาเสียงสำหรับนักวิจัยหรือผู้ที่สนใจฟังข้อความประวัติศาสตร์
  • ธุรกิจและการเพิ่มประสิทธิภาพ: แปลงรายงานที่พิมพ์ที่ไม่ใช่ดิจิทัลเป็นเนื้อหาที่พูดได้สำหรับมืออาชีพที่ยุ่ง
  • การตรวจสอบข้อผิดพลาด: ช่วยให้นักเขียนหรือนักแก้ไขระบุข้อผิดพลาดในเนื้อหาที่เขียนบนกระดาษโดยการฟัง
  • ความบันเทิง: แปลงหนังสือการ์ตูน นิยายภาพ หรือสื่อที่เน้นภาพอื่น ๆ เป็นประสบการณ์การฟัง

วิธีอ่านข้อความจากภาพออกเสียง

ไม่ใช่ผู้ใช้ทุกคนของอุปกรณ์มือถือ Apple และ Android ที่รู้ว่าแอปของพวกเขาอาจมีเทคโนโลยี OCR และเครื่องอ่าน TTS ที่สามารถทำงานแปลงข้อความเป็นเสียงได้ง่าย ๆ ลองพิจารณาคุณสมบัติ TTS ที่มีอยู่ในตัวเหมือนแอปที่อ่านให้คุณฟังฟรี หรือเหมือนแอปฟรีที่อ่านข้อความจากกล้อง แต่คุณภาพของมันไม่ดีเท่าซอฟต์แวร์แปลงข้อความเป็นเสียงขั้นสูง นี่คือวิธีการเข้าถึงเครื่องอ่านข้อความจากภาพบนอุปกรณ์ Android และ Apple:

Android

อุปกรณ์ Android ที่ใช้ระบบปฏิบัติการ Android 12 ขึ้นไปจะมีเครื่องอ่าน TTS ในตัว เป็นเครื่องมือที่มีประโยชน์สำหรับการนำทาง การอ่านฟอนต์ขนาดเล็ก ฯลฯ แต่คุณยังสามารถใช้มันเพื่ออ่านข้อความจากภาพได้อีกด้วย นี่คือวิธีการตั้งค่าอุปกรณ์ของคุณ:

  • ไปที่เมนู “การช่วยการเข้าถึง” ผ่านแอป “การตั้งค่า”
  • เปิดใช้งานตัวเลือก “เลือกเพื่อพูด”
  • ไปที่แท็บ “การตั้งค่า” ของเครื่องอ่าน TTS และเปิดใช้งานตัวเลือก “อ่านข้อความบนภาพ”
  • กลับไปที่หน้าจอหลักและเปิดแอป “กล้อง”
  • ชี้กล้องไปที่หนังสือ หนังสือพิมพ์ หรือหน้าจออื่นที่มีข้อความดิจิทัล
  • แตะปุ่ม “เลือกเพื่อพูด” ก่อนแตะที่คำในแอป “กล้อง”

เครื่องอ่าน TTS ของ Android จะเริ่มบรรยายจากคำที่ไฮไลต์ คุณสามารถเลือกข้อความเป็นชิ้นๆ โดยลากนิ้วของคุณข้ามหน้าจอเพื่อทำการเลือก เช่นเดียวกับการใช้โปรแกรมประมวลผลคำ

Apple

การอ่านข้อความทางกายภาพออกเสียงด้วย iPhone ต้องใช้กล้องที่ใช้งานได้ iOS 15 ขึ้นไป และเปิดใช้งานเครื่องอ่าน TTS ในตัว

  • ไปที่แท็บ “การช่วยการเข้าถึง” จากเมนู “การตั้งค่า”
  • แตะที่ฟีเจอร์ “เนื้อหาที่พูด”
  • เปิดใช้งานตัวเลือก “พูดการเลือก” และ “พูดหน้าจอ”
  • กลับไปที่หน้าจอหลักและเปิดกล้อง
  • ชี้กล้องไปที่หน้าและรอให้ปุ่ม “ข้อความสด” ปรากฏบนแถบเครื่องมือด้านล่าง
  • แตะปุ่มเพื่อเปิดใช้งานการอ่านหน้าจอ OCR
  • ปัดลงด้วยสองนิ้วเพื่อเริ่มอ่านจากด้านบนของหน้า
  • แตะคำหรือทำการเลือกบนหน้าจอเพื่ออ่านออกเสียงคำ ประโยค หรือย่อหน้าเฉพาะ

เช่นเดียวกับอุปกรณ์ Android, iPads และ iPhones มีความสามารถ OCR และ TTS ที่จำกัด แม้ว่าความแม่นยำในการประมวลผลคำจะสูงกว่าค่าเฉลี่ย แต่คุณภาพเสียงยังไม่ดีเนื่องจากลักษณะเสียงที่เป็นหุ่นยนต์

Speechify—TTS ที่ดีที่สุดพร้อมเทคโนโลยี OCR

แม้ว่าเครื่องอ่าน TTS ในตัวและซอฟต์แวร์ OCR จะเป็นสิ่งที่ดีที่มีในอุปกรณ์มือถือ แต่คุณภาพและประสิทธิภาพยังไม่ค่อยน่าประทับใจ โชคดีที่คุณมีแอปอ่านข้อความทางเลือก Speechify เป็น เครื่องอ่านข้อความเป็นเสียง ที่รวมเทคโนโลยี OCR และเสียงที่สร้างโดย AI คุณภาพสูง ฟังก์ชันการทำงานของมันเกินกว่าที่เครื่องอ่านข้อความมือถือทั่วไปจะทำได้ และสามารถสแกนหนังสือและเอกสารทางกายภาพทั้งหมดเพื่อประมวลผลข้อความทางกายภาพเป็นข้อความดิจิทัล จากนั้นอัลกอริธึมที่ซับซ้อนจะสร้างเสียงที่ฟังดูเป็นธรรมชาติที่คุณสามารถควบคุมและปรับให้เข้ากับความเร็วในการอ่านที่คุณต้องการ ซอฟต์แวร์ Speechify text to speech มีให้บริการบนแพลตฟอร์มต่อไปนี้:

ไม่ว่าคุณจะได้รับจาก Apple App Store หรือ Google Play Store หรือดาวน์โหลดเวอร์ชันเดสก์ท็อป Mac หรือส่วนขยายเบราว์เซอร์ Chrome ใบอนุญาตเดียวก็เพียงพอที่จะใช้ Speechify บนอุปกรณ์เดสก์ท็อปและมือถือทั้งหมดของคุณ อินเทอร์เฟซที่ใช้งานง่ายดึงดูดผู้ใช้ทุกกลุ่มอายุและพื้นฐานทางเทคนิค การสแกน OCR ของ Speechify มีให้สำหรับการอ่านออนไลน์แบบเรียลไทม์ หรือคุณสามารถแปลงไฟล์ PDF ภาพหน้าจอ และภาพอื่นๆ เป็นไฟล์เสียงที่มีบิตเรตสูงและฟังแบบออฟไลน์ตามจังหวะของคุณเอง ออกแบบมาสำหรับผู้ใช้ที่มีภาวะดิสเล็กเซีย ความบกพร่องในการอ่าน การมองเห็นบกพร่อง และผู้ที่ทำหลายอย่างพร้อมกัน เทคโนโลยีช่วยเหลือของ Speechify ทำได้มากกว่าการอ่านหน้าจอเต็มรูปแบบทั่วไป มันคือแอปที่คุณต้องการเพื่อเปลี่ยนข้อความดิจิทัลและทางกายภาพให้เป็น หนังสือเสียง สร้างพอดแคสต์ และพัฒนาทักษะการอ่านของคุณด้วยความพยายามน้อยลงและมีสมาธิมากขึ้น ลองใช้ Speechify ฟรี แอปข้อความเป็นเสียงและปรับแต่งประสบการณ์การอ่านที่ดื่มด่ำ SEO Title: Photo Text to Speech – วิธีถ่ายภาพหน้าและให้มันอ่านออกเสียง SEO Description: เรียนรู้พื้นฐานของข้อความภาพเป็นเสียง - วิธีถ่ายภาพหน้าและให้มันอ่านออกเสียงบนอุปกรณ์มือถือหรือเดสก์ท็อปและระบบปฏิบัติการใด ๆ

Cliff Weitzman

คลิฟ ไวซ์แมน

คลิฟ ไวซ์แมน เป็นผู้สนับสนุนด้านดิสเล็กเซียและเป็น CEO และผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับ 1 ของโลก ที่มีรีวิว 5 ดาวมากกว่า 100,000 รีวิว และครองอันดับหนึ่งใน App Store ในหมวดข่าวและนิตยสาร ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาในการทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอใน EdSurge, Inc., PC Mag, Entrepreneur, Mashable และสื่อชั้นนำอื่น ๆ