ทุกสิ่งที่ควรรู้เกี่ยวกับ Google Cloud Text to Speech API
กำลังมองหา เครื่องอ่านข้อความเป็นเสียงพูดของเราอยู่หรือไม่?
แนะนำใน
- การแปลงข้อความเป็นเสียง
- API
- Google Cloud API
- คุณสมบัติของ Google Text to Speech API
- ค่าใช้จ่ายของ Google Text to Speech API เท่าไหร่?
- ความแตกต่างระหว่างตัวอักษรและไบต์คืออะไร
- วิธีตั้งค่าโครงการ Google Cloud Platform Text to Speech API ของคุณ
- วิธีปิดใช้งาน Text to Speech API
- เริ่มต้นใช้งาน Google Text to Speech API
- Google Cloud Text to Speech API รองรับภาษาดังต่อไปนี้:
- Google Cloud API ทำงานอย่างไร?
- นี่คือวิธีการใช้ Google Text to Speech API
- ทางเลือกที่ดีที่สุดสำหรับ Google Cloud TTS API
- คำถามที่พบบ่อยเกี่ยวกับ Google Text to Speech API
ปัญญาประดิษฐ์และ AI สร้างสรรค์ได้ก้าวหน้าไปมาก เทคโนโลยีแปลงข้อความเป็นเสียงเป็นแนวคิดที่มีมานานแล้ว มีหลายสิ่งที่ต้องทำความเข้าใจ...
ปัญญาประดิษฐ์และ AI สร้างสรรค์ได้ก้าวหน้าไปมาก เทคโนโลยีแปลงข้อความเป็นเสียงเป็นแนวคิดที่มีมานานแล้ว มีหลายสิ่งที่ต้องทำความเข้าใจและจัดหมวดหมู่ และฉันจะอธิบายให้เห็นภาพจากทุกมุมมอง ไม่ว่าคุณจะเป็นมือใหม่หรือมือโปร นี่จะช่วยให้คุณเข้าใจ Google Text to Speech API ได้ชัดเจนขึ้น
ก่อนที่เราจะลงลึกในหัวข้อใด ๆ เราต้องตั้งกฎพื้นฐานกันก่อน มาทำความเข้าใจคำศัพท์บางคำและสร้างพื้นฐานของเราให้มั่นคงกันเถอะ
มาทำความเข้าใจเทคโนโลยีสองอย่างนี้กัน; การแปลงข้อความเป็นเสียงและ API และบทบาทของ Google Cloud คืออะไร
หมายเหตุจากบรรณาธิการ: กำลังมองหา API แปลงข้อความเป็นเสียงที่ดีที่สุดอยู่หรือเปล่า? ลองดู API แปลงข้อความเป็นเสียงของ Speechify ที่มีเอกสารครบถ้วนและใช้งานง่ายtext to speech API.
การแปลงข้อความเป็นเสียง
ฉันได้เขียนเกี่ยวกับหัวข้อนี้อย่างละเอียด คุณสามารถอ่านบล็อก What is text to speech ของฉันและอ่านเพิ่มเติมเกี่ยวกับ การสังเคราะห์เสียง เพื่อให้เข้าใจหัวข้อนี้อย่างลึกซึ้งขึ้น คุณสามารถข้ามไปได้ในตอนนี้ ฉันจะสรุปให้ในไม่กี่ประโยค
การแปลงข้อความเป็นเสียงอาศัยเทคโนโลยีที่เรียกว่าการสังเคราะห์เสียงเพื่อแปลงคำเป็นเสียงที่สร้างโดย AI การใช้งานมีมากมาย ตั้งแต่ช่วยผู้ที่มีปัญหาในการอ่าน เช่น ดิสเล็กเซียและการมองเห็นไม่ดี ไปจนถึงผู้ที่ต้องการเพิ่มประสิทธิภาพ
API
API ย่อมาจาก Application Programming Interface มันทำหน้าที่เป็นสะพานเชื่อมระหว่างสองแอปพลิเคชัน หากคุณกำลังพัฒนาแอปที่มีเนื้อหาเสียงและต้องการฟังก์ชันการแปลงข้อความเป็นเสียง คุณจะต้องสร้างฟังก์ชันนี้เอง หรือคุณสามารถเชื่อมต่อกับ API แปลงข้อความเป็นเสียงที่มีอยู่แล้ว
คุณจะมุ่งเน้นไปที่การสร้างแอปของคุณและพึ่งพา API ของบุคคลที่สามเป็นสะพานเชื่อม เพื่อนำฟังก์ชันการแปลงข้อความเป็นเสียงมาใช้ในการสังเคราะห์ข้อความของคุณ
Google Cloud API
นี่คือจุดที่ Google Cloud เข้ามามีบทบาท Google ได้พัฒนา API แปลงข้อความเป็นเสียงที่แข็งแกร่งและเสนอให้กับนักพัฒนาในโครงสร้างค่าธรรมเนียมต่าง ๆ นักพัฒนาที่ต้องการสร้างแอปที่กำหนดเองหรือเว็บแอปที่ต้องการฟังก์ชันการแปลงข้อความเป็นเสียงสามารถใช้คุณสมบัติ TTS ของ Google ได้ ใช่แล้ว TTS ย่อมาจากการแปลงข้อความเป็นเสียง
ค้นหาการเริ่มต้นอย่างรวดเร็วได้ที่ Google Cloud Console https://cloud.google.com/. คุณสามารถหาบทเรียน จัดการบัญชีบริการของคุณ เข้าถึงเสียง wavenet และอื่น ๆ ได้
Google Cloud เองเป็นแพลตฟอร์มคลาวด์ที่ Google เสนอและมีบริการโมดูลาร์มากมาย คุณสามารถเลือกใช้บริการหนึ่ง หลายบริการ หรือทั้งหมดได้ สิ่งที่คุณต้องทำคือสร้างคีย์การเข้าถึงสำหรับการยืนยันตัวตนของแต่ละ API - สะพานเชื่อม บริการส่วนใหญ่ถ้าไม่ใช่ทั้งหมดมีค่าใช้จ่าย แม้อาจมีขีดจำกัดฟรี
Google ซื้อ DeepMind ในปี 2014 สำหรับเทคโนโลยีการแปลงข้อความเป็นเสียงและการพัฒนาเครือข่ายประสาท ดังนั้นหากคุณพบ DeepMind มันคือ Google DeepMind และพวกเขาเป็นหนึ่งเดียวกัน
ตอนนี้เรามีความเข้าใจที่ชัดเจนแล้ว มาดำดิ่งสู่ Google Cloud Text to Speech API กันเถอะ
คุณสมบัติของ Google Text to Speech API
Google เป็นผู้นำด้านเทคโนโลยีระดับโลกอย่างไม่ต้องสงสัย เมื่อพูดถึง TTS API คุณสามารถคาดหวังคุณสมบัติระดับโลกที่พัฒนาอย่างต่อเนื่อง
เสียงคุณภาพสูง
เสียงแปลงข้อความเป็นเสียงของ Google เป็นหนึ่งในเสียงที่ดีที่สุดในอุตสาหกรรม พวกมันฟังดูเหมือนมนุษย์มากและมีการเน้นเสียงที่เป็นธรรมชาติ TTS อยู่ในช่วงเริ่มต้นและผู้ที่สามารถสังเคราะห์เสียงให้ฟังเหมือนมนุษย์พูดได้ดีที่สุดจะชนะการแข่งขันนี้
การเลือกเสียง
Google อ้างว่ามีการเลือกเสียงที่หลากหลายที่สุด ดังนั้นโครงการของคุณไม่จำเป็นต้องฟังดูเหมือนกับอีก 1000 โครงการที่มีอยู่หรือแย่กว่านั้น แอปของคู่แข่งของคุณ
สร้างเสียงของคุณเอง
นี่คือเทคโนโลยีที่เกี่ยวข้องกับ การโคลนเสียง คุณสามารถสร้างเสียงที่กำหนดเองได้โดยการบันทึกเสียงของคุณหรือคนอื่น ๆ ด้วยการอนุญาตของพวกเขา จากนั้นคุณสามารถใช้ตัวอย่างนี้เป็นเสียงที่อ่านออกเสียงข้อความทั้งหมดของคุณ
เสียงประสาท
เสียง Neural ให้คุณภาพดีที่สุดในบรรดาเสียงที่มีให้เลือกมากมาย คุณยังสามารถทำให้เสียงเหล่านี้เป็นสากลเพื่อขยายกลุ่มผู้ฟังของคุณทั่วโลกได้อีกด้วย
เสียงสตูดิโอ
เสียงสตูดิโอเป็นเสียงระดับสูงที่ฟังดูเป็นมืออาชีพมาก ราวกับว่าถูกบันทึกด้วยวิธีดั้งเดิม
การปรับแต่งเสียง
เลือกเสียงแล้วปรับความเร็ว ระดับเสียง และอื่นๆ เพื่อให้คุณสามารถปรับแต่งโทนหรือเสียงได้ตามต้องการ
ค่าใช้จ่ายของ Google Text to Speech API เท่าไหร่?
ทั้งหมดขึ้นอยู่กับคุณภาพของเสียงและความยาวของข้อความที่คุณต้องการ ยิ่งเสียงฟังดูเป็นธรรมชาติมากเท่าไหร่ ราคาก็จะยิ่งสูงขึ้นเท่านั้น แต่ถึงแม้จะสูงก็ยังถือว่าไม่แพงเมื่อเทียบกับคุณภาพที่ได้รับ
ประเภทเสียง | ฟรีต่อเดือน | หลังจากใช้ฟรีครบแล้ว |
เสียง Neural2 | 0 ถึง 1 ล้านไบต์ | $16 ต่อหนึ่งล้านไบต์ |
เสียง Polyglot | 0 ถึง 1 ล้านไบต์ | $16 ต่อหนึ่งล้านไบต์ |
เสียงสตูดิโอ | 0 ถึง 100,000 ไบต์ | $160 ต่อหนึ่งล้านไบต์ |
เสียงมาตรฐาน | 0 ถึง 4 ล้านตัวอักษร | $4 ต่อหนึ่งล้านตัวอักษร |
เสียง Wavenet | 0 ถึง 1 ล้านตัวอักษร | $16 ต่อหนึ่งล้านตัวอักษร |
ความแตกต่างระหว่างตัวอักษรและไบต์คืออะไร
ตามที่เห็น ราคาจะแตกต่างกันอย่างมากขึ้นอยู่กับคุณภาพของเสียง การเข้ารหัสเสียงและการประมวลผลที่ใช้ในการเปลี่ยนข้อความเป็นเสียงจะแตกต่างกันไปในแต่ละระดับ สำหรับระดับต่ำกว่า เช่น เสียงมาตรฐาน ราคาจะต่ำกว่าและนับตามตัวอักษร
หมายความว่า หากโครงการของคุณมี 4 ล้านตัวอักษร จะมีค่าใช้จ่าย $16 ในการแปลงตัวอักษรเหล่านั้นเป็นเสียงโดยใช้เสียงมาตรฐาน
ในทางกลับกัน เสียงสตูดิโอต้องการพลังการประมวลผลที่มากกว่าและคิดค่าบริการตามไบต์ ในบางภาษา เช่น ภาษาญี่ปุ่น ตัวอักษรเดียวอาจประกอบด้วยหลายไบต์
ดังนั้น เพื่อให้ได้ราคาที่แม่นยำที่สุด สิ่งสำคัญคือต้องรู้ว่าคุณกำลังทำงานกับภาษาใดและมีความเข้าใจพื้นฐานเกี่ยวกับจำนวนไบต์เฉลี่ยต่อหนึ่งตัวอักษรและประเมินตามนั้น
วิธีตั้งค่าโครงการ Google Cloud Platform Text to Speech API ของคุณ
- สร้างบัญชี Google Cloud หรือ เข้าสู่ระบบที่หน้านี้
- สร้างโครงการใหม่ และตั้งชื่อให้เหมาะสม
- เพิ่มวิธีการชำระเงิน คุณจะถูกเรียกเก็บเงินเฉพาะสิ่งที่คุณใช้เท่านั้น
- จากนั้นเลือกโครงการของคุณและเชื่อมโยงกับบัญชีการเรียกเก็บเงิน
- เปิดใช้งาน Text-to-Speech API ไปที่แถบค้นหาผลิตภัณฑ์และทรัพยากรที่อยู่ด้านบนของหน้า และพิมพ์ "speech"
- จากผลลัพธ์ที่แสดง เลือก Cloud Text-to-Speech API
- ตั้งค่าการรับรองความถูกต้องสำหรับสภาพแวดล้อมการพัฒนาของคุณ สำหรับคำแนะนำ ดูการตั้งค่าการรับรองความถูกต้องสำหรับ Text-to-Speech
คุณยังสามารถลองใช้ Text-to-Speech โดยไม่ต้องเชื่อมโยงกับโครงการของคุณ:
- เลือกตัวเลือก TRY THIS API
- เพื่อเปิดใช้งาน Text-to-Speech API สำหรับใช้กับโครงการของคุณ คลิก ENABLE
ดูเพิ่มเติมที่ เอกสารของ Google Cloud สำหรับความช่วยเหลือเพิ่มเติม
วิธีปิดใช้งาน Text to Speech API
เพื่อปิดใช้งาน Text-to-Speech API ไปที่แดชบอร์ด Google Cloud Platform ของคุณและคลิกที่ลิงก์ "ไปที่ภาพรวม API" ภายในกล่อง API ค้นหา Text-to-Speech API แล้วคลิกที่มัน จากนั้นเลือกปุ่ม "DISABLE API" ที่ด้านบนของหน้า
เริ่มต้นใช้งาน Google Text to Speech API
ตอนนี้คุณได้ตั้งค่าโครงการของคุณแล้ว คุณสามารถใช้บรรทัดคำสั่งเพื่อเริ่มต้นได้
gcloud init
สร้างการรับรองความถูกต้องในเครื่อง
gcloud auth application-default login
ตอนนี้คุณสามารถติดตั้งไลบรารีไคลเอนต์ได้ ในตัวอย่างนี้ เราจะดูที่ Node.js
npm install --save @google-cloud/text-to-speech
Google Cloud Text to Speech API รองรับภาษาดังต่อไปนี้:
- Go
- Java
- Node.js
- C++
- C#
- PHP
- Python
- Ruby
- TypeScript
- Terraform
- YAML
Google Cloud API ทำงานอย่างไร?
ทุกอย่างเริ่มต้นด้วยการเรียก API ง่ายๆ คุณจะส่งข้อความของคุณในคำขอถอดเสียง จากนั้นคุณจะได้รับไฟล์เสียงของข้อความที่คุณพูด ด้วยคำขอของคุณ คุณสามารถระบุความต้องการเฉพาะ เลือกเสียง ภาษา และอื่นๆ จากนั้น API แปลงข้อความเป็นเสียงจะส่งไฟล์เสียงกลับมาให้คุณ
คุณสามารถเรียนรู้วิธีการติดตั้งและใช้งานไลบรารีลูกค้าของการแปลงข้อความเป็นเสียง ที่นี่ ตัวอย่างโค้ดของเราจะเป็นสำหรับ Node.js แต่คุณสามารถเลือกอย่างอื่นได้ตั้งแต่ Python ถึง PHP อะไรก็ตามที่คุณถนัด
const textToSpeech = require('@google-cloud/text-to-speech');
const fs = require('fs');
const util = require('util');
const client = new textToSpeech.TextToSpeechClient();
/**
* TODO(developer): Uncomment the following lines before running the sample.
*/
// const text = 'Text to synthesize, eg. hello';
// const outputFile = 'Local path to save audio file to, e.g. output.mp3';
const request = {
input: {text: text},
voice: {languageCode: 'en-US', ssmlGender: 'FEMALE'},
audioConfig: {audioEncoding: 'MP3'},
};
const [response] = await client.synthesizeSpeech(request);
const writeFile = util.promisify(fs.writeFile);
await writeFile(outputFile, response.audioContent, 'binary');
console.log(`Audio content written to file: ${outputFile}`);
และนั่นคือทั้งหมด คุณได้ตั้งค่า Google Cloud Text to Speech API และส่งคำขอแรกของคุณเพื่อแปลงข้อความเป็นเสียง คุณสามารถรับไฟล์กลับมาในรูปแบบต่างๆ ได้ ตั้งแต่ OGG ถึง MP3
นี่คือวิธีการใช้ Google Text to Speech API
Google Text-to-Speech (TTS) API เสนอวิธีแก้ปัญหาที่หลากหลายสำหรับการใช้งานในอุตสาหกรรมต่างๆ ตัวอย่างการใช้งานทั่วไปได้แก่:
- แปลงข้อความเป็นเสียงสำหรับผู้ใช้ที่มีปัญหาทางสายตา: การนำ TTS ไปใช้ในแอปพลิเคชันเพื่อแปลงเนื้อหาที่เขียนเป็นคำพูด ทำให้ข้อมูลดิจิทัลเข้าถึงได้สำหรับผู้ใช้ที่มีปัญหาทางสายตา
- ระบบโทรศัพท์อัตโนมัติ: ใช้ TTS เพื่อสร้างคำแนะนำและการตอบสนองที่ฟังดูเป็นธรรมชาติสำหรับระบบตอบรับเสียงอัตโนมัติในบริการลูกค้าหรือสายด่วนข้อมูล
- เสียงพากย์สำหรับเนื้อหาสื่อ: สร้างเสียงพากย์ที่ฟังดูเป็นธรรมชาติสำหรับวิดีโอ พอดแคสต์ หรือเนื้อหามัลติมีเดียอื่นๆ เพื่อเพิ่มประสบการณ์ของผู้ใช้
- แปลงข้อความเป็นเสียงสำหรับเนื้อหาที่แปลแล้ว: แปลงข้อความที่แปลแล้วเป็นคำพูดเพื่ออำนวยความสะดวกในการเรียนรู้ภาษา การสื่อสารระหว่างประเทศ หรือการบริโภคเนื้อหาในภาษาต่างๆ
- ช่วยอ่านสำหรับผู้ใช้ที่มีปัญหาดิสเล็กเซีย: ให้ฟังก์ชัน TTS เพื่อช่วยเหลือบุคคลที่มีปัญหาดิสเล็กเซียหรือความยากลำบากในการอ่านในการบริโภคเนื้อหาที่เขียน
- การนำทางด้วยเสียงในแอปพลิเคชัน: การรวม TTS เข้ากับแอปพลิเคชันนำทางเพื่อให้คำแนะนำแบบเลี้ยวต่อเลี้ยวหรือข้อมูลตามตำแหน่งที่ตั้งด้วยเสียง
- แปลงข้อความเป็นเสียงสำหรับเนื้อหาการศึกษา: เพิ่มประสบการณ์การเรียนรู้ออนไลน์โดยการแปลงเนื้อหาข้อความการศึกษาเป็นคำพูด ช่วยในการทำความเข้าใจและการมีส่วนร่วม
- การสังเคราะห์เสียงสำหรับแอปพลิเคชันเพิ่มประสิทธิภาพ: การรวม TTS เข้ากับเครื่องมือเพิ่มประสิทธิภาพ เช่น แอปพลิเคชันจดบันทึกหรือการจัดการงาน เพื่อเปิดใช้งานการตอบกลับด้วยเสียงหรือการดึงข้อมูล
- เสียงธรรมชาติสำหรับผู้ช่วยเสมือน: ขับเคลื่อนผู้ช่วยเสียงด้วย TTS ที่ฟังดูเป็นธรรมชาติเพื่อปรับปรุงการโต้ตอบของผู้ใช้และให้ข้อมูลในลักษณะการสนทนา
- การแจ้งเตือนและการแจ้งเตือนด้วยเสียง: ใช้ TTS เพื่อให้การแจ้งเตือนด้วยเสียง การแจ้งเตือน หรือการอัปเดตสถานะบนอุปกรณ์ Internet of Things (IoT) เพื่อเพิ่มการรับรู้ของผู้ใช้
ทางเลือกที่ดีที่สุดสำหรับ Google Cloud TTS API
จากการอัปเดตความรู้ล่าสุดของฉันในเดือนมกราคม 2022 มีทางเลือกหลายทางสำหรับ Google Text-to-Speech API โปรดทราบว่าความนิยมและความสามารถของบริการเหล่านี้อาจมีการเปลี่ยนแปลงตั้งแต่นั้น นี่คือทางเลือกที่น่าสนใจบางส่วน:
- Speechify Text to Speech API: เรารู้สึกตื่นเต้นที่จะเปิดตัวการพัฒนา API แปลงข้อความเป็นเสียงที่นำเสียง AI ที่เป็นธรรมชาติและเป็นที่รักของ Speechify มาสู่ผู้พัฒนาทั่วโลกโดยตรง จองที่นั่งของคุณวันนี้.
- Amazon Polly: ให้บริการโดย Amazon Web Services (AWS) Polly มอบการสังเคราะห์เสียงที่ฟังดูเป็นธรรมชาติในหลายภาษาและเสียง สามารถผสานรวมได้ดีกับบริการอื่น ๆ ของ AWS
- Microsoft Azure Speech Service: Azure Speech Service รวมความสามารถในการแปลงข้อความเป็นเสียงและรองรับแอปพลิเคชันหลากหลาย เช่น ผู้ช่วยเสียง ระบบนำทาง และอื่น ๆ
- IBM Watson Text to Speech: IBM Watson เสนอการบริการแปลงข้อความเป็นเสียงที่ช่วยให้นักพัฒนาสามารถแปลงข้อความที่เขียนเป็นเสียงที่ฟังดูเป็นธรรมชาติได้โดยใช้เสียงหลากหลาย
- Nuance Communications: Nuance ให้บริการโซลูชันการรู้จำเสียงและเสียงหลากหลาย รวมถึงการแปลงข้อความเป็นเสียง สำหรับแอปพลิเคชันในด้านการดูแลสุขภาพ ยานยนต์ และบริการลูกค้า
- CereProc: CereProc เป็นบริษัทเทคโนโลยีแปลงข้อความเป็นเสียงที่ให้เสียงสังเคราะห์คุณภาพสูงสำหรับแอปพลิเคชัน เช่น การเข้าถึง ความบันเทิง และการสื่อสาร
- iSpeech: iSpeech ให้บริการแปลงข้อความเป็นเสียงบนคลาวด์ที่รองรับหลายภาษาและเสียง เหมาะสำหรับแอปพลิเคชันหลากหลาย เช่น แอปมือถือและเว็บไซต์
- ResponsiveVoice: ResponsiveVoice เป็น API แปลงข้อความเป็นเสียงที่เรียบง่ายและราคาไม่แพงที่รองรับหลายภาษาและสามารถใช้ในแอปพลิเคชันบนเว็บหลากหลาย
- Neospeech: Neospeech เสนอการแก้ปัญหาแปลงข้อความเป็นเสียงที่เน้นเสียงที่ฟังดูเป็นธรรมชาติ เทคโนโลยีของพวกเขาใช้ในแอปพลิเคชัน เช่น การเรียนรู้ออนไลน์และความบันเทิง
- ReadSpeaker: ReadSpeaker ให้บริการแปลงข้อความเป็นเสียงออนไลน์และออฟไลน์สำหรับแอปพลิเคชันหลากหลาย เช่น เว็บไซต์ การเรียนรู้ออนไลน์ และบริการการเข้าถึง
- Acapelabox: Acapela Group เสนอ API แปลงข้อความเป็นเสียงบนคลาวด์ Acapelabox ที่รองรับหลายภาษาและเสียงสำหรับแอปพลิเคชันในอุตสาหกรรมหลากหลาย
คำถามที่พบบ่อยเกี่ยวกับ Google Text to Speech API
Google มีหลายระดับของเสียงและเกือบทุกระดับมีขีดจำกัดฟรี ตัวอย่างเช่น เสียงมาตรฐานฟรีถึงหนึ่งล้านไบต์แรก หลังจากนั้นจะคิดค่าบริการ $16 ต่อหนึ่งล้านไบต์ ดังนั้นจึงสามารถฟรีได้หากใช้ตัวอักษรหรือไบต์จำกัด
เพียงสร้างบัญชีที่ https://cloud.google.com/text-to-speech/ และทำตามขั้นตอนที่นั่น นอกจากนี้ ฉันได้อธิบายขั้นตอนอย่างละเอียดในบล็อกนี้ข้างต้น
คุณสามารถรับคีย์ Google Text to Speech API ได้โดยการเข้าสู่ระบบบัญชี Google Cloud ของคุณแล้วสร้างโปรเจกต์ เมื่อคุณสร้างโปรเจกต์แล้วคุณสามารถสร้างคีย์ API ได้
URL สำหรับ Google Text to Speech API คือ https://cloud.google.com/text-to-speech/
ในทางเทคนิคแล้วไม่มีระยะเวลาทดลองใช้ฟรีสำหรับ Google Cloud มีบริการหลายอย่างภายใน Google Cloud และแต่ละบริการมีเงื่อนไขและระดับฟรีของตัวเอง
ไม่ได้ Google Cloud Text to Speech API ต้องการการเชื่อมต่ออินเทอร์เน็ต
การรับรองความถูกต้องกับบริการของ Google Cloud รวมถึง Text-to-Speech API สามารถทำได้โดยใช้คีย์ API, OAuth 2.0 หรือบัญชีบริการ วิธีการรับรองความถูกต้องที่เหมาะสมขึ้นอยู่กับกรณีการใช้งานและประเภทของแอปพลิเคชัน
ฉันให้คะแนน 5 ดาว ใช้งานง่าย ฟีเจอร์การค้นหาดีเยี่ยมและใช้บ่อยที่สุด ราคาก็สมเหตุสมผลและเป็นผลิตภัณฑ์ที่ยอดเยี่ยมโดยรวม
Google Text-to-Speech API มีไลบรารีสำหรับภาษาการเขียนโปรแกรมต่างๆ รวมถึง Python นอกจากนี้ยังรองรับการร้องขอ RESTful API ทำให้สามารถใช้งานร่วมกับภาษาที่สามารถทำการร้องขอ HTTP ได้
การผสานรวม Google Text-to-Speech API เข้ากับแอป Android เกี่ยวข้องกับการใช้คลาส TextToSpeech และการทำคำร้องขอ API สามารถดูคำแนะนำโดยละเอียดได้ในเอกสารอย่างเป็นทางการสำหรับนักพัฒนา Android
ในการใช้งาน Google Text-to-Speech API ในแอปพลิเคชัน JavaScript คุณสามารถทำคำร้องขอ HTTP ไปยัง API endpoint กระบวนการนี้เกี่ยวข้องกับการสร้างคำร้องขอ API ที่เหมาะสมและจัดการการตอบสนองในโค้ด JavaScript ของคุณ ดูรายละเอียดเพิ่มเติมได้ในเอกสารอย่างเป็นทางการ
คลิฟ ไวซ์แมน
คลิฟ ไวซ์แมน เป็นผู้สนับสนุนด้านดิสเล็กเซียและเป็น CEO และผู้ก่อตั้ง Speechify แอปพลิเคชันแปลงข้อความเป็นเสียงอันดับ 1 ของโลก ที่มีรีวิว 5 ดาวมากกว่า 100,000 รีวิว และครองอันดับหนึ่งใน App Store ในหมวดข่าวและนิตยสาร ในปี 2017 ไวซ์แมนได้รับการยกย่องในรายชื่อ Forbes 30 under 30 จากผลงานของเขาในการทำให้อินเทอร์เน็ตเข้าถึงได้มากขึ้นสำหรับผู้ที่มีความบกพร่องในการเรียนรู้ คลิฟ ไวซ์แมน ได้รับการนำเสนอใน EdSurge, Inc., PC Mag, Entrepreneur, Mashable และสื่อชั้นนำอื่น ๆ