ทุกสิ่งที่ควรรู้เกี่ยวกับ Google Cloud Text to Speech API

ปัญญาประดิษฐ์และ AI สร้างสรรค์ได้ก้าวหน้าไปมาก เทคโนโลยีแปลงข้อความเป็นเสียงเป็นแนวคิดที่มีมานานแล้ว มีหลายสิ่งที่ต้องทำความเข้าใจและจัดหมวดหมู่ และฉันจะอธิบายให้เห็นภาพจากทุกมุมมอง ไม่ว่าคุณจะเป็นมือใหม่หรือมือโปร นี่จะช่วยให้คุณเข้าใจ Google Text to Speech API ได้ชัดเจนขึ้น

ก่อนที่เราจะลงลึกในหัวข้อใด ๆ เราต้องตั้งกฎพื้นฐานกันก่อน มาทำความเข้าใจคำศัพท์บางคำและสร้างพื้นฐานของเราให้มั่นคงกันเถอะ

มาทำความเข้าใจเทคโนโลยีสองอย่างนี้กัน; การแปลงข้อความเป็นเสียงและ API และบทบาทของ Google Cloud คืออะไร

หมายเหตุจากบรรณาธิการ: กำลังมองหา API แปลงข้อความเป็นเสียงที่ดีที่สุดอยู่หรือเปล่า? ลองดู API แปลงข้อความเป็นเสียงของ Speechify ที่มีเอกสารครบถ้วนและใช้งานง่ายtext to speech API.

การแปลงข้อความเป็นเสียง

ฉันได้เขียนเกี่ยวกับหัวข้อนี้อย่างละเอียด คุณสามารถอ่านบล็อก What is text to speech ของฉันและอ่านเพิ่มเติมเกี่ยวกับ การสังเคราะห์เสียง เพื่อให้เข้าใจหัวข้อนี้อย่างลึกซึ้งขึ้น คุณสามารถข้ามไปได้ในตอนนี้ ฉันจะสรุปให้ในไม่กี่ประโยค

การแปลงข้อความเป็นเสียงอาศัยเทคโนโลยีที่เรียกว่าการสังเคราะห์เสียงเพื่อแปลงคำเป็นเสียงที่สร้างโดย AI การใช้งานมีมากมาย ตั้งแต่ช่วยผู้ที่มีปัญหาในการอ่าน เช่น ดิสเล็กเซียและการมองเห็นไม่ดี ไปจนถึงผู้ที่ต้องการเพิ่มประสิทธิภาพ

API

API ย่อมาจาก Application Programming Interface มันทำหน้าที่เป็นสะพานเชื่อมระหว่างสองแอปพลิเคชัน หากคุณกำลังพัฒนาแอปที่มีเนื้อหาเสียงและต้องการฟังก์ชันการแปลงข้อความเป็นเสียง คุณจะต้องสร้างฟังก์ชันนี้เอง หรือคุณสามารถเชื่อมต่อกับ API แปลงข้อความเป็นเสียงที่มีอยู่แล้ว

คุณจะมุ่งเน้นไปที่การสร้างแอปของคุณและพึ่งพา API ของบุคคลที่สามเป็นสะพานเชื่อม เพื่อนำฟังก์ชันการแปลงข้อความเป็นเสียงมาใช้ในการสังเคราะห์ข้อความของคุณ

Google Cloud API

นี่คือจุดที่ Google Cloud เข้ามามีบทบาท Google ได้พัฒนา API แปลงข้อความเป็นเสียงที่แข็งแกร่งและเสนอให้กับนักพัฒนาในโครงสร้างค่าธรรมเนียมต่าง ๆ นักพัฒนาที่ต้องการสร้างแอปที่กำหนดเองหรือเว็บแอปที่ต้องการฟังก์ชันการแปลงข้อความเป็นเสียงสามารถใช้คุณสมบัติ TTS ของ Google ได้ ใช่แล้ว TTS ย่อมาจากการแปลงข้อความเป็นเสียง

ค้นหาการเริ่มต้นอย่างรวดเร็วได้ที่ Google Cloud Console https://cloud.google.com/. คุณสามารถหาบทเรียน จัดการบัญชีบริการของคุณ เข้าถึงเสียง wavenet และอื่น ๆ ได้

Google Cloud เองเป็นแพลตฟอร์มคลาวด์ที่ Google เสนอและมีบริการโมดูลาร์มากมาย คุณสามารถเลือกใช้บริการหนึ่ง หลายบริการ หรือทั้งหมดได้ สิ่งที่คุณต้องทำคือสร้างคีย์การเข้าถึงสำหรับการยืนยันตัวตนของแต่ละ API - สะพานเชื่อม บริการส่วนใหญ่ถ้าไม่ใช่ทั้งหมดมีค่าใช้จ่าย แม้อาจมีขีดจำกัดฟรี

Google ซื้อ DeepMind ในปี 2014 สำหรับเทคโนโลยีการแปลงข้อความเป็นเสียงและการพัฒนาเครือข่ายประสาท ดังนั้นหากคุณพบ DeepMind มันคือ Google DeepMind และพวกเขาเป็นหนึ่งเดียวกัน

ตอนนี้เรามีความเข้าใจที่ชัดเจนแล้ว มาดำดิ่งสู่ Google Cloud Text to Speech API กันเถอะ

คุณสมบัติของ Google Text to Speech API

Google เป็นผู้นำด้านเทคโนโลยีระดับโลกอย่างไม่ต้องสงสัย เมื่อพูดถึง TTS API คุณสามารถคาดหวังคุณสมบัติระดับโลกที่พัฒนาอย่างต่อเนื่อง

เสียงคุณภาพสูง

เสียงแปลงข้อความเป็นเสียงของ Google เป็นหนึ่งในเสียงที่ดีที่สุดในอุตสาหกรรม พวกมันฟังดูเหมือนมนุษย์มากและมีการเน้นเสียงที่เป็นธรรมชาติ TTS อยู่ในช่วงเริ่มต้นและผู้ที่สามารถสังเคราะห์เสียงให้ฟังเหมือนมนุษย์พูดได้ดีที่สุดจะชนะการแข่งขันนี้

การเลือกเสียง

Google อ้างว่ามีการเลือกเสียงที่หลากหลายที่สุด ดังนั้นโครงการของคุณไม่จำเป็นต้องฟังดูเหมือนกับอีก 1000 โครงการที่มีอยู่หรือแย่กว่านั้น แอปของคู่แข่งของคุณ

สร้างเสียงของคุณเอง

นี่คือเทคโนโลยีที่เกี่ยวข้องกับ การโคลนเสียง คุณสามารถสร้างเสียงที่กำหนดเองได้โดยการบันทึกเสียงของคุณหรือคนอื่น ๆ ด้วยการอนุญาตของพวกเขา จากนั้นคุณสามารถใช้ตัวอย่างนี้เป็นเสียงที่อ่านออกเสียงข้อความทั้งหมดของคุณ

เสียงประสาท

เสียง Neural ให้คุณภาพดีที่สุดในบรรดาเสียงที่มีให้เลือกมากมาย คุณยังสามารถทำให้เสียงเหล่านี้เป็นสากลเพื่อขยายกลุ่มผู้ฟังของคุณทั่วโลกได้อีกด้วย

เสียงสตูดิโอ

เสียงสตูดิโอเป็นเสียงระดับสูงที่ฟังดูเป็นมืออาชีพมาก ราวกับว่าถูกบันทึกด้วยวิธีดั้งเดิม

การปรับแต่งเสียง

เลือกเสียงแล้วปรับความเร็ว ระดับเสียง และอื่นๆ เพื่อให้คุณสามารถปรับแต่งโทนหรือเสียงได้ตามต้องการ

ค่าใช้จ่ายของ Google Text to Speech API เท่าไหร่?

ทั้งหมดขึ้นอยู่กับคุณภาพของเสียงและความยาวของข้อความที่คุณต้องการ ยิ่งเสียงฟังดูเป็นธรรมชาติมากเท่าไหร่ ราคาก็จะยิ่งสูงขึ้นเท่านั้น แต่ถึงแม้จะสูงก็ยังถือว่าไม่แพงเมื่อเทียบกับคุณภาพที่ได้รับ

ประเภทเสียง	ฟรีต่อเดือน	หลังจากใช้ฟรีครบแล้ว
เสียง Neural2	0 ถึง 1 ล้านไบต์	$16 ต่อหนึ่งล้านไบต์
เสียง Polyglot	0 ถึง 1 ล้านไบต์	$16 ต่อหนึ่งล้านไบต์
เสียงสตูดิโอ	0 ถึง 100,000 ไบต์	$160 ต่อหนึ่งล้านไบต์
เสียงมาตรฐาน	0 ถึง 4 ล้านตัวอักษร	$4 ต่อหนึ่งล้านตัวอักษร
เสียง Wavenet	0 ถึง 1 ล้านตัวอักษร	$16 ต่อหนึ่งล้านตัวอักษร

ความแตกต่างระหว่างตัวอักษรและไบต์คืออะไร

ตามที่เห็น ราคาจะแตกต่างกันอย่างมากขึ้นอยู่กับคุณภาพของเสียง การเข้ารหัสเสียงและการประมวลผลที่ใช้ในการเปลี่ยนข้อความเป็นเสียงจะแตกต่างกันไปในแต่ละระดับ สำหรับระดับต่ำกว่า เช่น เสียงมาตรฐาน ราคาจะต่ำกว่าและนับตามตัวอักษร

หมายความว่า หากโครงการของคุณมี 4 ล้านตัวอักษร จะมีค่าใช้จ่าย $16 ในการแปลงตัวอักษรเหล่านั้นเป็นเสียงโดยใช้เสียงมาตรฐาน

ในทางกลับกัน เสียงสตูดิโอต้องการพลังการประมวลผลที่มากกว่าและคิดค่าบริการตามไบต์ ในบางภาษา เช่น ภาษาญี่ปุ่น ตัวอักษรเดียวอาจประกอบด้วยหลายไบต์

ดังนั้น เพื่อให้ได้ราคาที่แม่นยำที่สุด สิ่งสำคัญคือต้องรู้ว่าคุณกำลังทำงานกับภาษาใดและมีความเข้าใจพื้นฐานเกี่ยวกับจำนวนไบต์เฉลี่ยต่อหนึ่งตัวอักษรและประเมินตามนั้น

วิธีตั้งค่าโครงการ Google Cloud Platform Text to Speech API ของคุณ

สร้างบัญชี Google Cloud หรือ เข้าสู่ระบบที่หน้านี้
สร้างโครงการใหม่ และตั้งชื่อให้เหมาะสม
เพิ่มวิธีการชำระเงิน คุณจะถูกเรียกเก็บเงินเฉพาะสิ่งที่คุณใช้เท่านั้น
จากนั้นเลือกโครงการของคุณและเชื่อมโยงกับบัญชีการเรียกเก็บเงิน
เปิดใช้งาน Text-to-Speech API ไปที่แถบค้นหาผลิตภัณฑ์และทรัพยากรที่อยู่ด้านบนของหน้า และพิมพ์ "speech"
จากผลลัพธ์ที่แสดง เลือก Cloud Text-to-Speech API
ตั้งค่าการรับรองความถูกต้องสำหรับสภาพแวดล้อมการพัฒนาของคุณ สำหรับคำแนะนำ ดูการตั้งค่าการรับรองความถูกต้องสำหรับ Text-to-Speech

คุณยังสามารถลองใช้ Text-to-Speech โดยไม่ต้องเชื่อมโยงกับโครงการของคุณ:

เลือกตัวเลือก TRY THIS API
เพื่อเปิดใช้งาน Text-to-Speech API สำหรับใช้กับโครงการของคุณ คลิก ENABLE

ดูเพิ่มเติมที่ เอกสารของ Google Cloud สำหรับความช่วยเหลือเพิ่มเติม

วิธีปิดใช้งาน Text to Speech API

เพื่อปิดใช้งาน Text-to-Speech API ไปที่แดชบอร์ด Google Cloud Platform ของคุณและคลิกที่ลิงก์ "ไปที่ภาพรวม API" ภายในกล่อง API ค้นหา Text-to-Speech API แล้วคลิกที่มัน จากนั้นเลือกปุ่ม "DISABLE API" ที่ด้านบนของหน้า

เริ่มต้นใช้งาน Google Text to Speech API

ตอนนี้คุณได้ตั้งค่าโครงการของคุณแล้ว คุณสามารถใช้บรรทัดคำสั่งเพื่อเริ่มต้นได้

gcloud init

สร้างการรับรองความถูกต้องในเครื่อง

gcloud auth application-default login

ตอนนี้คุณสามารถติดตั้งไลบรารีไคลเอนต์ได้ ในตัวอย่างนี้ เราจะดูที่ Node.js

npm install --save @google-cloud/text-to-speech

Google Cloud Text to Speech API รองรับภาษาดังต่อไปนี้:

Go
Java
Node.js
C++
C#
PHP
Python
Ruby
TypeScript
Terraform
YAML

Google Cloud API ทำงานอย่างไร?

ทุกอย่างเริ่มต้นด้วยการเรียก API ง่ายๆ คุณจะส่งข้อความของคุณในคำขอถอดเสียง จากนั้นคุณจะได้รับไฟล์เสียงของข้อความที่คุณพูด ด้วยคำขอของคุณ คุณสามารถระบุความต้องการเฉพาะ เลือกเสียง ภาษา และอื่นๆ จากนั้น API แปลงข้อความเป็นเสียงจะส่งไฟล์เสียงกลับมาให้คุณ

คุณสามารถเรียนรู้วิธีการติดตั้งและใช้งานไลบรารีลูกค้าของการแปลงข้อความเป็นเสียง ที่นี่ ตัวอย่างโค้ดของเราจะเป็นสำหรับ Node.js แต่คุณสามารถเลือกอย่างอื่นได้ตั้งแต่ Python ถึง PHP อะไรก็ตามที่คุณถนัด

const textToSpeech = require('@google-cloud/text-to-speech');
const fs = require('fs');
const util = require('util');

const client = new textToSpeech.TextToSpeechClient();

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const text = 'Text to synthesize, eg. hello';
// const outputFile = 'Local path to save audio file to, e.g. output.mp3';

const request = {
  input: {text: text},
  voice: {languageCode: 'en-US', ssmlGender: 'FEMALE'},
  audioConfig: {audioEncoding: 'MP3'},
};
const [response] = await client.synthesizeSpeech(request);
const writeFile = util.promisify(fs.writeFile);
await writeFile(outputFile, response.audioContent, 'binary');
console.log(`Audio content written to file: ${outputFile}`);

และนั่นคือทั้งหมด คุณได้ตั้งค่า Google Cloud Text to Speech API และส่งคำขอแรกของคุณเพื่อแปลงข้อความเป็นเสียง คุณสามารถรับไฟล์กลับมาในรูปแบบต่างๆ ได้ ตั้งแต่ OGG ถึง MP3

นี่คือวิธีการใช้ Google Text to Speech API

Google Text-to-Speech (TTS) API เสนอวิธีแก้ปัญหาที่หลากหลายสำหรับการใช้งานในอุตสาหกรรมต่างๆ ตัวอย่างการใช้งานทั่วไปได้แก่:

แปลงข้อความเป็นเสียงสำหรับผู้ใช้ที่มีปัญหาทางสายตา: การนำ TTS ไปใช้ในแอปพลิเคชันเพื่อแปลงเนื้อหาที่เขียนเป็นคำพูด ทำให้ข้อมูลดิจิทัลเข้าถึงได้สำหรับผู้ใช้ที่มีปัญหาทางสายตา
ระบบโทรศัพท์อัตโนมัติ: ใช้ TTS เพื่อสร้างคำแนะนำและการตอบสนองที่ฟังดูเป็นธรรมชาติสำหรับระบบตอบรับเสียงอัตโนมัติในบริการลูกค้าหรือสายด่วนข้อมูล
เสียงพากย์สำหรับเนื้อหาสื่อ: สร้างเสียงพากย์ที่ฟังดูเป็นธรรมชาติสำหรับวิดีโอ พอดแคสต์ หรือเนื้อหามัลติมีเดียอื่นๆ เพื่อเพิ่มประสบการณ์ของผู้ใช้
แปลงข้อความเป็นเสียงสำหรับเนื้อหาที่แปลแล้ว: แปลงข้อความที่แปลแล้วเป็นคำพูดเพื่ออำนวยความสะดวกในการเรียนรู้ภาษา การสื่อสารระหว่างประเทศ หรือการบริโภคเนื้อหาในภาษาต่างๆ
ช่วยอ่านสำหรับผู้ใช้ที่มีปัญหาดิสเล็กเซีย: ให้ฟังก์ชัน TTS เพื่อช่วยเหลือบุคคลที่มีปัญหาดิสเล็กเซียหรือความยากลำบากในการอ่านในการบริโภคเนื้อหาที่เขียน
การนำทางด้วยเสียงในแอปพลิเคชัน: การรวม TTS เข้ากับแอปพลิเคชันนำทางเพื่อให้คำแนะนำแบบเลี้ยวต่อเลี้ยวหรือข้อมูลตามตำแหน่งที่ตั้งด้วยเสียง
แปลงข้อความเป็นเสียงสำหรับเนื้อหาการศึกษา: เพิ่มประสบการณ์การเรียนรู้ออนไลน์โดยการแปลงเนื้อหาข้อความการศึกษาเป็นคำพูด ช่วยในการทำความเข้าใจและการมีส่วนร่วม
การสังเคราะห์เสียงสำหรับแอปพลิเคชันเพิ่มประสิทธิภาพ: การรวม TTS เข้ากับเครื่องมือเพิ่มประสิทธิภาพ เช่น แอปพลิเคชันจดบันทึกหรือการจัดการงาน เพื่อเปิดใช้งานการตอบกลับด้วยเสียงหรือการดึงข้อมูล
เสียงธรรมชาติสำหรับผู้ช่วยเสมือน: ขับเคลื่อนผู้ช่วยเสียงด้วย TTS ที่ฟังดูเป็นธรรมชาติเพื่อปรับปรุงการโต้ตอบของผู้ใช้และให้ข้อมูลในลักษณะการสนทนา
การแจ้งเตือนและการแจ้งเตือนด้วยเสียง: ใช้ TTS เพื่อให้การแจ้งเตือนด้วยเสียง การแจ้งเตือน หรือการอัปเดตสถานะบนอุปกรณ์ Internet of Things (IoT) เพื่อเพิ่มการรับรู้ของผู้ใช้

ทางเลือกที่ดีที่สุดสำหรับ Google Cloud TTS API

จากการอัปเดตความรู้ล่าสุดของฉันในเดือนมกราคม 2022 มีทางเลือกหลายทางสำหรับ Google Text-to-Speech API โปรดทราบว่าความนิยมและความสามารถของบริการเหล่านี้อาจมีการเปลี่ยนแปลงตั้งแต่นั้น นี่คือทางเลือกที่น่าสนใจบางส่วน:

Speechify Text to Speech API: เรารู้สึกตื่นเต้นที่จะเปิดตัวการพัฒนา API แปลงข้อความเป็นเสียงที่นำเสียง AI ที่เป็นธรรมชาติและเป็นที่รักของ Speechify มาสู่ผู้พัฒนาทั่วโลกโดยตรง จองที่นั่งของคุณวันนี้.
Amazon Polly: ให้บริการโดย Amazon Web Services (AWS) Polly มอบการสังเคราะห์เสียงที่ฟังดูเป็นธรรมชาติในหลายภาษาและเสียง สามารถผสานรวมได้ดีกับบริการอื่น ๆ ของ AWS
Microsoft Azure Speech Service: Azure Speech Service รวมความสามารถในการแปลงข้อความเป็นเสียงและรองรับแอปพลิเคชันหลากหลาย เช่น ผู้ช่วยเสียง ระบบนำทาง และอื่น ๆ
IBM Watson Text to Speech: IBM Watson เสนอการบริการแปลงข้อความเป็นเสียงที่ช่วยให้นักพัฒนาสามารถแปลงข้อความที่เขียนเป็นเสียงที่ฟังดูเป็นธรรมชาติได้โดยใช้เสียงหลากหลาย
Nuance Communications: Nuance ให้บริการโซลูชันการรู้จำเสียงและเสียงหลากหลาย รวมถึงการแปลงข้อความเป็นเสียง สำหรับแอปพลิเคชันในด้านการดูแลสุขภาพ ยานยนต์ และบริการลูกค้า
CereProc: CereProc เป็นบริษัทเทคโนโลยีแปลงข้อความเป็นเสียงที่ให้เสียงสังเคราะห์คุณภาพสูงสำหรับแอปพลิเคชัน เช่น การเข้าถึง ความบันเทิง และการสื่อสาร
iSpeech: iSpeech ให้บริการแปลงข้อความเป็นเสียงบนคลาวด์ที่รองรับหลายภาษาและเสียง เหมาะสำหรับแอปพลิเคชันหลากหลาย เช่น แอปมือถือและเว็บไซต์
ResponsiveVoice: ResponsiveVoice เป็น API แปลงข้อความเป็นเสียงที่เรียบง่ายและราคาไม่แพงที่รองรับหลายภาษาและสามารถใช้ในแอปพลิเคชันบนเว็บหลากหลาย
Neospeech: Neospeech เสนอการแก้ปัญหาแปลงข้อความเป็นเสียงที่เน้นเสียงที่ฟังดูเป็นธรรมชาติ เทคโนโลยีของพวกเขาใช้ในแอปพลิเคชัน เช่น การเรียนรู้ออนไลน์และความบันเทิง
ReadSpeaker: ReadSpeaker ให้บริการแปลงข้อความเป็นเสียงออนไลน์และออฟไลน์สำหรับแอปพลิเคชันหลากหลาย เช่น เว็บไซต์ การเรียนรู้ออนไลน์ และบริการการเข้าถึง
Acapelabox: Acapela Group เสนอ API แปลงข้อความเป็นเสียงบนคลาวด์ Acapelabox ที่รองรับหลายภาษาและเสียงสำหรับแอปพลิเคชันในอุตสาหกรรมหลากหลาย

คำถามที่พบบ่อยเกี่ยวกับ Google Text to Speech API

Google มีหลายระดับของเสียงและเกือบทุกระดับมีขีดจำกัดฟรี ตัวอย่างเช่น เสียงมาตรฐานฟรีถึงหนึ่งล้านไบต์แรก หลังจากนั้นจะคิดค่าบริการ $16 ต่อหนึ่งล้านไบต์ ดังนั้นจึงสามารถฟรีได้หากใช้ตัวอักษรหรือไบต์จำกัด

เพียงสร้างบัญชีที่ https://cloud.google.com/text-to-speech/ และทำตามขั้นตอนที่นั่น นอกจากนี้ ฉันได้อธิบายขั้นตอนอย่างละเอียดในบล็อกนี้ข้างต้น

คุณสามารถรับคีย์ Google Text to Speech API ได้โดยการเข้าสู่ระบบบัญชี Google Cloud ของคุณแล้วสร้างโปรเจกต์ เมื่อคุณสร้างโปรเจกต์แล้วคุณสามารถสร้างคีย์ API ได้

URL สำหรับ Google Text to Speech API คือ https://cloud.google.com/text-to-speech/

ในทางเทคนิคแล้วไม่มีระยะเวลาทดลองใช้ฟรีสำหรับ Google Cloud มีบริการหลายอย่างภายใน Google Cloud และแต่ละบริการมีเงื่อนไขและระดับฟรีของตัวเอง

ไม่ได้ Google Cloud Text to Speech API ต้องการการเชื่อมต่ออินเทอร์เน็ต

การรับรองความถูกต้องกับบริการของ Google Cloud รวมถึง Text-to-Speech API สามารถทำได้โดยใช้คีย์ API, OAuth 2.0 หรือบัญชีบริการ วิธีการรับรองความถูกต้องที่เหมาะสมขึ้นอยู่กับกรณีการใช้งานและประเภทของแอปพลิเคชัน

ฉันให้คะแนน 5 ดาว ใช้งานง่าย ฟีเจอร์การค้นหาดีเยี่ยมและใช้บ่อยที่สุด ราคาก็สมเหตุสมผลและเป็นผลิตภัณฑ์ที่ยอดเยี่ยมโดยรวม

Google Text-to-Speech API มีไลบรารีสำหรับภาษาการเขียนโปรแกรมต่างๆ รวมถึง Python นอกจากนี้ยังรองรับการร้องขอ RESTful API ทำให้สามารถใช้งานร่วมกับภาษาที่สามารถทำการร้องขอ HTTP ได้

การผสานรวม Google Text-to-Speech API เข้ากับแอป Android เกี่ยวข้องกับการใช้คลาส TextToSpeech และการทำคำร้องขอ API สามารถดูคำแนะนำโดยละเอียดได้ในเอกสารอย่างเป็นทางการสำหรับนักพัฒนา Android

ในการใช้งาน Google Text-to-Speech API ในแอปพลิเคชัน JavaScript คุณสามารถทำคำร้องขอ HTTP ไปยัง API endpoint กระบวนการนี้เกี่ยวข้องกับการสร้างคำร้องขอ API ที่เหมาะสมและจัดการการตอบสนองในโค้ด JavaScript ของคุณ ดูรายละเอียดเพิ่มเติมได้ในเอกสารอย่างเป็นทางการ

Speechify เป็นแพลตฟอร์ม แปลงข้อความเป็นเสียง ชั้นนำของโลกที่มีผู้ใช้งานกว่า 50 ล้านคน และได้รับรีวิวระดับ 5 ดาวมากกว่า 500,000 รีวิวในแอปพลิเคชัน iOS, Android, Chrome Extension, เว็บแอป และ แอปบน Mac ในปี 2025 Apple ได้มอบรางวัล Apple Design Award อันทรงเกียรติให้กับ Speechify ในงาน WWDC โดยกล่าวว่าเป็น “ทรัพยากรสำคัญที่ช่วยให้ผู้คนใช้ชีวิตได้ง่ายขึ้น” Speechify มีเสียงธรรมชาติกว่า 1,000 เสียงใน 60+ ภาษา และมีผู้ใช้งานในเกือบ 200 ประเทศ เสียงคนดังที่มีให้เลือกใช้งาน เช่น Snoop Dogg, Mr. Beast และ Gwyneth Paltrow สำหรับผู้สร้างสรรค์และธุรกิจ Speechify Studio มีเครื่องมือขั้นสูง เช่น AI Voice Generator, AI Voice Cloning, AI Dubbing และ AI Voice Changer Speechify ยังสนับสนุนผลิตภัณฑ์ชั้นนำด้วย Text to Speech API ที่มีคุณภาพสูงและคุ้มค่า นอกจากนี้ยังได้รับการนำเสนอใน The Wall Street Journal, CNBC, Forbes, TechCrunch และสื่อชั้นนำอื่น ๆ Speechify เป็นผู้ให้บริการแปลงข้อความเป็นเสียงที่ใหญ่ที่สุดในโลก เยี่ยมชม speechify.com/news, speechify.com/blog และ speechify.com/press เพื่อเรียนรู้เพิ่มเติม

ทุกสิ่งที่ควรรู้เกี่ยวกับ Google Cloud Text to Speech API

Cliff Weitzman

Speechify API ให้บริการด้วยความเร็ว 300ms  เสียงคุณภาพระดับมนุษย์ และรองรับกว่า 50 ภาษา

การแปลงข้อความเป็นเสียง

API

Google Cloud API

คุณสมบัติของ Google Text to Speech API

เสียงคุณภาพสูง

การเลือกเสียง

สร้างเสียงของคุณเอง

เสียงประสาท

เสียงสตูดิโอ

การปรับแต่งเสียง

ค่าใช้จ่ายของ Google Text to Speech API เท่าไหร่?

ความแตกต่างระหว่างตัวอักษรและไบต์คืออะไร

วิธีตั้งค่าโครงการ Google Cloud Platform Text to Speech API ของคุณ

วิธีปิดใช้งาน Text to Speech API

เริ่มต้นใช้งาน Google Text to Speech API

Google Cloud Text to Speech API รองรับภาษาดังต่อไปนี้:

Google Cloud API ทำงานอย่างไร?

นี่คือวิธีการใช้ Google Text to Speech API

ทางเลือกที่ดีที่สุดสำหรับ Google Cloud TTS API

คำถามที่พบบ่อยเกี่ยวกับ Google Text to Speech API

แชร์บทความนี้

Cliff Weitzman

เกี่ยวกับ Speechify

Recommended Posts

บล็อกล่าสุด

เหตุใด Speechify จึงสร้างโมเดลเสียงของตัวเองแทนใช้ API ของบุคคลที่สาม

API ปัญญาประดิษฐ์เสียงสำหรับนักพัฒนาและข้อได้เปรียบของ Speechify API

ห้องปฏิบัติการวิจัย Voice AI ระดับแนวหน้าคืออะไร

ทุกสิ่งที่ควรรู้เกี่ยวกับ Google Cloud Text to Speech API

Cliff Weitzman

Speechify API ให้บริการด้วยความเร็ว 300ms เสียงคุณภาพระดับมนุษย์ และรองรับกว่า 50 ภาษา

การแปลงข้อความเป็นเสียง

API

Google Cloud API

คุณสมบัติของ Google Text to Speech API

เสียงคุณภาพสูง

การเลือกเสียง

สร้างเสียงของคุณเอง

เสียงประสาท

เสียงสตูดิโอ

การปรับแต่งเสียง

ค่าใช้จ่ายของ Google Text to Speech API เท่าไหร่?

ความแตกต่างระหว่างตัวอักษรและไบต์คืออะไร

วิธีตั้งค่าโครงการ Google Cloud Platform Text to Speech API ของคุณ

วิธีปิดใช้งาน Text to Speech API

เริ่มต้นใช้งาน Google Text to Speech API

Google Cloud Text to Speech API รองรับภาษาดังต่อไปนี้:

Google Cloud API ทำงานอย่างไร?

นี่คือวิธีการใช้ Google Text to Speech API

ทางเลือกที่ดีที่สุดสำหรับ Google Cloud TTS API

คำถามที่พบบ่อยเกี่ยวกับ Google Text to Speech API

แชร์บทความนี้

Cliff Weitzman

เกี่ยวกับ Speechify

Recommended Posts

บล็อกล่าสุด

เหตุใด Speechify จึงสร้างโมเดลเสียงของตัวเองแทนใช้ API ของบุคคลที่สาม

API ปัญญาประดิษฐ์เสียงสำหรับนักพัฒนาและข้อได้เปรียบของ Speechify API

ห้องปฏิบัติการวิจัย Voice AI ระดับแนวหน้าคืออะไร

Speechify API ให้บริการด้วยความเร็ว 300ms  เสียงคุณภาพระดับมนุษย์ และรองรับกว่า 50 ภาษา