Chuyển văn bản thành giọng nói với Twilio
Tương tác với khách hàng là yếu tố then chốt trong marketing. Việc thu thập số điện thoại của khách thôi là chưa đủ. Bạn cần thực hiện các cuộc gọi hoặc gửi SMS định kỳ để duy trì sự gắn kết với khách hàng đó.
Đó chính là lúc Twilio phát huy tác dụng.
Với Twilio, bạn có thể sử dụng chuyển đổi giọng nói thành văn bản để tạo các cuộc gọi tự động và thiết lập hệ thống phản hồi tương tác bằng giọng nói (IVR). Nhưng ngoài tính năng chuyển giọng nói thành văn bản, Twilio còn cung cấp chuyển văn bản thành giọng nói (TTS). Hãy cùng đi sâu phân tích.
Twilio là gì?
Twilio là nền tảng giao tiếp đám mây được thiết kế để giúp bạn tương tác với khách hàng theo bất kỳ hình thức nào bạn muốn.
Ví dụ, giả sử bạn muốn thông báo cho khách về tình trạng đơn hàng. Bạn có thể chọn gọi điện thoại, gửi email hoặc nhắn tin SMS. Dù chọn cách nào, Twilio cũng cung cấp đầy đủ các chức năng cần thiết để bạn thực hiện.
Điểm đặc biệt là nền tảng Twilio sử dụng các giao diện lập trình ứng dụng (API) cho các tính năng của mình. Các lập trình viên sử dụng API để cho phép hai phần mềm giao tiếp với nhau.
Đối với Twilio, điều này giúp nền tảng có thể tích hợp với hầu hết các phần mềm khác. Giả sử bạn đã có sẵn một hệ thống điện thoại hỗ trợ hiệu quả quy trình làm việc. Bạn có thể dùng API như một phần trong bộ công cụ phát triển (SDK) để kết hợp hệ thống đó với Twilio.
Tương tự với các nền tảng thương mại điện tử sử dụng email hoặc hệ thống nhắn tin. Bằng cách sử dụng ngôn ngữ đánh dấu tổng hợp giọng nói (SSML), nền tảng này có thể chuyển đổi bất kỳ văn bản nào thành giọng nói. Twilio có thể tích hợp với tất cả để giúp việc giao tiếp với khách hàng trở nên dễ dàng hơn.
Cách kích hoạt chuyển văn bản thành giọng nói trên Twilio
Twilio đi kèm với tính năng chuyển văn bản thành giọng nói cơ bản mà bạn có thể truy cập bằng một đoạn mã đơn giản:
<Say>verb</Say>
Bạn có thể nhận thấy đoạn mã này giống với HTML. Đó là vì nhiều phần lập trình của Twilio sử dụng các kỹ thuật mã hóa tương tự nền tảng web, nghĩa là những ai quen thuộc với HTML, XML và PHP sẽ dễ dàng bắt nhịp.
Dưới đây là một ví dụ mà bạn có thể thử ngay hôm nay:
<Response>
<Say>Hello World!</Say>
</Response>
Đoạn mã đơn giản này sẽ khiến ứng dụng thoại của Twilio lập tức phát ra “Hello World”. Và với Programmable Voice API của Twilio, bạn hoàn toàn kiểm soát được cách sử dụng giọng nói này.
Kích hoạt Amazon Polly trên Twilio
Nếu bạn có tài khoản Twilio, bạn không bị giới hạn ở các tính năng nhận diện giọng nói hoặc chuyển văn bản thành giọng nói cơ bản của Twilio. Thông qua bảng điều khiển Twilio, bạn có thể truy cập nhiều giọng nói của Amazon Polly nhờ tích hợp giữa Twilio và Polly.
Nhờ sự tích hợp này, bạn không còn bị bó buộc với giọng mặc định của Twilio. Bạn có thể thử nhiều giọng khác nhau cho đến khi tìm được giọng phù hợp với dự án của mình. Sau đây là các bước thay đổi giọng đọc chuyển văn bản thành giọng nói trên Twilio:
- Truy cập Twilio.com và đăng nhập vào tài khoản của bạn.
- Chọn “Programmable Voice” từ thanh điều hướng bên trái. Biểu tượng điện thoại sẽ đại diện cho phần này.
- Nhấp vào “TwiML” và chọn “Text to Speech.”
- Đi tới mục “Current Language Mapping” và chọn ngôn ngữ mong muốn.
Bạn sẽ thấy màn hình có tiêu đề “Test & Configure Voices By Language”.
Màn hình hiển thị ba danh sách thả xuống sau:
- Ngôn ngữ
- Nhà cung cấp
- Giọng nói
Chọn ngôn ngữ, ví dụ như en-gb (Tiếng Anh - Anh). Hãy đảm bảo bạn chọn một ngôn ngữ mà khách hàng tại khu vực mục tiêu có thể hiểu.
Danh sách nhà cung cấp cho phép bạn chọn giữa chuyển văn bản thành giọng nói của Twilio hoặc Amazon Polly. Sau cùng, tùy chọn giọng cho phép bạn lựa chọn chất giọng phát âm mong muốn.
Ngoài ra còn có một hộp văn bản để bạn nhập nội dung cần thử nghiệm. Với Amazon Polly, bạn có thể thử nhiều giọng khác nhau trước khi chốt lựa chọn cuối cùng.
Thay đổi giọng đọc TTS trong TwiML
Bạn có thể dùng lệnh <Say> trong TwiML để lập trình giọng nói cụ thể cho dự án. Đoạn mã khá giống với cách sử dụng TTS cơ bản của Twilio:
<Response>
<Say voice="Polly.Kimberly" language="en-US">Hello from Kimberly</Say>
</Response>
Lưu ý cách sử dụng một giọng nói riêng của Amazon Polly trong đoạn mã này. Trước khi nhập các lệnh này, bạn cần biết tên các giọng đọc mà Polly cung cấp.
Speechify - Giải pháp thay thế Twilio cho chuyển văn bản thành giọng nói
Mặc dù Twilio rất lý tưởng cho hệ thống IVR, nhưng lại không thực sự thân thiện với người dùng phổ thông khi sử dụng TTS. Ngoài ra, Twilio cũng không phù hợp khi cần đọc văn bản từ tài liệu hay các tệp khác. Bạn sẽ phải đọc qua khá nhiều hướng dẫn để dùng thành thạo.
Nếu bạn cần một ứng dụng TTS chỉ việc tải về và dùng ngay, bạn sẽ cần một lựa chọn thay thế. Speechify là một trong những lựa chọn tốt nhất hiện nay.
Speechify là phần mềm chuyển văn bản thành giọng nói mà bạn có thể tải về cho iOS, macOS, Android và Google Chrome. Một phiên bản miễn phí của ứng dụng cũng có sẵn trên website Speechify. Ứng dụng này có rất nhiều tính năng hữu ích như:
- Truy cập các giọng đọc TTS bằng hơn 14 ngôn ngữ, bao gồm tiếng Anh, Tây Ban Nha và Ả Rập.
- Tốc độ đọc có thể điều chỉnh, giúp bạn làm chậm để dễ tiếp cận hơn hoặc tăng tốc để nâng cao hiệu suất làm việc.
- Công nghệ nhận dạng ký tự quang học (OCR) cho phép bạn quét văn bản vào ứng dụng bằng camera của thiết bị. Speechify sử dụng công nghệ học máy để đọc to văn bản trong hình ảnh.
- Giọng nói tự nhiên như người thật nhờ công nghệ AI thông minh.
- Công cụ ghi chú tiện lợi, lý tưởng để học tập cùng Speechify.
Đúng là bạn không thể dùng ứng dụng này để tạo hệ thống IVR. Tuy nhiên, với những ai quan tâm đến TTS vì mục đích học tập, hỗ trợ tiếp cận hay đọc văn bản, Speechify sẽ đáp ứng tốt nhu cầu của bạn.
Dùng thử Speechify miễn phí
Có lẽ bạn đã sẵn sàng để trải nghiệm Speechify. Tương tự Twilio, Speechify cũng cung cấp bản dùng thử miễn phí để bạn làm quen với các tính năng cơ bản. Hãy thử ngay hôm nay để xem Speechify có phải là phần mềm chuyển văn bản thành giọng nói phù hợp với bạn không.
Câu hỏi thường gặp
Làm sao để thay đổi giọng đọc của Twilio?
Bạn có thể thay đổi giọng mà Twilio sử dụng thông qua bảng điều khiển Twilio của mình. Hướng dẫn chi tiết đã được đề cập trong bài viết.
Làm sao để thêm TTS vào website của tôi?
Thông thường, bạn sẽ cần sử dụng API TTS để tích hợp chức năng chuyển văn bản thành giọng nói lên website của mình.
Twilio Voice là gì?
Twilio Voice cho phép lập trình viên kiểm soát các giọng nói được sử dụng khi giao tiếp với khách hàng. Nó được dùng cho chuyển đổi giọng nói thành văn bản, hệ thống IVR, ghi âm cuộc gọi, v.v.
Twilio Voice hỗ trợ những ngôn ngữ nào?
Twilio Voice hỗ trợ tiếng Anh Anh, tiếng Anh Mỹ, tiếng Pháp, tiếng Tây Ban Nha, tiếng Ý và tiếng Đức.
Làm sao để dùng Twilio cho phát biểu?
Bạn có thể để Twilio “phát biểu” bằng cách lập trình văn bản lên nền tảng này, sau đó sử dụng tính năng TTS để đọc nội dung thay bạn.

