Amazon Polly là gì?
Amazon Polly là một dịch vụ do Amazon Web Services (AWS) cung cấp, giúp chuyển đổi văn bản thành giọng nói sống động như thật. Dịch vụ này cho phép các ứng dụng hiện tại tích hợp khả năng đọc to nội dung như một phần thiết yếu và mở ra cơ hội phát triển các sản phẩm hoàn toàn mới có tính năng chuyển văn bản thành giọng nói, từ các ứng dụng di động, xe hơi, tới các thiết bị và đồ gia dụng. Amazon Polly cung cấp sẵn hàng chục giọng đọc tự nhiên và hỗ trợ nhiều ngôn ngữ, vì vậy bạn có thể lựa chọn giọng nói phù hợp nhất và triển khai các ứng dụng có tính năng giọng nói ở nhiều khu vực địa lý.
Amazon Polly là một trong nhiều sản phẩm được cung cấp bởi AWS Services. Các dịch vụ khác bao gồm Amazon S3, Amazon IAM, CloudWatch, Amazon Simple Workflow, DynamoDB, DevOps và Amazon Lambda.
Tổng quan về phần mềm chuyển văn bản thành giọng nói Amazon Polly
Amazon Polly sử dụng các công nghệ học sâu để tổng hợp giọng nói con người tự nhiên, nhờ đó bạn có thể biến các bài viết thành âm thanh. Với hàng chục giọng đọc sống động trên nhiều ngôn ngữ, bạn có thể dùng Amazon Polly để xây dựng các ứng dụng kích hoạt bằng giọng nói. Bạn có thể nhập dữ liệu đầu vào dưới dạng văn bản thuần hoặc theo định dạng Speech Synthesis Markup Language (SSML). Với SSML, bạn có thể kiểm soát nhiều khía cạnh của giọng nói, như phát âm, âm lượng, cao độ và tốc độ nói.
Amazon Polly có thể xuất giọng nói tổng hợp dưới nhiều định dạng khác nhau. Bạn có thể chọn định dạng tệp âm thanh phù hợp nhất với nhu cầu. Ví dụ, bạn có thể yêu cầu giọng đọc ở định dạng MP3 hoặc Ogg Vorbis cho các ứng dụng web và di động. Hoặc bạn có thể chọn định dạng PCM để sử dụng cho các thiết bị AWS IoT và giải pháp điện thoại.
Giá thành và các trường hợp sử dụng Amazon Polly
Amazon Polly hoạt động theo mô hình trả tiền theo mức độ sử dụng, nghĩa là bạn chỉ trả cho những gì bạn dùng. Giá được tính dựa trên số lượng ký tự văn bản mà bạn chuyển đổi thành giọng nói hoặc metadata Speech Marks. Giọng nói tiêu chuẩn của Amazon Polly có giá $4.00 cho mỗi 1 triệu ký tự cho các yêu cầu chuyển đổi thành giọng nói hoặc Speech Marks khi vượt ngoài giới hạn miễn phí. Giọng nói Neural của Amazon Polly, cung cấp tổng hợp giọng nói hiện đại và tự nhiên hơn, có giá $16.00 cho mỗi 1 triệu ký tự cho các yêu cầu chuyển đổi thành giọng nói hoặc Speech Marks khi vượt ngoài giới hạn miễn phí.
Bên cạnh đó, Amazon Polly còn cung cấp Gói Miễn Phí dành cho những người mới bắt đầu. Gói Miễn Phí bao gồm 5 triệu ký tự mỗi tháng cho các yêu cầu chuyển văn bản thành giọng nói hoặc Speech Marks trong 12 tháng đầu, tính từ lần đầu bạn yêu cầu chuyển đổi giọng nói. Điều này giúp các startup và doanh nghiệp nhỏ tích hợp tính năng chuyển văn bản thành giọng nói vào ứng dụng của mình mà không tốn quá nhiều chi phí ban đầu.
Amazon Polly có thể được ứng dụng trong rất nhiều trường hợp, bạn có thể tìm hiểu thêm thông qua các hướng dẫn trực tuyến. Trong lĩnh vực E-learning và giáo dục, dịch vụ này có thể dùng để tạo tài liệu học tập tương tác và hỗ trợ người gặp khó khăn trong việc đọc. Trong các hệ thống giao thông công cộng và kiểm soát công nghiệp, Amazon Polly có thể được dùng cho các thông báo SNS và cảnh báo khẩn cấp. Nó cũng có thể được tích hợp trên nhiều thiết bị như đầu thu set-top box, đồng hồ thông minh, máy tính bảng, điện thoại thông minh và thiết bị IoT, mang lại trải nghiệm âm thanh tương tác hơn cho người dùng. Các trường hợp sử dụng khác bao gồm trò chơi đố vui, hoạt hình, avatar và tạo giọng thuyết minh cho các giải pháp TTS trên nền tảng đám mây.
Tầm quan trọng của việc xem xét và hiểu điều khoản dịch vụ Amazon Polly
Nắm rõ Điều khoản dịch vụ (TOS) sẽ giúp người dùng tránh những rủi ro tiềm ẩn và tối ưu hóa việc sử dụng dịch vụ. Ví dụ, TOS có thể chỉ rõ các giới hạn và quyền nhất định liên quan đến việc sử dụng Amazon Polly hoặc làm rõ trách nhiệm của người dùng về quyền riêng tư và bảo mật dữ liệu. Bằng việc xem xét và hiểu rõ TOS, người dùng có thể đảm bảo sử dụng Amazon Polly đúng theo các quy định hiện hành.
Danh sách các quyền người dùng được Amazon Polly cấp
Amazon Polly cấp cho người dùng một số quyền giúp họ khai thác tối đa dịch vụ, bao gồm:
1. Quyền sử dụng dịch vụ: Người dùng được phép sử dụng Amazon Polly để chuyển đổi văn bản thành giọng nói. Quyền này bao gồm cả việc lựa chọn nhiều giọng đọc, ngôn ngữ khác nhau và kiểm soát các yếu tố như phát âm, âm lượng, cao độ, tốc độ nói thông qua SSML.
2. Quyền lưu vào bộ nhớ đệm và phát lại giọng nói: Người dùng có quyền lưu vào bộ nhớ đệm và phát lại giọng nói do Amazon Polly tạo ra mà không phát sinh thêm chi phí. Điều này giúp người dùng tái sử dụng cùng một tệp giọng nói trong nhiều ứng dụng hoặc kịch bản khác nhau mà không bị tính phí bổ sung.
3. Quyền phân phối ứng dụng: Người dùng có quyền phân phối các ứng dụng tích hợp giọng nói tại nhiều khu vực trên thế giới. Điều này giúp ứng dụng tiếp cận người dùng toàn cầu theo thời gian thực.
4. Quyền truy cập và sử dụng API: Người dùng có quyền truy cập và sử dụng API của Amazon Polly để tích hợp dịch vụ vào ứng dụng của mình. Quyền này bao gồm cả việc tự động gửi văn bản lên API và nhận lại tệp âm thanh đã tổng hợp.
Thỏa thuận bảo mật của Amazon Polly và ảnh hưởng đến tính năng nhân bản giọng nói
Amazon Polly coi trọng bảo mật thông tin người dùng. Do đó, tính năng nhân bản giọng nói của Amazon Polly được thiết kế để đảm bảo dữ liệu của người dùng luôn được giữ kín và an toàn. Chi tiết về cách điều này ảnh hưởng đến tính năng nhân bản giọng nói sẽ được nêu rõ trong thỏa thuận bảo mật của Amazon Polly.
Thỏa thuận bảo mật thường quy định rằng Amazon Polly sẽ không tiết lộ bất kỳ dữ liệu người dùng nào nếu không có sự đồng ý của họ, trừ khi bị yêu cầu bởi pháp luật hoặc thật sự cần thiết để cung cấp dịch vụ. Điều này có nghĩa là khi sử dụng tính năng nhân bản giọng nói, dữ liệu giọng nói của bạn luôn được bảo mật và không bị chia sẻ cho bên thứ ba.
Ngoài ra, Amazon Polly còn triển khai các biện pháp bảo mật mạnh mẽ nhằm bảo vệ dữ liệu người dùng, bao gồm mã hóa dữ liệu giọng nói khi truyền và lưu trữ, cùng với cơ chế kiểm soát quyền truy cập nghiêm ngặt để ngăn chặn truy cập trái phép.
Quyền của Amazon Polly về việc thay đổi Điều Khoản Dịch Vụ (ToS)
Amazon bảo lưu quyền thay đổi Điều khoản dịch vụ của Amazon Polly bất kỳ lúc nào. Đây là một điều khoản tiêu chuẩn trong hầu hết các hợp đồng dịch vụ, nhằm cho phép nhà cung cấp điều chỉnh điều khoản khi có thay đổi, như quy định pháp lý mới, thay đổi sản phẩm/dịch vụ hoặc sự phát triển của công nghệ.
Khi Amazon thay đổi Điều khoản dịch vụ, họ thường sẽ thông báo trước cho người dùng về những cập nhật này. Thông báo có thể được gửi qua nhiều kênh khác nhau, như đăng trên trang web Amazon Polly, gửi email tới người dùng hoặc hiển thị thông báo trên AWS Management Console.
Người dùng nên kiểm tra Điều khoản dịch vụ định kỳ để kịp thời nắm bắt các thay đổi. Nếu người dùng tiếp tục sử dụng Amazon Polly sau khi các thay đổi có hiệu lực, điều đó đồng nghĩa với việc họ đã chấp nhận các điều khoản mới.
Việc thu thập và sử dụng dữ liệu của Amazon Polly
Amazon Polly thu thập và sử dụng dữ liệu để cung cấp cũng như cải thiện dịch vụ. Điều này bao gồm dữ liệu do người dùng cung cấp trực tiếp như văn bản đầu vào để tổng hợp giọng nói, và cả dữ liệu được thu thập tự động như dữ liệu sử dụng.
Văn bản đầu vào do người dùng cung cấp sẽ được dùng để tổng hợp thành giọng nói. Amazon Polly sử dụng các thuật toán máy học để phân tích văn bản và tạo ra giọng đọc sống động với giọng và ngôn ngữ đã chọn. Dữ liệu sử dụng do Amazon Polly thu thập bao gồm thông tin như số lượng yêu cầu, thời lượng sử dụng và lượng dữ liệu đã xử lý. Dữ liệu này được dùng để giám sát hiệu suất dịch vụ, nhận diện và khắc phục sự cố, cũng như cải tiến sản phẩm.
Ngoài ra, Amazon Polly có thể sử dụng dữ liệu cho các mục đích khác như được mô tả trong Chính sách quyền riêng tư của AWS. Điều này bao gồm việc dùng dữ liệu để phát triển tính năng/dịch vụ mới, hỗ trợ khách hàng và liên hệ với người dùng về dịch vụ.
Amazon cam kết bảo vệ quyền riêng tư và bảo mật dữ liệu cũng như nội dung của bạn. Họ áp dụng các biện pháp bảo mật mạnh mẽ để bảo vệ dữ liệu, bao gồm mã hóa dữ liệu khi truyền tải và lưu trữ, cùng với kiểm soát quyền truy cập nghiêm ngặt. Việc sử dụng dữ liệu bởi Amazon Polly phải tuân theo Chính sách quyền riêng tư của AWS và Điều khoản dịch vụ Amazon Polly.
Chấp nhận Điều Khoản Dịch Vụ Amazon Polly
Để chấp nhận Điều khoản dịch vụ Amazon Polly, người dùng đăng nhập vào tài khoản AWS và thường cần nhấn nút "Tôi đồng ý" hoặc đánh dấu vào ô xác nhận trong quá trình đăng ký hoặc khi sử dụng dịch vụ lần đầu. Bằng hành động này, người dùng xác nhận đã đọc, hiểu và đồng ý chịu sự ràng buộc của Điều khoản dịch vụ.
Làm thế nào để hủy đăng ký Amazon Polly?
Để hủy đăng ký Amazon Polly, bạn thường cần truy cập AWS Management Console, chọn dịch vụ Amazon Polly và làm theo hướng dẫn để hủy dịch vụ. Lưu ý rằng các khoản phí phát sinh trước thời điểm hủy vẫn sẽ phải thanh toán đầy đủ.
Các lựa chọn thay thế Amazon Polly
Speechify là một đối thủ lớn khác trên thị trường phần mềm chuyển văn bản thành giọng nói.
Speechify
Speechify cung cấp tính năng độc đáo với các giọng đọc người nổi tiếng chính thức, cho phép người dùng nghe văn bản được đọc bằng giọng của thần tượng yêu thích, mang lại trải nghiệm thú vị và lôi cuốn hơn.
Nền tảng này được thiết kế cực kỳ linh hoạt, cho phép người dùng tùy chỉnh giọng đọc để chọn giọng phù hợp với khả năng tiếp thu và sự thoải mái của mình. Tính năng này đặc biệt hữu ích cho những ai muốn nắm bắt thông tin với tốc độ nhanh hơn, khi Speechify hỗ trợ tốc độ nghe lên tới 5 lần bình thường.
Speechify còn đảm bảo trải nghiệm liền mạch trên nhiều thiết bị. Dù bạn sử dụng máy tính để bàn Microsoft hay thiết bị di động Apple, bạn đều có thể dễ dàng truy cập và sử dụng các dịch vụ của Speechify, rất tiện lợi cho những người thường xuyên di chuyển.
Về tùy chọn giọng nói, Speechify cũng rất đa dạng. Nền tảng này có hơn 30 giọng đọc tự nhiên như con người, mang đến nhiều lựa chọn để người dùng tìm ra giọng phù hợp nhất với sở thích. Điều này nâng cao trải nghiệm tổng thể, giúp quá trình chuyển văn bản thành giọng nói trở nên thú vị, tự nhiên hơn và bớt “máy móc”.
Bên cạnh đó, Speechify hỗ trợ hơn 15 ngôn ngữ khác nhau, khiến nó trở thành công cụ linh hoạt cho người dùng đa dạng ngôn ngữ. Tính năng này cũng đặc biệt hữu ích cho người học ngoại ngữ muốn nghe lại văn bản bằng ngôn ngữ đích.
Tóm lại, các tính năng độc đáo và khả năng mạnh mẽ của Speechify khiến nó trở thành một đối thủ đáng gờm trên thị trường phần mềm chuyển văn bản thành giọng nói.
Kết luận
Amazon Polly là một công cụ mạnh mẽ giúp “thổi hồn” vào các ứng dụng của bạn bằng giọng nói sống động như thật. Dù bạn đang phát triển nền tảng học trực tuyến, hệ thống thông báo giao thông công cộng hay một ứng dụng di động mới, Amazon Polly đều có thể cung cấp khả năng tổng hợp giọng nói chất lượng cao mà bạn cần. Tuy nhiên, việc hiểu rõ điều khoản dịch vụ, giá thành và chính sách sử dụng dữ liệu là điều rất quan trọng trước khi bắt đầu sử dụng dịch vụ. Nếu bạn có câu hỏi hoặc cần thêm thông tin, tài liệu và mục Hỏi Đáp của Amazon Polly là nguồn tham khảo rất hữu ích.
Câu hỏi thường gặp
Amazon Polly là dịch vụ gì?
Amazon Polly là một dịch vụ do Amazon Web Services (AWS) cung cấp, giúp chuyển đổi văn bản thành giọng nói sống động như thật. Dịch vụ này cho phép các ứng dụng hiện có có thể phát nói nội dung như một tính năng quan trọng và mở ra cơ hội phát triển các sản phẩm mới có khả năng chuyển văn bản thành giọng nói.
Tôi có thể sử dụng Amazon Polly cho mục đích thương mại không?
Có, bạn hoàn toàn có thể sử dụng Amazon Polly cho mục đích thương mại. Dịch vụ được thiết kế để dùng cho nhiều loại ứng dụng khác nhau, bao gồm E-learning và giáo dục, hệ thống thông báo giao thông công cộng, hệ thống điều khiển công nghiệp cho thông báo và cảnh báo khẩn cấp, đầu thu set-top box, đồng hồ thông minh, máy tính bảng, điện thoại thông minh và thiết bị IoT, giải pháp điện thoại, trò chơi đố vui, hoạt hình, avatar và tạo giọng thuyết minh.
Lợi ích của Amazon Polly là gì?
Amazon Polly cung cấp chất lượng giọng đọc cao, tự nhiên, phù hợp với nhiều ứng dụng khác nhau. Dịch vụ hỗ trợ nhiều ngôn ngữ và nhiều lựa chọn giọng đọc đa dạng. Ngoài ra, Amazon Polly còn hỗ trợ SSML, cho phép người dùng kiểm soát các khía cạnh như phát âm, âm lượng, cao độ và tốc độ nói.
Amazon Polly hỗ trợ định dạng nào?
Amazon Polly hỗ trợ nhiều định dạng âm thanh, bao gồm MP3, Vorbis và luồng âm thanh PCM thô.
Sự khác biệt giữa voice và voicelet là gì?
Voice là thuật ngữ chỉ các đặc điểm giọng nói cụ thể mà Amazon Polly sử dụng để tổng hợp giọng nói, gồm ngôn ngữ, giọng địa phương và giới tính. Ngược lại, voicelet là thuật ngữ hầu như không được sử dụng trong ngữ cảnh của Amazon Polly hoặc các dịch vụ chuyển văn bản thành giọng nói.
Amazon Polly hoạt động như thế nào?
Amazon Polly chuyển đổi văn bản đầu vào thành giọng nói sống động. Bạn gọi một phương thức tổng hợp giọng nói, cung cấp văn bản muốn tổng hợp, chọn một trong các giọng Neural Text-to-Speech (NTTS) hoặc giọng Standard Text-to-Speech (TTS), và chỉ định định dạng tệp âm thanh đầu ra. Amazon Polly sau đó sẽ tổng hợp văn bản thành luồng âm thanh chất lượng cao.
Làm thế nào để ngừng sử dụng Amazon Polly?
Để ngừng sử dụng Amazon Polly, bạn thường cần truy cập AWS Management Console, chọn dịch vụ Amazon Polly và thực hiện các bước hủy dịch vụ theo hướng dẫn. Lưu ý rằng bạn vẫn phải thanh toán mọi khoản phí phát sinh trước thời điểm hủy.
Amazon Polly có giá bao nhiêu?
Giọng nói tiêu chuẩn của Amazon Polly có giá $4.00 cho mỗi 1 triệu ký tự cho các yêu cầu chuyển đổi giọng nói hoặc Speech Marks (vượt ngoài giới hạn miễn phí). Giọng nói Neural của Amazon Polly có giá $16.00 cho mỗi 1 triệu ký tự cho các yêu cầu chuyển đổi giọng nói hoặc Speech Marks (vượt ngoài giới hạn miễn phí). Ngoài ra còn có gói miễn phí gồm 5 triệu ký tự mỗi tháng cho các yêu cầu chuyển đổi giọng nói hoặc Speech Marks, trong 12 tháng đầu kể từ lần đầu bạn sử dụng dịch vụ.

