Social Proof

微软文本转语音

Speechify是全球第一的音频阅读器。让您更快地阅读书籍、文档、文章、PDF、电子邮件——任何您需要阅读的内容。

精选推荐

forbes logocbs logotime magazine logonew york times logowall street logo
用Speechify收听这篇文章!
Speechify

微软在商业、游戏和日常计算中占据主导地位,但微软的文本转语音技术能否不负众望?

文本转语音(TTS)解决方案已成为不可或缺的辅助技术,帮助无数PC用户与书面文字互动,无论是为了娱乐、学习还是工作。

如你所想,TTS市场相当饱和,有数十种应用程序和浏览器扩展可供选择。大多数都非常有用,可以极大地提高你的生产力,并为你提供更友好的用户体验。今天,我们将重点关注微软的TTS解决方案——Azure。

什么是微软文本转语音?

那么,Azure是什么?为了回答这个问题,我们可以提出另一个问题:你是否希望能够创建具有自然语音的内容,或听你喜欢的页面被朗读给你,并且可以调整语速、语调、发音等一系列可定制参数?微软Azure让你可以做到这一切——甚至更多。

Azure是一个充满潜力的云平台。除了提供出色的文本转语音和语音转文本解决方案的Azure认知服务外,你还可以利用Azure云存储和分析来进一步提高生产力,而无需掌握复杂的机器学习。

Azure兼容各种开源解决方案,因此非常灵活。将语音合成集成到自定义应用程序中,让你的目标受众享受深度机器学习的好处从未如此简单,尤其是Azure提供的超过一百种语言和语言变体供你使用。

如何在iPhone或电脑上使用微软的文本转语音应用程序

在设备上设置微软Azure非常简单,只需点击几下即可在官方Azure网站上注册。然而,如果你的电脑使用仅限于Outlook、Word、PowerPoint、Docs和OneNote等,你无需下载任何东西,因为这些程序自带一个名为Speak的语音合成解决方案。

虽然它可能不是高质量的语音服务,但在紧急情况下,Speak非常方便,并且配置起来非常简单:

  • 点击 自定义工具栏 选项,点击
  • 选择 更多命令 选项
  • 点击 所有命令
  • 找到 Speak,点击它,然后点击 添加

微软文本转语音应用程序的替代方案

正如我们在介绍中提到的,文本阅读器种类繁多,从价格惊人的专业应用程序到GitHub上尚未完成的语音识别SDK。如果微软的文本转语音助手不符合你的口味,或者你在寻找一些变化,我们有一些替代方案一定会让你满意。

Speechify

排名第一的是Speechify,这款顶级TTS工具几乎可以将任何内容转换为音频文件。它适用于所有微软应用程序,其语音模型会让你惊叹不已。再加上出色的语音API功能,你就拥有了一种多功能的解决方案,可以满足你的所有需求和使用场景。

Amazon Polly

排名第二的是Amazon Polly,这是一款以自然语音和多种说话风格而闻名的出色解决方案。它支持多种语言,其神经文本转语音技术为你提供了许多可定制的设置,让你在想为已经逼真的播放添加趣味时可以尽情发挥。

Google Cloud Text to Speech

排名第三的是谷歌的Cloud Text to Speech。自然地,凡是有技术进步的地方,谷歌都会在场,TTS领域也不例外。谷歌的解决方案专注于语音合成标记语言(SSML),并按字符计费,因此如果你正在进行一次性项目,它既实用又经济。

IBM Watson Text to Speech

IBM Watson排名第四。Watson与竞争对手的区别在于其在企业环境中的多功能性。具体来说,你可以将其用作虚拟助手或客户支持工具以及文本转语音解决方案。更重要的是,它非常实惠,如果你在寻找灵活的解决方案,别处找不到更好的交易。

Readspeaker 

排名第5的是一位老将——Readspeaker。拥有近四分之一个世纪的经验,Readspeaker已将TTS技术发展到艺术的境界。它支持超过一百种语言,非常适合语音工作室和电子学习,因为它可以在线和离线工作。

NaturalReader 

排名第6的是NaturalReader。这款应用在实时合成语音方面表现出色,并且几乎可以与您在PC上使用的所有应用程序兼容。但NaturalReader之所以能上榜,是因为它的所谓阅读模式,可以清除文本中所有不必要的内容,例如广告。

VoiceDream Reader

排名第7的是VoiceDream Reader,这是我们今天介绍的最后一个Microsoft Azure文本转语音替代方案。不幸的是,虽然VoiceDream Reader适合一些简单的任务,但许多用户抱怨其可访问性差和同步选项不足。不过,如果您需要一个快速解决方案,并且不在乎最先进的神经TTS和端到端技术,VoiceDream还是能胜任的。

常见问题

Windows 10的TTS是免费的吗?

Windows 10有很多TTS解决方案。其中一些是免费的,而另一些则不是。Windows 10自带的Speak选项在Outlook和Word等应用中是免费的,但更复杂的解决方案,如具有自定义神经语音选项和其他功能的Microsoft Azure,则需要订阅。

最逼真的TTS语音是什么?

最逼真的TTS语音通常出现在更高级的TTS工具中,如Amazon Polly和Speechify。逼真度取决于语言、语音模型以及您选择的参数。

文本转语音和语音识别有什么区别?

虽然许多TTS程序同时提供文本转语音和语音识别选项,但重要的是不要混淆两者。文本转语音选项会将文本输入转换为音频格式,帮助您在完成其他任务时与文本互动。而语音识别则是对人类语音的分析,用于解释或识别。

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman 是一位阅读障碍倡导者,也是全球排名第一的文字转语音应用Speechify的首席执行官和创始人,该应用在App Store新闻与杂志类中排名第一,拥有超过10万个五星好评。2017年,Weitzman因其在提高学习障碍人士网络可访问性方面的贡献,被评为福布斯30位30岁以下精英之一。Cliff Weitzman曾被EdSurge、Inc.、PC Mag、Entrepreneur、Mashable等知名媒体报道。