掲載メディア
Microsoftはビジネス、ゲーム、日常のコンピューティングで圧倒的な存在感を誇りますが、Microsoft TTSはその期待に応えられるのでしょうか?
テキスト読み上げ(TTS)ソリューションは、楽しみや学業、仕事のために、無数のPCユーザーが文字と対話するのを助ける不可欠な支援技術となっています。
ご想像の通り、TTS市場はやや飽和状態で、選べるアプリやブラウザ拡張機能が数多くあります。ほとんどが非常に役立ち、生産性を大いに向上させ、よりユーザーフレンドリーな体験を提供します。今日は、MicrosoftのTTSソリューションであるAzureに焦点を当てます。
Microsoft テキスト読み上げとは?
では、Azureとは何でしょうか?その質問に答えるために、別の質問を投げかけます。自然な音声でコンテンツを作成したり、お気に入りのページをナレーションで聞いたり、話速やトーン、発音などを調整できるカスタマイズ可能なパラメータを持ちたいですか?Microsoft Azureはそれを可能にします—そしてさらに多くのことを。
Azureは可能性に満ちたクラウドプラットフォームです。素晴らしいテキスト読み上げと音声認識ソリューションを提供するAzureの認知サービスに加えて、Azureのクラウドストレージと分析を利用して、生産性をさらに向上させることができます。複雑な機械学習を習得する必要はありません。
さまざまなオープンソースソリューションと互換性があるため、Azureは非常に柔軟です。カスタムアプリに音声を組み込み、ターゲットオーディエンスが深層機械学習の恩恵を受けることがこれまでになく簡単になりました。特に、Azureは100以上の言語と言語バリエーションを提供します。
iPhoneやコンピュータでMicrosoftのテキスト読み上げアプリを使用する方法
デバイスにMicrosoft Azureを設定するのは非常に簡単で、公式Azureウェブサイトで数回クリックするだけでサインアップできます。ただし、Outlook、Word、PowerPoint、Docs、OneNoteなどの使用に限られる場合は、何もダウンロードする必要はありません。これらのプログラムには、Speakという組み込みの音声合成ソリューションが付属しています。
高品質な音声サービスではないかもしれませんが、Speakは緊急時に便利で、設定も非常に簡単です:
- カスタマイズツールバーオプションをクリックし、クリック
- その他のコマンドオプションを選択
- すべてのコマンドをクリック
- Speakを見つけてクリックし、追加をクリック
Microsoftのテキスト読み上げアプリケーションの代替案
イントロで述べたように、テキストリーダーは豊富にあり、価格だけで驚かせるプロフェッショナルなアプリから、GitHub上の未完成の音声認識SDKまでさまざまです。Microsoftのテキスト読み上げ音声アシスタントが好みでない場合や、バリエーションを求めている場合は、いくつかの代替案をご紹介します。
Speechify
第1位はSpeechifyです。最高評価のTTSツールで、ほぼすべてを音声ファイルに変換します。すべてのMicrosoftアプリケーションと連携し、その音声モデルは驚くべきものです。優れた音声API機能と組み合わせれば、あらゆるニーズと使用ケースに対応する多用途なソリューションが手に入ります。
Amazon Polly
第2位はAmazon Pollyです。自然な音声と豊富な話し方で有名な素晴らしいソリューションです。複数の言語をサポートし、ニューラルテキスト読み上げ技術により、すでに本格的な再生にスパイスを加えるためのカスタマイズ可能な設定が豊富に用意されています。
Google Cloud Text to Speech
第3位はGoogleのCloud Text to Speechです。技術の進歩があるところには必ずGoogleがあり、TTSの分野も例外ではありません。Googleのソリューションは音声合成マークアップ言語(SSML)に特化しており、文字単位の課金制なので、一度限りのプロジェクトに取り組む場合には便利で手頃な選択肢です。
IBM Watson Text to Speech
第4位はIBM Watsonです。Watsonが競合他社と一線を画すのは、企業環境での多用途性です。具体的には、バーチャルアシスタントやカスタマーサポートツールとして、またテキスト読み上げソリューションとして使用できます。さらに、非常に手頃な価格で、柔軟性を求めるなら他に勝る選択肢はありません。
Readspeaker
第5位はベテランの一つ、Readspeakerです。約四半世紀の経験を持ち、TTSを芸術の域にまで高めています。100以上の言語に対応しており、オンラインとオフラインの両方で動作するため、音声スタジオやeラーニングに最適です。
NaturalReader
第6位はNaturalReaderです。このアプリはリアルタイムの合成音声で優れたパフォーマンスを発揮し、PCで使用するほぼすべてのアプリと連携します。しかし、NaturalReaderがリストに載った理由は、広告などの不要な要素を排除する「リーダーモード」があるからです。
VoiceDream Reader
第7位はVoiceDream Readerで、今日の最後のMicrosoft Azureテキスト読み上げの代替です。残念ながら、VoiceDream Readerは簡単なタスクには向いていますが、多くのユーザーがアクセシビリティの欠如や同期オプションの不備を指摘しています。しかし、高度なニューラルTTSやエンドツーエンド技術を求めないのであれば、VoiceDreamは十分な仕事をしてくれます。
よくある質問
Windows 10のTTSは無料ですか?
Windows 10には多くのTTSソリューションがあります。その中には無料のものもあれば、有料のものもあります。Windows 10に付属しているOutlookやWordで動作する「Speak」オプションは無料ですが、カスタムニューラルボイスオプションやその他の機能を備えたより高度なソリューション、例えばMicrosoft Azureはサブスクリプションが必要です。
最もリアルなTTS音声は何ですか?
最もリアルなTTS音声は、Amazon PollyやSpeechifyのような高度なTTSツールに見られます。リアリズムのレベルは、言語、音声モデル、選択したパラメータによって異なります。
テキスト読み上げと音声認識の違いは何ですか?
多くのTTSプログラムはテキスト読み上げと音声認識の両方のオプションを提供していますが、これらを混同しないことが重要です。テキスト読み上げオプションは、テキスト入力を音声形式に変換し、他の作業をしながらテキストに関与するのを助けます。一方、音声認識は、人間の声を分析し、解釈または識別することを目的としています。
クリフ・ワイツマン
クリフ・ワイツマンはディスレクシアの提唱者であり、世界で最も人気のあるテキスト読み上げアプリ「Speechify」のCEO兼創設者です。このアプリは10万件以上の5つ星レビューを獲得し、App Storeのニュース&雑誌カテゴリーで1位にランクインしています。2017年には、学習障害を持つ人々にインターネットをよりアクセスしやすくする取り組みが評価され、Forbesの30 Under 30に選ばれました。クリフ・ワイツマンは、EdSurge、Inc.、PC Mag、Entrepreneur、Mashableなどの主要メディアで取り上げられています。