Microsoft Text-to-Speech
Bekannt aus
Microsoft dominiert in den Bereichen Business, Gaming und alltägliches Computing, aber kann Microsoft TTS den Erwartungen gerecht werden?
Text-to-Speech (TTS)-Lösungen sind zu einem unverzichtbaren Bestandteil der unterstützenden Technologie geworden und helfen unzähligen PC-Nutzern, mit dem geschriebenen Wort zu interagieren, sei es zum Vergnügen, für die Schule oder die Arbeit.
Wie Sie sich vorstellen können, ist der TTS-Markt ziemlich gesättigt, mit Dutzenden von Apps und Browser-Erweiterungen zur Auswahl. Die meisten von ihnen sind sehr hilfreich und steigern Ihre Produktivität erheblich, während sie Ihnen eine benutzerfreundlichere Erfahrung bieten. Heute konzentrieren wir uns auf Microsofts TTS-Lösung — Azure.
Was ist Microsoft Text-to-Speech?
Was ist also Azure? Um diese Frage zu beantworten, können wir eine andere stellen: Möchten Sie die Möglichkeit haben, Inhalte mit natürlich klingenden Voiceovers zu erstellen oder Ihre Lieblingsseiten vorgelesen bekommen, mit einer Vielzahl anpassbarer Parameter, die es Ihnen ermöglichen, Sprechgeschwindigkeit, Tonlagen, Aussprache und vieles mehr zu justieren? Microsoft Azure ermöglicht Ihnen all das — und noch mehr.
Azure ist eine Cloud-Plattform voller Potenzial. Neben den Azure Cognitive Services, die fantastische Text-to-Speech- und Speech-to-Text-Lösungen bieten, können Sie Azure Cloud-Speicher und Analysen nutzen, um Ihre Produktivität noch weiter zu steigern, ohne kompliziertes maschinelles Lernen beherrschen zu müssen.
Da es mit verschiedenen Open-Source-Lösungen kompatibel ist, ist Azure auch ziemlich flexibel. Voiceovers in maßgeschneiderte Apps zu integrieren und Ihrem Zielpublikum die Vorteile des tiefen maschinellen Lernens zugänglich zu machen, war noch nie einfacher, insbesondere mit über hundert Sprachen und Sprachvarianten, die Azure Ihnen zur Verfügung stellt.
So verwenden Sie die Text-to-Speech-App von Microsoft auf Ihrem iPhone oder Computer
Die Einrichtung von Microsoft Azure auf Ihrem Gerät ist ziemlich einfach, und es sind nur wenige Klicks erforderlich, um sich auf der offiziellen Azure Website anzumelden. Wenn Ihre Computernutzung jedoch nicht über Programme wie Outlook, Word, PowerPoint, Docs und OneNote hinausgeht, müssen Sie nichts herunterladen, da diese Programme über eine integrierte Sprachsyntheselösung namens Speak verfügen.
Auch wenn es sich nicht um einen hochwertigen Sprachdienst handelt, ist Speak praktisch, wenn Sie in der Klemme stecken, und es ist super einfach zu konfigurieren:
- Klicken Sie auf die Option Symbolleiste anpassen, klicken Sie
- Wählen Sie die Option Weitere Befehle
- Klicken Sie auf Alle Befehle
- Finden Sie Speak, klicken Sie darauf und dann auf Hinzufügen
Alternativen zur Text-to-Speech-Anwendung von Microsoft
Wie wir im Intro erwähnt haben, gibt es viele Textleser, von professionellen Apps, die allein durch ihre Preise beeindrucken, bis hin zu kaum fertigen Spracherkennungs-SDKs auf GitHub. Wenn der Text-to-Speech-Sprachassistent von Microsoft nicht Ihren Geschmack trifft oder Sie nach Abwechslung suchen, haben wir ein paar Alternativen, die Ihnen sicherlich gefallen werden.
Speechify
Auf Platz 1 steht Speechify, das am besten bewertete TTS-Tool, das praktisch alles in eine Audiodatei verwandelt. Es funktioniert mit allen Microsoft-Anwendungen, und seine Sprachmodelle werden Sie sprachlos machen. Kombinieren Sie das mit großartigen Sprach-API-Funktionen, und Sie haben eine vielseitige Lösung, die all Ihre Bedürfnisse und Anwendungsfälle abdeckt.
Amazon Polly
Auf Platz 2 haben wir Amazon Polly, eine fantastische Lösung, die für ihre natürlich klingenden Stimmen und viele Sprechstile bekannt ist. Es unterstützt mehrere Sprachen, und seine neuronale Text-to-Speech-Technologie bietet Ihnen viele anpassbare Einstellungen, mit denen Sie jederzeit Ihre authentisch klingenden Wiedergaben aufpeppen können.
Google Cloud Text-to-Speech
Auf Platz 3 steht Googles Cloud Text-to-Speech. Natürlich, wo immer es technischen Fortschritt zu machen gibt, ist Google dabei, und der TTS-Bereich ist da keine Ausnahme. Die Lösung von Google dreht sich um die Sprachsynthese-Markup-Sprache (SSML) und funktioniert auf Basis von Bezahlung pro Zeichen, was sie sowohl zu einer nützlichen als auch erschwinglichen Wahl macht, wenn Sie an einem einmaligen Projekt arbeiten.
IBM Watson Text-to-Speech
IBM Watson belegt den 4. Platz. Was Watson von der Konkurrenz abhebt, ist seine Vielseitigkeit in Unternehmensumgebungen. Sie können es nämlich als virtuellen Assistenten oder Kundensupport-Tool und als Text-to-Speech-Lösung verwenden. Darüber hinaus ist es sehr erschwinglich, sodass Sie nirgendwo anders ein besseres Angebot finden werden, wenn Sie nach etwas Flexiblen suchen.
Readspeaker
Auf Platz 5 haben wir einen der Veteranen — Readspeaker. Mit etwa einem Vierteljahrhundert Erfahrung hat Readspeaker TTS zur Kunstform erhoben. Es unterstützt über hundert Sprachen und ist ideal für Sprachstudios und E-Learning, da es sowohl online als auch offline funktioniert.
NaturalReader
Auf Platz 6 ist NaturalReader. Diese App leistet hervorragende Arbeit mit Echtzeit-Synthese von Sprache und funktioniert mit nahezu allen Apps, die Sie auf Ihrem PC verwenden. Was NaturalReader jedoch einen Platz auf unserer Liste verschafft hat, ist der sogenannte Lesemodus, der Ihren Text von unnötigem Ballast, wie zum Beispiel Werbung, befreit.
VoiceDream Reader
Auf Platz 7 haben wir VoiceDream Reader, unsere letzte Microsoft Azure Text-to-Speech-Alternative für heute. Leider, obwohl VoiceDream Reader für einige einfachere Aufgaben gut ist, beklagen sich viele Nutzer über mangelnde Zugänglichkeit und schlechte Synchronisationsoptionen. Aber wenn Sie eine schnelle Lösung benötigen und nicht auf die fortschrittlichste neuronale TTS- und End-to-End-Technologie angewiesen sind, wird VoiceDream einen ausreichend guten Job machen.
FAQ
Ist Windows 10 TTS kostenlos?
Es gibt viele TTS-Lösungen für Windows 10. Einige davon sind kostenlos, andere nicht. Die integrierte Sprechoption, die mit Windows 10 geliefert wird und in Programmen wie Outlook und Word funktioniert, ist kostenlos. Anspruchsvollere Lösungen mit benutzerdefinierten neuronalen Sprachoptionen und anderen Funktionen, wie Microsoft Azure, erfordern jedoch ein Abonnement.
Was ist die realistischste TTS-Stimme?
Die realistischsten TTS-Stimmen sind typisch für fortschrittlichere TTS-Tools wie Amazon Polly und Speechify. Der Grad der Realismus hängt von der Sprache, dem Sprachmodell und den gewählten Parametern ab.
Was ist der Unterschied zwischen Text-to-Speech und Spracherkennung?
Obwohl viele TTS-Programme sowohl Text-to-Speech- als auch Spracherkennungsoptionen bieten, ist es wichtig, die beiden nicht zu verwechseln. Text-to-Speech-Optionen wandeln Texteingaben in ein Audioformat um, was Ihnen hilft, sich mit dem Text zu beschäftigen, während Sie andere Aufgaben erledigen. Spracherkennung hingegen bezieht sich auf die Analyse der menschlichen Stimme, entweder zu Interpretations- oder Identifikationszwecken.
Cliff Weitzman
Cliff Weitzman ist ein Verfechter für Legasthenie und der CEO und Gründer von Speechify, der weltweit führenden Text-zu-Sprache-App mit über 100.000 5-Sterne-Bewertungen und dem ersten Platz im App Store in der Kategorie Nachrichten & Zeitschriften. 2017 wurde Weitzman für seine Arbeit, das Internet für Menschen mit Lernschwierigkeiten zugänglicher zu machen, in die Forbes 30 unter 30 Liste aufgenommen. Cliff Weitzman wurde in führenden Medien wie EdSurge, Inc., PC Mag, Entrepreneur und Mashable vorgestellt.