Microsoft synthèse vocale
À l'honneur dans
Microsoft règne en maître dans les affaires, le jeu et l'informatique quotidienne, mais la synthèse vocale de Microsoft est-elle à la hauteur de sa réputation ?
Les solutions de synthèse vocale (TTS) sont devenues un outil indispensable de la technologie d'assistance, aidant d'innombrables utilisateurs de PC à interagir avec le texte écrit, que ce soit pour le plaisir, l'école ou le travail.
Comme vous pouvez l'imaginer, le marché de la synthèse vocale est quelque peu saturé, avec des dizaines d'applications et d'extensions de navigateur parmi lesquelles choisir. La plupart d'entre elles sont très utiles, et elles feront des merveilles pour votre productivité tout en vous offrant une expérience plus conviviale. Aujourd'hui, nous nous concentrerons sur la solution TTS de Microsoft — Azure.
Qu'est-ce que la synthèse vocale de Microsoft ?
Qu'est-ce qu'Azure, alors ? Pour répondre à cette question, nous pouvons en poser une autre : Voulez-vous le pouvoir de créer du contenu avec des voix off naturelles ou d'écouter vos pages préférées narrées pour vous, avec une multitude de paramètres personnalisables qui vous permettront d'ajuster le débit de parole, les tons, la prononciation, et tout le reste ? Microsoft Azure vous permet de faire tout cela — et plus encore.
Azure est une plateforme cloud débordante de potentiel. En plus des services cognitifs Azure qui offrent d'excellentes solutions de synthèse vocale et de reconnaissance vocale, vous pouvez utiliser le stockage cloud et l'analyse Azure pour pousser encore plus loin votre productivité sans avoir besoin de maîtriser un apprentissage automatique complexe.
Compatible avec diverses solutions open-source, Azure est également très flexible. Intégrer des voix off dans des applications personnalisées et permettre à votre public cible de profiter des avantages de l'apprentissage profond n'a jamais été aussi facile, surtout avec plus de cent langues et variantes linguistiques qu'Azure mettra à votre disposition.
Comment utiliser l'application de synthèse vocale de Microsoft sur votre iPhone ou ordinateur
Configurer Microsoft Azure sur votre appareil est assez simple, et il suffit de quelques clics pour s'inscrire sur le site officiel Azure. Cependant, si votre utilisation de l'ordinateur ne dépasse pas des programmes comme Outlook, Word, PowerPoint, Docs et OneNote, vous n'aurez rien à télécharger car ces programmes sont équipés d'une solution de synthèse vocale intégrée appelée Speak.
Bien qu'il ne s'agisse pas d'un service vocal de haute qualité, Speak est pratique en cas de besoin urgent, et il est très facile à configurer :
- Cliquez sur l'option Personnaliser la barre d'outils, cliquez
- Sélectionnez l'option Plus de commandes
- Cliquez sur Toutes les commandes
- Trouvez Speak, cliquez dessus, puis cliquez sur Ajouter
Alternatives à l'application de synthèse vocale de Microsoft
Comme nous l'avons mentionné dans l'introduction, les lecteurs de texte sont nombreux, allant d'applications professionnelles qui vous épateront rien qu'avec leur prix à des SDK de reconnaissance vocale à peine terminés sur GitHub. Si l'assistant vocal de synthèse vocale de Microsoft ne vous convient pas, ou si vous cherchez de la variété, nous avons quelques alternatives qui sauront sûrement vous séduire.
Speechify
En première position, nous avons Speechify, l'outil TTS le mieux noté qui transformera pratiquement tout en fichier audio. Il fonctionne avec toutes les applications Microsoft, et ses modèles de voix vous laisseront sans voix. Ajoutez à cela d'excellentes capacités d'API vocale, et vous avez une solution polyvalente qui répondra à tous vos besoins et cas d'utilisation.
Amazon Polly
En deuxième position, nous avons Amazon Polly, une solution fantastique célèbre pour ses voix naturelles et ses nombreux styles de parole. Elle prend en charge plusieurs langues, et sa technologie de synthèse vocale neuronale vous offrira de nombreux réglages personnalisables pour pimenter vos lectures déjà authentiques.
Google Cloud Text to Speech
En troisième position, il y a Google Cloud Text to Speech. Naturellement, là où il y a des progrès technologiques à faire, Google sera présent, et le domaine de la synthèse vocale ne fait pas exception. La solution de Google repose sur le langage de balisage de synthèse vocale (SSML), et elle fonctionne sur une base de paiement par caractère, ce qui en fait un choix à la fois utile et abordable si vous travaillez sur un projet ponctuel.
IBM Watson Text to Speech
IBM Watson prend la quatrième place. Ce qui distingue Watson de la concurrence, c'est sa polyvalence dans les environnements d'entreprise. En effet, vous pouvez l'utiliser comme assistant virtuel ou outil de support client et solution de synthèse vocale. De plus, il est très abordable, vous ne trouverez donc pas de meilleure offre ailleurs si vous cherchez quelque chose de flexible.
Readspeaker
En cinquième position, nous avons l'un des vétérans — Readspeaker. Avec environ un quart de siècle d'expérience, Readspeaker a perfectionné la synthèse vocale. Il prend en charge plus de cent langues et est idéal pour les studios de voix et l'e-learning, car il peut fonctionner à la fois en ligne et hors ligne.
NaturalReader
En sixième position, NaturalReader. Cette application excelle dans la synthèse vocale en temps réel et fonctionne avec presque toutes les applications que vous utilisez sur votre PC. Mais ce qui a valu à NaturalReader sa place sur notre liste, c'est son mode lecteur qui élimine tout le superflu de votre texte, comme les publicités.
VoiceDream Reader
En septième position, nous avons VoiceDream Reader, notre dernière alternative à Microsoft Azure pour aujourd'hui. Malheureusement, bien que VoiceDream Reader soit efficace pour certaines tâches simples, de nombreux utilisateurs se plaignent d'un manque d'accessibilité et de mauvaises options de synchronisation. Mais si vous avez besoin d'une solution rapide et que vous ne vous souciez pas des technologies TTS neuronales les plus avancées, VoiceDream fera un travail suffisamment correct.
FAQ
Le TTS de Windows 10 est-il gratuit ?
Il existe de nombreuses solutions TTS pour Windows 10. Certaines sont gratuites, d'autres non. L'option Speak intégrée à Windows 10, qui fonctionne dans des applications comme Outlook et Word, est gratuite, mais des solutions plus sophistiquées avec des options de voix neuronales personnalisées et d'autres fonctionnalités, comme Microsoft Azure, nécessitent un abonnement.
Quelle est la voix TTS la plus réaliste ?
Les voix TTS les plus réalistes sont typiques des outils TTS plus avancés tels qu'Amazon Polly et Speechify. Les niveaux de réalisme dépendent de la langue, du modèle de synthèse vocale et des paramètres de votre choix.
Quelle est la différence entre la synthèse vocale et la reconnaissance vocale ?
Bien que de nombreux programmes TTS offrent à la fois des options de synthèse vocale et de reconnaissance vocale, il est important de ne pas les confondre. Les options de synthèse vocale transforment l'entrée textuelle en format audio, vous aidant à interagir avec le texte tout en effectuant d'autres tâches. La reconnaissance vocale, en revanche, se réfère à l'analyse de la voix humaine, soit pour l'interpréter, soit pour l'identifier.
Cliff Weitzman
Cliff Weitzman est un défenseur de la dyslexie et le PDG et fondateur de Speechify, l'application de synthèse vocale numéro 1 au monde, totalisant plus de 100 000 avis 5 étoiles et se classant en première place dans la catégorie Actualités & Magazines de l'App Store. En 2017, Weitzman a été nommé dans la liste Forbes des moins de 30 ans pour son travail visant à rendre Internet plus accessible aux personnes ayant des troubles d'apprentissage. Cliff Weitzman a été présenté dans EdSurge, Inc., PC Mag, Entrepreneur, Mashable, parmi d'autres médias de premier plan.