Microsoft tekstistä puheeksi
Esillä
Microsoft hallitsee liiketoimintaa, pelaamista ja jokapäiväistä tietokoneenkäyttöä, mutta voiko Microsoft TTS vastata odotuksiin?
Tekstistä puheeksi (TTS) -ratkaisut ovat tulleet korvaamattomaksi osaksi avustavaa teknologiaa, auttaen lukemattomia PC-käyttäjiä vuorovaikutuksessa kirjoitetun sanan kanssa, olipa kyseessä sitten huvi, koulu tai työ.
Kuten voit kuvitella, TTS-markkinat ovat melko kyllästyneet, ja tarjolla on kymmeniä sovelluksia ja selainlaajennuksia. Useimmat niistä ovat varsin hyödyllisiä, ja ne parantavat tuottavuuttasi ja tarjoavat käyttäjäystävällisemmän kokemuksen. Tänään keskitymme Microsoftin TTS-ratkaisuun — Azureen.
Mikä on Microsoft tekstistä puheeksi?
Mikä sitten on Azure? Vastaamme kysymykseen toisella: Haluatko luoda sisältöä luonnolliselta kuulostavilla ääniraidoilla tai kuunnella suosikkisivujasi, joissa on joukko muokattavia parametreja, joiden avulla voit säätää puhenopeutta, sävyjä, ääntämistä ja kaikkea muuta? Microsoft Azure antaa sinun tehdä kaiken tämän — ja enemmän.
Azure on pilvialusta, joka on täynnä potentiaalia. Azure-kognitiivisten palveluiden lisäksi, jotka tarjoavat upeita tekstistä puheeksi ja puheesta tekstiksi -ratkaisuja, voit hyödyntää Azure-pilvitallennusta ja analytiikkaa parantaaksesi tuottavuuttasi ilman, että sinun tarvitsee hallita monimutkaista koneoppimista.
Yhteensopivuus erilaisten avoimen lähdekoodin ratkaisujen kanssa tekee Azuresta myös varsin joustavan. Ääniraitojen integroiminen räätälöityihin sovelluksiin ja kohdeyleisön hyödyntäminen syväoppimisen eduista ei ole koskaan ollut helpompaa, varsinkin kun Azure tarjoaa käyttöösi yli sata kieltä ja kielivarianttia.
Kuinka käyttää Microsoftin tekstistä puheeksi -sovellusta iPhonellasi tai tietokoneellasi
Microsoft Azuren asentaminen laitteellesi on melko yksinkertaista, ja se vaatii vain muutaman klikkauksen rekisteröityäksesi virallisella Azure -sivustolla. Jos tietokoneen käyttösi ei kuitenkaan ulotu Outlookin, Wordin, PowerPointin, Docsin ja OneNoten kaltaisten ohjelmien ulkopuolelle, sinun ei tarvitse ladata mitään, koska näissä ohjelmissa on sisäänrakennettu puhesynteesiratkaisu nimeltä Speak.
Vaikka se ei ehkä ole korkealaatuinen puhepalvelu, Speak on kätevä kiireessä, ja sen määrittäminen on erittäin helppoa:
- Napsauta Mukauta työkalurivi -vaihtoehtoa, napsauta
- Valitse Lisää komentoja -vaihtoehdot
- Napsauta Kaikki komennot
- Etsi Speak, napsauta sitä ja napsauta sitten Lisää
Vaihtoehtoja Microsoftin tekstistä puheeksi -sovellukselle
Kuten mainitsimme alussa, tekstinlukijoita on runsaasti, aina ammattisovelluksista, jotka hämmästyttävät sinut pelkällä hinnoittelullaan, keskeneräisiin puheentunnistus-SDK:ihin GitHubissa. Jos Microsoftin tekstistä puheeksi -ääniavustaja ei kuulosta sinun jutultasi tai etsit vaihtelua, meillä on muutamia vaihtoehtoja, jotka varmasti kiinnostavat sinua.
Speechify
Ensimmäisenä on Speechify, huippuarvosteltu TTS-työkalu, joka muuttaa käytännössä mitä tahansa äänitiedostoksi. Se toimii kaikkien Microsoft-sovellusten kanssa, ja sen puhemallit jättävät sinut sanattomaksi. Yhdistä tämä erinomaisiin puhe-API-ominaisuuksiin, ja sinulla on monipuolinen ratkaisu, joka täyttää kaikki tarpeesi ja käyttötapauksesi.
Amazon Polly
Toisena on Amazon Polly, loistava ratkaisu, joka on kuuluisa luonnolliselta kuulostavista äänistään ja monista puhetyyleistään. Se tukee useita kieliä, ja sen hermoverkkoihin perustuva tekstistä puheeksi -tekniikka tarjoaa runsaasti muokattavia asetuksia, joilla voit lisätä maustetta jo valmiiksi autenttiselta kuulostaviin toistoihisi.
Google Cloud Text to Speech
Kolmantena on Googlen Cloud Text to Speech. Luonnollisesti, missä tahansa teknistä edistystä on tehtävissä, Google on siellä, eikä TTS-alue ole poikkeus. Googlen ratkaisu keskittyy puhesynteesin merkintäkieleen (SSML), ja se toimii maksamalla per merkki, joten se on sekä hyödyllinen että edullinen valinta, jos työskentelet kertaluonteisen projektin parissa.
IBM Watson Text to Speech
IBM Watson sijoittuu neljänneksi. Mikä erottaa Watsonin kilpailijoista, on sen monipuolisuus yritysympäristöissä. Nimittäin, voit käyttää sitä virtuaaliassistenttina tai asiakastukityökaluna ja tekstistä puheeksi -ratkaisuna. Lisäksi se on erittäin edullinen, joten et löydä parempaa tarjousta muualta, jos etsit jotain joustavaa.
Readspeaker
Sijalla #5 on yksi veteraaneista — Readspeaker. Lähes neljännesvuosisadan kokemuksella Readspeaker on hionut tekstistä puheeksi -teknologian taiteenlajiksi. Se tukee yli sataa kieltä ja on erinomainen puhe-studioille ja e-oppimiselle, sillä se toimii sekä verkossa että offline-tilassa.
NaturalReader
#6 on NaturalReader. Tämä sovellus tekee loistavaa työtä reaaliaikaisella synteettisellä puheella, ja se toimii lähes kaikissa sovelluksissa, joita käytät tietokoneellasi. NaturalReaderin listallemme nosti sen niin sanottu lukutila, joka poistaa tekstistä kaiken turhan, kuten mainokset.
VoiceDream Reader
Sijalla #7 on VoiceDream Reader, viimeinen Microsoft Azure tekstistä puheeksi -vaihtoehtomme tänään. Valitettavasti, vaikka VoiceDream Reader on hyvä joihinkin yksinkertaisempiin tehtäviin, monet käyttäjät valittavat saavutettavuuden puutteesta ja huonoista synkronointivaihtoehdoista. Mutta jos tarvitset nopean ratkaisun etkä välitä edistyneimmästä neuro-TTS:stä ja end-to-end-tekniikasta, VoiceDream hoitaa homman riittävän hyvin.
UKK
Onko Windows 10 TTS ilmainen?
Windows 10:lle on saatavilla runsaasti TTS-ratkaisuja. Osa niistä on ilmaisia, osa ei. Windows 10:n mukana tuleva sisäänrakennettu Speak-vaihtoehto, joka toimii esimerkiksi Outlookissa ja Wordissa, on ilmainen, mutta kehittyneemmät ratkaisut, joissa on mukautettuja neuroäänivaihtoehtoja ja muita ominaisuuksia, kuten Microsoft Azure, vaativat tilauksen.
Mikä on realistisin TTS-ääni?
Realistisimmat TTS-äänet ovat tyypillisiä kehittyneemmille TTS-työkaluille, kuten Amazon Polly ja Speechify. Realismin taso riippuu kielestä, puhemallista ja valitsemistasi parametreista.
Mikä on ero tekstistä puheeksi -teknologian ja puheentunnistuksen välillä?
Vaikka monet TTS-ohjelmat tarjoavat sekä tekstistä puheeksi että puheentunnistusvaihtoehtoja, on tärkeää olla sekoittamatta niitä keskenään. Tekstistä puheeksi -vaihtoehdot muuttavat tekstisyötteen äänimuotoon, auttaen sinua käsittelemään tekstiä samalla kun teet muita tehtäviä. Puheentunnistus puolestaan viittaa ihmisen äänen analysointiin joko tulkinnan tai tunnistamisen tarkoituksessa.
Cliff Weitzman
Cliff Weitzman on dysleksian puolestapuhuja sekä Speechifyn toimitusjohtaja ja perustaja. Speechify on maailman johtava tekstistä puheeksi -sovellus, jolla on yli 100 000 viiden tähden arvostelua ja joka on App Storen ykkönen Uutiset & Aikakauslehdet -kategoriassa. Vuonna 2017 Weitzman valittiin Forbesin 30 alle 30 -listalle työstään, jolla hän teki internetistä saavutettavamman oppimisvaikeuksista kärsiville. Cliff Weitzman on ollut esillä muun muassa EdSurgessa, Inc.:ssä, PC Magissa, Entrepreneurissa ja Mashablessa.