Kõige silmatorkavam kõnest tekstiks tehnoloogia kasutusviis on võimalus anda arvutile käsklusi, rääkides mikrofoni. Nüüd saab infot sisestada ka häälega lisaks tavalisele klaviatuurile ja hiirele. Vaatame, kuidas need uued ja kvaliteetsed tehnoloogiad saavad tootlikkust suurendada kontoris ja muuta igapäevaelu mugavalt automatiseerituks.
Mis on heli tekstiks tehnoloogia?
Kõnetuvastus ehk kõnest tekstiks on tehnoloogia, mis võimaldab arvutil inimkõnest aru saada ja selle tekstiks muuta. Isegi selgelt räägituna võib lihtsama tarkvara sõnavara olla üsna piiratud. Tänapäeva arvutid suudavad töödelda kõnet mitmes keeles ja erinevate aktsentidega. Heli tekstiks tööriistad (ehk transkriptsioon) põhinevad masinõppel ja kõnetuvastusel, mis tõstab oluliselt tootlikkust nii töökohal kui mujal, kus transkribeerimine abiks on. Kõnetuvastus tugineb keeleteadusele, arvutiteadusele ja inseneeriale. Nutitelefonides ja rakendustes on sisseehitatud kõnetuvastus, mis muudab seadme kasutamise lihtsamaks või võimaldab seda täiesti käed-vabalt kasutada. Tänu loomuliku keele töötlemisele ja masinõppega seadmetele nagu Amazon Alexa, Google Home Assistant või Siri on täpsus juba väga kõrge.
Kas kõnetuvastus ja hääletuvastus on sama?
Kõnetuvastus ja hääletuvastus ei ole sama asi ning neid ei tasu segi ajada:
- Kõnetuvastus tuvastab räägitud sõnad.
- Hääletuvastus tuvastab inimese isiku hääle järgi (biomeetria).
Tarkvara algoritmid, mis teisendavad kõne tekstiks, on õpetatud ära tundma erinevaid murdeid, aktsente, keeli ja kõnestiile. Tarkvara eraldab ka kõne taustamürast. Kõnetuvastustarkvaras kasutatakse kahte mudelit:
- Akustilised mudelid näitavad seost kõneelementide ja helide vahel.
- Keelemudelid eristavad helimustrite abil sarnase kirjapildi, kuid erineva kõlaga sõnu.
Miks kasutada heli tekstiks tööriistu?
Selle Stanfordi uuringu järgi on kõnest tekstiks kirjutamine kolm korda kiirem kui trükkimine, mistõttu on see üks populaarsemaid AI-lahendusi. Siin on mõned eelised ja olukorrad, kus salvestatud heli eriti kasuks tuleb:
- Haridus. Keelte õppimisel aitab hääletuvastus lihvida õiget hääldust.
- Aja sääst. Heli tekstiks tähendab, et märkmete tegemisele ei kulu enam pea üldse aega. Sobib igale elualale — ärikohtumised, õpetajad, blogijad, ajakirjanikud, terapeudid jne. Täpsed märkmed iga kohtumise lõpuks kiirendavad kõigi töövoogu.
- Klienditeenindus. Automaatvastajad saavad klientidele kohe infot edastada.
- Tervishoid. Arstid saavad märkmeid kohe patsiendi toimikusse dikteerida.
- Abi puudega inimestele. Häältuvastusega saavad kuulmispuudega inimesed vestlusi jälgida ning need, kes ei saa kirjutada, kasutada arvutit häälega.
- Kohtusaalis. Tarkvara abil pole inimtranskribeerijaid enam vaja.
- Emotsiooni tuvastus. Heli tekstiks tarkvara saab teha järeldusi kõneleja emotsioonide kohta. Koos sentimentide analüüsiga saab teada, mida klient teenusest arvab.
- Käed-vaba suhtlus. Hääljuhtimine on eriti populaarne autojuhtide seas — juhitakse telefone, raadiot, GPS-i.
5 parimat transkriptsioonitarkvara, mida proovida
Tänapäeval on transkriptsioon väga kasulik oskus. Sellega saab dokumenteerida peaaegu kõike, muuta sisu ligipääsetavamaks ning parandada otsingutulemusi. Kui on aega ise katsetada, leidub palju häid ja tasuta tööriistu. Siin on viis järeleproovitud tasuta transkriptsiooniprogrammi.
1. Alice Transcription
Alice pakub transkriptsiooni peamiselt ajakirjanikele. Erinevalt teenustest, mis muudavad faile ainult reaalajas või hoiavad neid lühikest aega, annab Alice nii audiofaili kui teksti e-posti teel ja laeb need sinu Google Drive’i. Alice töötab maksa-vastavalt-kasutusele põhimõttel, tasud: $9.99 ühe-kahe tunni eest, $4.99/h 20 tunni korral ja $2.99/h 100 tunni puhul. Esimesed 60 minutit on iOS-äppiga tasuta, Androidis see veel ei tööta.
2. Otter
Otterit kasutavad tuntud ettevõtted nagu Zoom, Dropbox ja IBM. Võid salvestada heli telefonist või arvutist (soovitavalt Chrome’ist) ja saada koheselt teksti. Lisaks transkriptsioonile saab lisada kõneleja nime, märkmeid, fotosid ja võtmesõnu. Transkriptsioone saab jagada ka grupiga teistega koos töötamiseks. Tasuta on 600 minutit.
3. Google Doc’i Hääldiktor
Google’i tipptasemel AI-teenus võimaldab väga täpset kõne tekstiks teisendust. Algajad saavad Speech-to-Text’i esmakasutuseks $300 tasuta krediiti ning igal kuul 60 tasuta minutit energiaudio transkriptseerimiseks. Google Doc'i Hääldiktor on tuntud järgmise poolest:
- Valdkonnaspetsiifilised mudelid
- Võimalus kvaliteeti võrrelda
- Speech-to-text serveris
- Kõne seadmes
IPhone’i või Androidiga võid kohe alustada — vaja läheb vaid korralikku internetiühendust.
4. Nuance Dragon
Nuance on paindlik tarkvara, mis võib olla kas kõnest tekstiks konverter või transkribeerija — vali endale sobiv versioon. Pakutakse lahendusi nii igapäevakasutajale kui spetsialistidele, korrakaitsjatele jpm. Kõik toimingud saab teha ainult häälega. Dikteeri, tee märkmeid, loo dokumente väga mugavalt ja kiiresti.
5. Wordcab
Wordcab teeb koosolekutest kokkuvõtted lihtsalt ning sellel on skaleeritav API, mis automatiseerib müügi- ja koosolekukõnede kokkuvõtted. Otsitav info leitakse protokollidest ja kokkuvõtetest kiirelt üles. Koosolekute protokollid salvestatakse, et töö püsiks fookuses, mitte paberimajanduses. Wordcab oskab importida taskuhäälinguid, helisalvestisi, YouTube'i videoid ja muud. Koosolekute kokkuvõtted saadetakse kiiresti kõikidele osalejatele. Saab laadida failid, lasta need tekstiks transkribeerida ja luua kokkuvõtte automaatselt.
Kuidas neid tööriistu kasutada?
See tehnoloogia transkribeerib heli kiiremini kui inimene, nii et midagi koosolekul räägitust ei jää kirja panemata. Mõned väidavad, et helisalvestused võiksidki olla vaikimisi koosolekute dokumenteerimise viis. Uuema ja täpsema info saamiseks ei pea lootma kellegi mälule või vananenud märkmetele. Saab transkribeerida loenguid, märkmeid, intervjuusid, koosolekuid, kõnesõnumeid — mida iganes vaja.
Heli tekstiks & muu kõnetehnoloogia
Lisaks heli tekstiks AI-le leidub muid kõnetehnoloogiaid, mis sobivad tööks, igapäevasuhtluseks või abivahendiks lugemisel, rääkimisel või kuulamisel. Speechify on tipptasemel häälrakendus, mis toimib Windowsis, Androidis, Macis, iOSis, Linuxis ja Microsoftis. Võrreldes alternatiividega on Speechify trumbiks just sotsiaalmeedia, audioraamatute ning teadusartiklite kuulamine. Rohkem kui 15 keelt ja üle 30 inimkõlaga AI-hääle. Neid saab kasutada reklaamides, podcastides jms. Programm suudab skaneerida raamatuid või muud teksti ja muuta selle audioks tänu optilise märgituvastuse tehnoloogiale. Äpi kaameraga saab lasta tekstil endale ette lugeda. Proovi Speechify'd suurepäraseks tekstist kõneks kogemuseks.

