11 transkriptsioonirakenduse võrdlus

transcription

Helifaili transkribeerimine võib olla päris tüütu ülesanne, isegi lühikese klipi kirjapanemiseks võib kuluda tunde. Õnneks on nüüdsel tehisintellekti ajastul loodud igasuguseid rakendusi, mis aitavad inimesel selle töö ära teha. Siinses blogipostituses vaatame mõnda neist tööriistadest lähemalt, kirjeldame nende funktsioone ja jagame soovitusi, kuidas enda jaoks sobivaim välja valida.

Miks transkriptsioonirakendusi üldse kasutada?

Alustuseks vaatame nende rakenduste kasutamise peamisi põhjusi. Esiteks, töökeskkonnas on need oluliseks abivahendiks klientide ja kolleegidega toimunud kohtumiste dokumenteerimiseks ja neist kokkuvõtete tegemiseks. Transkriptsioon mitte ainult ei aita arutelus järge hoida ja räägitut protokollida, vaid võimaldab ka neil, kes ei saa koosolekul osaleda, täpselt teada saada, millest räägiti. Need rakendused on leidnud kasutust ka spetsiifilisemates valdkondades, näiteks meditsiinis ja õiguses, kus täpsete andmete talletamine on ülioluline.

Viimastel aastatel on tehisintellekti hakatud üha rohkem kasutama ka klienditeeninduses. Kliendikõnede transkriptsioonid sisaldavad väärtuslikku teavet klientide tagasiside ja murede kohta ning nende põhjal on võimalik klienditeeninduse kvaliteeti parandada. Ka haridus- ja teadusvaldkonnal on sellest tarkvarast palju kasu, näiteks intervjuude, fookusgrupi arutelude, loengute ja muu seesuguse transkribeerimisel.

Lisaks on transkriptsioonivahenditel keskne roll ligipääsetavuse edendamisel, eriti kuulmispuudega inimeste seas. Taskuhäälingusaadete üleskirjutuste ja videoloengutele subtiitrite tekitamise kaudu hõlbustavad need audiovisuaalsete materjalide teisendamist vormingusse, mis on laiemale sihtrühmale kasutatav ja selle tulemusena kaasatust suurendav.

Tehisintellekti genereeritud vs. inimese tehtud transkriptsioon

Kui sul on vaja helifail tekstina üles kirjutada, tasub põhjalikult kaaluda, kas lasta seda teha tehisintellektil või inimesel. Inimene on transkribeerimisel kahtlemata täpsem, kuna tehisintellekti koostatud transkriptsiooni veamäär sõltub suuresti helifaili kvaliteedist ja sisust. Kui helifailis räägitakse üksteisest üle, esineb taustamüra või on salvestis liiga vaikne, jääb tehisintellekt hätta. Samuti on tal raskusi numbrite, lühendite, nimede, slängi ja mitmekeelse kõne transkribeerimisel. Seega, tehisintellekti kasutamine pole lollikindel valik ja transkribeeritud tekst tuleb kindlasti lasta inimsilmal üle vaadata. Ühtlasi pead arvestama andmeturbe nõuetega. Kui tegemist on tundlike isikuandmetega, on vaja enne tehisintellekti rakendamist välja selgitada, kas transkribeeritud teksti võidakse hiljem ka sama tööriista treenimiseks kasutada.

Ent oma nõrgad küljed on ka inimese kasutamisel helifaili transkribeerimiseks, peamine puudus on töö kiirus. Mida keerulisem on helifail, seda rohkem aega kulub selle transkribeerimiseks. Sellest tulenevalt kipub inimese osutatav teenus olema aeganõudvam ja paraku ka kallim. Ajafaktorit silmas pidades on tehisintellekti rakendavad tööriistad väga soodsad, võimaldades kiiret transkribeerimist, eriti kui tegemist on suure hulga mahukate heli- või videofailidega. Seetõttu on automatiseeritud lahenduste kaasamine peaaegu vältimatu, kui pead transkribeerima mahukaid faile ja tegema seda sageli. Arvestades tehisintellekti abil transkribeerimise suhteliselt suurt täpsust, eriti selliste keelte puhul nagu inglise keel, võib selle lahenduse kasutamine osutuda väga kulutõhusaks.

transcribe

Üksteist transkriptsioonirakendust: plussid ja miinused

1. Tekstiks

Tekstiks.ee on TTÜ kõnetehnoloogia labori avalik kõnetuvastuse teenus. Süsteem kasutab laboris väljatöötatud tehnoloogiat ja mudeleid, mis annavad eesti keele tuvastamisel oluliselt paremaid tulemusi kui selle alternatiivid. Süsteem on automaatne ja töötleb samaaegselt mitut salvestist. Tööpäevadel on rakendusel rohkem kasutajaid ja ooteaeg seetõttu pikem. Järjekorra puudumisel kulub kõnetuvastusele umbes pool kõnesalvestise kestusest.

Rakendus toetab järgmisi failivorminguid: wav, mp3, ogg, mp2, m4a, mp4, flac, amr ja mpg. Transkribeerida saab eesti- ja soomekeelset teksti. Soome keele kõnetuvastus on loodud koostöös Soome keelepanga ja Aalto ülikooliga. Rakenduse kasutamine on tasuta.

2. Amazon Transcribe

Amazon Transcribe on automaatne kõnetuvastusteenus, mis kasutab masinõpet ja tehisintellekti ning mida arendajatel on hea oma rakendusega integreerida. Erinevalt teistest samalaadsetest vahenditest on Amazon Transcribe mõeldud pigem teadlikumale kasutajale. Põhifunktsioonide hulka kuuluvad reaalajas transkribeerimine, kõneleja tuvastamine ja võimalus kasutada enda kohandatud sõnavara. Programm toetab paljusid failivorminguid. Väidetavalt tunneb see enam kui 130 keelt, sealhulgas eesti, niidumari, galeegi, katalaani ja sunda keelt. 

Hind. Esimesed 12 kuud on tasuta, ühes kuus on võimalik transkribeerida kuni 60 minuti jagu heli. Suurema kasutusmahu korral tuleb juba esimesel aastal maksta tasu.

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

3. Deepgram

Deepgram pakub töökindlaid kõne tekstiks teisendamise API-sid, mis on laialdaselt kasutatavad (isegi NASA-s) ja mõeldud arendajatele, kellel on vaja oma rakendusega integreerida transkriptsioonilahendus. Programm sisaldab ülitäpseid mudeleid, võimaldab märkimisväärset kulude kokkuhoidu, kiiret transkribeerimist, nii reaalajas esitatava kui ka eelsalvestatud heli üleskirjutamist ning paremat loomuliku keele mõistmist. Tunneb enam kui 15 keelt, sealhulgas hollandi, hindi ja ukraina keelt. Eesti keelt sellega praegu veel transkribeerida ei saa.

Hind. Kõik uued kasutajad saavad 200 dollarit krediiti. Püsikasutajate puhul võib hinnaks kujuneda 4000–10 000 dollarit aastas, olenevalt ärilistest vajadustest.

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

transcriber

4. Descript

Descript on kõik-ühes-redaktor, mis võimaldab nii transkribeerida kui ka eri meediume redigeerida. Mõeldud algajale kasutajale, kes tegeleb sisuloomega, näiteks videotöötluse ja taskuhäälinguga. Tegemist on kasutajasõbraliku liidesega, mille põhifunktsioonide hulka kuuluvad automaatne kõnelejatuvastus, reaalajas koostöö tegemise võimalus ja subtiitrite automaatne genereerimine. Transkribeerib enam kui kümmet keelt, sealhulgas saksa, malai ja leedu keelt. Eesti keel paraku nende hulka ei kuulu.

Hind. Pakutakse nii tasuta paketti (igas kuus ühe tunni jagu tasuta transkriptsiooni) kui ka tasulisi pakette alates 12 dollarist kuus (sõltuvalt kasutusmahust).

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

5. Happy Scribe

Happy Scribe pakub algajatele ja edasijõudnutele nii inimese kui ka masina abil tehtud transkriptsiooni ja subtiitrite teenust enam kui 45 keeles, sealhulgas eesti keeles. Põhifunktsioonide hulka kuuluvad masintõlge, koostööd võimaldavad tööruumid, andmeturbe ja konfidentsiaalsuse tagamine, väljundfaili eksport mitmes vormingus ning piiramatu üleslaadimise võimalus.

Hind. Saadaval on tasuta pakett, mille transkriptsioonimaht (paar minutit) ja funktsionaalsus on piiratud. Tasuliste pakettide hinnad algavad 10 eurost kuus.

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

AI transcription

6. IBM Watson Speech to Text

IBM Watson Speech to Text on pilvelahendus, mis kasutab kõne üleskirjutamiseks tehisintellekti sügavõppe algoritme. Tööriista saab kohandada erisuguste kasutusjuhtude jaoks, näiteks klientide iseteeninduse, virtuaalse abilise ja kõneanalüütika tarbeks. Põhifunktsioonide hulka kuuluvad ülemaailmse keeletoe olemasolu, võimalus kohandada programmi spetsiaalsete ärivaldkondade jaoks (sõnavara kohandamine) ja andmeturve. Programm tunneb laialdasemalt kõneldavaid keeli, näiteks araabia, itaalia ja hiina keelt. Väikesi keeli, nagu eesti keelt, sellega transkribeerida veel ei saa.

Hind. Valida on tasuta ja tasulise paketi vahel, valik oleneb transkribeerimist vajavate failide mahust. Tasuta pakett võimaldab ühes kuus 500 minuti jagu tasuta kõnetuvastust.

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

7. Fireflies.ai

Fireflies.ai on tehisintellektil põhinev häälassistent, mis on loodud koosoleku pidamisega seotud ülesannete automatiseerimiseks, näiteks transkribeerimiseks, kokkuvõtete ja märkmete tegemiseks ning ülesannete lõpuleviimiseks. Tehisintellektil põhinev assistent nimega Fred ühildub suuremate veebikonverentsi platvormide ja ärirakendustega. Põhifunktsioonide hulka kuuluvad reaalajas kõne transkribeerimine, märksõnade ja teemade jälgimine ning sentimentanalüüs. Programm ühildub enamiku veebikonverentsi platvormidega. Transkribeerida on võimalik enam kui 60 keeles, sealhulgas eesti keeles. Süsteem eristab ka kolme inglise keele varianti.

Hind. Tasuta pakett võimaldab piiramatut transkriptsiooni, kuid salvestusruum on piiratud ja funktsioone on vähem. Tasuliste pakettide hind oleneb salvestusvajadusest ja algab 10 dollarist kuus.

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

8. Otter.ai

Otter.ai on tehisintellekti rakendav koosoleku abiprogramm, mis võimaldab koosolekuid automaatselt salvestada ja transkribeerida ning neist kokkuvõtteid teha. Põhifunktsioonid: populaarsete videokonverentsi platvormidega ühildumine, reaalajas transkribeerimine, mitmekesi koos märkmete tegemine, tehisintellektiga vestlemine ning iOS-i ja Androidi rakenduste kasutamine silmast silma kohtumisteks. Erinevalt teistest transkriptsioonivahenditest tunneb Otter ainult inglise keelt.

Hind. Kasutajad saavad valida tasuta paketi (igas kuus 300 minuti jagu transkriptsiooni) ja mitmesuguste tasuliste pakettide vahel (suurem transkriptsioonimaht ja lisafunktsioonid).

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

transcription tool

9. Rev

Rev võimaldab heli- ja videofailide transkriptsiooni, lubades 99% täpsust. See on mõeldud laiale kasutajaskonnale, sh ettevõtetele. Programmi saab kasutada suuremate keelte puhul, näiteks araabia, hispaania ja vene keel. Põhifunktsioonide hulka kuuluvad tehisintellekti abil transkribeerimine, subtiitrite koostamine ingliskeelsetele videotele, kasutaja enda kohandatud sõnastiku kasutamine õigekirja tagamiseks ja interaktiivne transkriptsiooni redaktor. Revi kaudu saab tellida ka inimese koostatud transkriptsioone.

Hind. Tasuta pakette ei ole. Hinnad algavad 0,25 dollarist minuti eest, kui soovitakse kasutada spetsiifilisemaid funktsioone. Ühe kuu tervikpakett maksab 29,99 dollarit.

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

10. Sonix

Sonix on veebiplatvorm, mis võimaldab heli- ja videofaile automaatselt transkribeerida, tõlkida ja subtiitritega varustada. Platvormi saavad kasutada nii algajad kui ka edasijõudnud kasutajad. Põhifunktsioonide hulka kuuluvad kõnelejate automaatne eristamine, automaatne kirjavahemärgistamine, transkribeeritud tekstist otsimine, mitmesugused ekspordi- ja ühildumisvõimalused ning võimalus teksti brauseris redigeerida. Lahendus võimaldab transkribeerida enam kui 30 keeles, sealhulgas eesti keeles.

Hind. Saadaval on erinevaid pakette, hinnad algavad 5 dollarist tunnis (olenevalt sellest, kas kasutaja valib aja- või projektipõhise paketi). Uued kasutajad saavad tööriista veebis kuni 30-minutilise helifaili peal tasuta järele proovida. 

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

11. Trint

Trint on tehisintellekti rakendav platvorm, mis on loodud heli- ja videofailide transkribeerimiseks ja redigeerimiseks ning nende puhul koostöö tegemiseks. Lahendus on suunatud algajatele, kes töötavad näiteks sisuloojate või ajakirjanikena. Põhifunktsioonide hulka kuuluvad võimalus eksportida faile mitmes vormingus, subtiitrid ja masintõlge, reaalajas koostöö tegemise võimalus koos teksti esiletõstmise ja kommenteerimise tööriistadega ning ühildumine teiste platvormidega. Tunneb enam kui 40 keelt, sealhulgas eesti, ukraina, prantsuse ja jaapani keelt. 

Hind. Tasuta pakette ei pakuta, küll aga antakse kasutajatele 7-päevane tasuta prooviperiood. Sõltuvalt transkriptsioonivajadusest algavad tasuliste pakettide hinnad 48 eurost kuus.

Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.

Transkriptsioonirakenduste ülevaatlik võrdlus

RakendusHindPõhifunktsioonidPuudusedKasutaja tase
TekstiksTasuta.Eesti ja soome keele transkribeerimine.Võimaldab transkribeerida ainult helifaile; töö alustamiseks tuleb kasutajal oodata elavas järjekorras.Algaja
Amazon TranscribeEsimesed 12 kuud tasuta, igas kuus on võimalik transkribeerida 60 minuti jagu heli. Suuremas mahus transkribeerimine on tasuline.Ühildub paljude failivormingutega, kõneleja tuvastamine, reaalajas transkribeerimine.Mõne keele puhul on täpsus küsitav, pikk transkribeerimise aeg, eeldab varasemat kokkupuudet arendustööga.Edasijõudnud
DeepgramUuele kasutajale antakse 200 dollarit krediiti. Aastane kasutustasu jääb vahemikku 4000–10 000 dollarit.Ülitäpsed mudelid, kiire transkribeerimine, lihtne integreerida.Vigaderohkus, keeruline hinnastamine, isikuandmete kaitse ei pruugi olla tagatud.Edasijõudnud
DescriptSaadaval tasuta pakett, mis võimaldab ühes kuus transkribeerida ühe tunni jagu heli. Tasuliste pakettide hinnad algavad 12 dollarist kuus.Automaatne kõnelejatuvastus, reaalajas koostöö tegemise võimalus, interaktiivne kasutusjuhend.Esineb probleeme videofailide eksportimisega ja aktsendiga kõne transkribeerimisega; algaja jaoks keeruline, vajab mõningast koolitust.Kesktase
Happy ScribeTasuta pakett, mille maht on üsna piiratud (paar minutit). Tasuliste pakettide hinnad algavad 10 eurost kuus.Piiramatu arv üleslaadimisi, kiire transkribeerimine, koostöö tegemiseks eraldi töökohad.Vormindamisprobleemid, aeg-ajalt esineb raskusi kõnelejate eristamisel, mõne keele puhul annab ebatäpse väljundi.Algaja
IBM Watson Speech to TextNii tasuta pakett (500 minutit kuus) kui ka tasulised paketid, mille hind oleneb transkriptsiooni mahust.Reaalajas transkribeerimine, äridomeenide jaoks kohandatav, andmeturve.Kohati ebatäpne, piiratud keeletugi, raskused mitme osalejaga kõne transkribeerimisel.Kesktase
Fireflies.aiTasuta pakett, mille salvestusmaht on piiratud. Tasuliste pakettide hinnad algavad 10 dollarist kuus.Reaalajas transkribeerimine, ühildub veebikonverentsidega, märksõnade jälgimine.Transkriptsiooni täpsus vajab parandamist, murretega jääb hätta, teksti kokkuvõtted on ebatäpsed.Algaja
Otter.aiTasuta pakett võimaldab ühes kuus transkribeerida 300 minuti jagu heli. Saadaval ka tasulised paketid.Reaalajas transkribeerimine, koostööd võimaldavad funktsioonid, tehisintellektil põhinev vestlus.Nõrk kvaliteet mitme kõneleja transkribeerimisel, programmi on lihtne kogemata tööle unustada, kasutatav ainult inglise keele puhul.Algaja
RevTasuline teenus alates 0,25 dollarist minuti eest.Kiire tööaeg, saadaval mobiilirakendusena, lihtne faile korrastada.Kõnelejate nimede kirjutamisel ebajärjekindel, reaalajas transkribeerimise võimalus puudub, keeruline veebis navigeerida.Algaja
SonixMitmesugused paketid alates 5 dollarist tunnis. Tutvumiseks saab tasuta transkribeerida kuni 30-minutilise helifaili.Automaatne failide teisendamine sobivasse vormingusse, kasutajasõbralik liides, transkribeeritud teksti sees on võimalik kasutada otsingufunktsiooni.Ajatemplite ebatäpsus, probleemid videofailidega, liiga kõrge hind.Algaja
Trint7-päevane tasuta prooviperiood, tasulised paketid alates 48 eurost kuus.Tehisintellektil põhinev transkriptsioon, reaalajas koostöö tegemise võimalus, täpne tulemus inglise ja prantsuse keele puhul.Algaja vajab tutvumiseks mõningast koolitust, ebatäpne (v.a inglise keele puhul), probleemid kõnelejate tuvastamisel.Kesktase
Transkriptsioonirakenduste ülevaatlik võrdlus

SAADA MEILE PÄRING!

Lisa ka oma e-posti aadress ja failid ning saada päring. Ootame.