11 transkriptsioonirakenduse võrdlus
Helifaili transkribeerimine võib olla päris tüütu ülesanne, isegi lühikese klipi kirjapanemiseks võib kuluda tunde. Õnneks on nüüdsel tehisintellekti ajastul loodud igasuguseid rakendusi, mis aitavad inimesel selle töö ära teha. Siinses blogipostituses vaatame mõnda neist tööriistadest lähemalt, kirjeldame nende funktsioone ja jagame soovitusi, kuidas enda jaoks sobivaim välja valida.
Miks transkriptsioonirakendusi üldse kasutada?
Alustuseks vaatame nende rakenduste kasutamise peamisi põhjusi. Esiteks, töökeskkonnas on need oluliseks abivahendiks klientide ja kolleegidega toimunud kohtumiste dokumenteerimiseks ja neist kokkuvõtete tegemiseks. Transkriptsioon mitte ainult ei aita arutelus järge hoida ja räägitut protokollida, vaid võimaldab ka neil, kes ei saa koosolekul osaleda, täpselt teada saada, millest räägiti. Need rakendused on leidnud kasutust ka spetsiifilisemates valdkondades, näiteks meditsiinis ja õiguses, kus täpsete andmete talletamine on ülioluline.
Viimastel aastatel on tehisintellekti hakatud üha rohkem kasutama ka klienditeeninduses. Kliendikõnede transkriptsioonid sisaldavad väärtuslikku teavet klientide tagasiside ja murede kohta ning nende põhjal on võimalik klienditeeninduse kvaliteeti parandada. Ka haridus- ja teadusvaldkonnal on sellest tarkvarast palju kasu, näiteks intervjuude, fookusgrupi arutelude, loengute ja muu seesuguse transkribeerimisel.
Lisaks on transkriptsioonivahenditel keskne roll ligipääsetavuse edendamisel, eriti kuulmispuudega inimeste seas. Taskuhäälingusaadete üleskirjutuste ja videoloengutele subtiitrite tekitamise kaudu hõlbustavad need audiovisuaalsete materjalide teisendamist vormingusse, mis on laiemale sihtrühmale kasutatav ja selle tulemusena kaasatust suurendav.
Tehisintellekti genereeritud vs. inimese tehtud transkriptsioon
Kui sul on vaja helifail tekstina üles kirjutada, tasub põhjalikult kaaluda, kas lasta seda teha tehisintellektil või inimesel. Inimene on transkribeerimisel kahtlemata täpsem, kuna tehisintellekti koostatud transkriptsiooni veamäär sõltub suuresti helifaili kvaliteedist ja sisust. Kui helifailis räägitakse üksteisest üle, esineb taustamüra või on salvestis liiga vaikne, jääb tehisintellekt hätta. Samuti on tal raskusi numbrite, lühendite, nimede, slängi ja mitmekeelse kõne transkribeerimisel. Seega, tehisintellekti kasutamine pole lollikindel valik ja transkribeeritud tekst tuleb kindlasti lasta inimsilmal üle vaadata. Ühtlasi pead arvestama andmeturbe nõuetega. Kui tegemist on tundlike isikuandmetega, on vaja enne tehisintellekti rakendamist välja selgitada, kas transkribeeritud teksti võidakse hiljem ka sama tööriista treenimiseks kasutada.
Ent oma nõrgad küljed on ka inimese kasutamisel helifaili transkribeerimiseks, peamine puudus on töö kiirus. Mida keerulisem on helifail, seda rohkem aega kulub selle transkribeerimiseks. Sellest tulenevalt kipub inimese osutatav teenus olema aeganõudvam ja paraku ka kallim. Ajafaktorit silmas pidades on tehisintellekti rakendavad tööriistad väga soodsad, võimaldades kiiret transkribeerimist, eriti kui tegemist on suure hulga mahukate heli- või videofailidega. Seetõttu on automatiseeritud lahenduste kaasamine peaaegu vältimatu, kui pead transkribeerima mahukaid faile ja tegema seda sageli. Arvestades tehisintellekti abil transkribeerimise suhteliselt suurt täpsust, eriti selliste keelte puhul nagu inglise keel, võib selle lahenduse kasutamine osutuda väga kulutõhusaks.
Üksteist transkriptsioonirakendust: plussid ja miinused
1. Tekstiks
Tekstiks.ee on TTÜ kõnetehnoloogia labori avalik kõnetuvastuse teenus. Süsteem kasutab laboris väljatöötatud tehnoloogiat ja mudeleid, mis annavad eesti keele tuvastamisel oluliselt paremaid tulemusi kui selle alternatiivid. Süsteem on automaatne ja töötleb samaaegselt mitut salvestist. Tööpäevadel on rakendusel rohkem kasutajaid ja ooteaeg seetõttu pikem. Järjekorra puudumisel kulub kõnetuvastusele umbes pool kõnesalvestise kestusest.
Rakendus toetab järgmisi failivorminguid: wav, mp3, ogg, mp2, m4a, mp4, flac, amr ja mpg. Transkribeerida saab eesti- ja soomekeelset teksti. Soome keele kõnetuvastus on loodud koostöös Soome keelepanga ja Aalto ülikooliga. Rakenduse kasutamine on tasuta.
Eelised
- Rakendus on tasuta.
- Programm on eesti keeles väga täpne võrreldes välismaiste rakendustega.
- Toetab mitmeid helifailivorminguid.
- Kõnelejatuvastus ja ajatemplid.
- Transkribeeritud tekstis saab parandada vigu ja lisada märgendeid.
Puudused
- Võimaldab transkribeerida ainult eesti- ja soomekeelset teksti.
- Videofaile sellega transkribeerida ei saa.
- Ootejärjekord faili üleslaadimiseks võib olla mitme tunni pikkune.
- Üleslaaditava faili maksimaalne suurus on 500 MB.
- Enam kui kahe tunni pikkuste helifailide transkribeerimine võib ebaõnnestuda.
- Transkribeerimine võtab aega helifaili kestusest umbes poole, kui järjekorda ei ole.
Amazon Transcribe on automaatne kõnetuvastusteenus, mis kasutab masinõpet ja tehisintellekti ning mida arendajatel on hea oma rakendusega integreerida. Erinevalt teistest samalaadsetest vahenditest on Amazon Transcribe mõeldud pigem teadlikumale kasutajale. Põhifunktsioonide hulka kuuluvad reaalajas transkribeerimine, kõneleja tuvastamine ja võimalus kasutada enda kohandatud sõnavara. Programm toetab paljusid failivorminguid. Väidetavalt tunneb see enam kui 130 keelt, sealhulgas eesti, niidumari, galeegi, katalaani ja sunda keelt.
Hind. Esimesed 12 kuud on tasuta, ühes kuus on võimalik transkribeerida kuni 60 minuti jagu heli. Suurema kasutusmahu korral tuleb juba esimesel aastal maksta tasu.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Annab hea tulemuse laia kõnelejaskonnaga keelte, näiteks inglise ja hispaania keele puhul.
- Lahendus on kulutõhus ja märkimisväärselt täpne võrreldes teiste samalaadsete rakendustega.
- Võimaldab kasutada mitmesuguseid failivorminguid, sealhulgas videofaile, mis tavaliselt tuleks teisendada helifailiks.
- Rakendab kasutaja lisatud sõnavara ja genereerib korralikke lauseid.
- Täiustatud kõnelejatuvastus ja suhteliselt täpsed ajatemplid.
- Võimalik transkribeerida reaalajas.
- Kiire ja efektiivne transkribeerimine.
Puudused
- Väiksema kõnelejaskonnaga keelte puhul on täpsus küsitav.
- Hinnastamine on keeruline (hind sõltub kasutusmahust) ja programm on mõeldud eelkõige teadlikumale kasutajale, kes on arendustööga tuttav.
- Numbrid esitatakse sõnadena, näiteks numbri „1“ asemel on sõna „üks“.
- Kasutaja enda sõnavarafaili lisamine on keerukas.
- Transkribeerimine võtab aega sama palju, kui pikk on helifail, või isegi veidi rohkem.
- Raskusi esineb slängi, lühendite, nimede ja sarnase kõlaga sõnade üleskirjutamisel.
- Korraga saab valida ainult ühe üleslaaditud sõnavarafaili ning selle maht on piiratud.
3. Deepgram
Deepgram pakub töökindlaid kõne tekstiks teisendamise API-sid, mis on laialdaselt kasutatavad (isegi NASA-s) ja mõeldud arendajatele, kellel on vaja oma rakendusega integreerida transkriptsioonilahendus. Programm sisaldab ülitäpseid mudeleid, võimaldab märkimisväärset kulude kokkuhoidu, kiiret transkribeerimist, nii reaalajas esitatava kui ka eelsalvestatud heli üleskirjutamist ning paremat loomuliku keele mõistmist. Tunneb enam kui 15 keelt, sealhulgas hollandi, hindi ja ukraina keelt. Eesti keelt sellega praegu veel transkribeerida ei saa.
Hind. Kõik uued kasutajad saavad 200 dollarit krediiti. Püsikasutajate puhul võib hinnaks kujuneda 4000–10 000 dollarit aastas, olenevalt ärilistest vajadustest.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- API-t on lihtne integreerida ja see käib kiiresti.
- Helde stardikrediit esmakordsele kasutajale.
- Tööriist on hästi disainitud ja seda saab käsitseda eri programmide abil, kõige sagedamini kasutatakse koos Pythoniga.
- Arendajatel on juurdepääs kasutajasõbralikule dokumentatsioonile.
- Mõne keele puhul toimib päris kiiresti.
- Transkriptsioon on hästi vormindatud ja kergesti loetav.
- Sobib mitme kõnelejaga helifailide transkribeerimiseks.
Puudused
- Veaohtlikkus, eriti lühendite ja kasutaja esitatud märksõnade puhul.
- Mõnel juhul tuleb kvaliteetse tulemuse saamiseks transkriptsiooni põhjalikult redigeerida.
- Hinnastamine on keeruline ja osaliselt läbipaistmatu.
- Kui helifailis on kuulda taustamuusikat, esineb transkribeerimisel probleeme.
- Tunneb paljusid keeli, kuid transkriptsiooni kvaliteet on keeleti erinev.
- Ei ole garanteeritud, et kasutaja isikuandmeid programmi treenimiseks ei kasutata.
- Transkribeerida saab ainult üleslaaditud faile või reaalajas heli, ei toeta heli- ega videolinke.
- Eeldab kasutajalt kodeerimisoskust.
4. Descript
Descript on kõik-ühes-redaktor, mis võimaldab nii transkribeerida kui ka eri meediume redigeerida. Mõeldud algajale kasutajale, kes tegeleb sisuloomega, näiteks videotöötluse ja taskuhäälinguga. Tegemist on kasutajasõbraliku liidesega, mille põhifunktsioonide hulka kuuluvad automaatne kõnelejatuvastus, reaalajas koostöö tegemise võimalus ja subtiitrite automaatne genereerimine. Transkribeerib enam kui kümmet keelt, sealhulgas saksa, malai ja leedu keelt. Eesti keel paraku nende hulka ei kuulu.
Hind. Pakutakse nii tasuta paketti (igas kuus ühe tunni jagu tasuta transkriptsiooni) kui ka tasulisi pakette alates 12 dollarist kuus (sõltuvalt kasutusmahust).
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Heli redigeerimine on tekstipõhine ja funktsioon on lihtsasti kasutatav.
- Ühildub Microsoft Wordiga.
- Pakub kasutajasõbralikult disainitud pilvesalvestusruumi.
- Kõnetuvastusel põhinev transkribeerimine on lihtne ja täpne.
- Väljundfaili on võimalik eksportida eri formaatides.
- Interaktiivne ja kergesti järgitav kasutusjuhend, mida tutvustab päris inimene.
Puudused
- Videofailide eksportimisel esineb pidevalt probleeme, sellistel juhtudel süsteem aeglustub ja jookseb kokku.
- Jääb hätta standardkeelest erineva, aktsendiga kõne transkribeerimisel, mistõttu on teksti vaja hiljem käsitsi põhjalikult korrigeerida.
- Värskendused on sagedased ja mõnikord kasutud, nii et nendega kohanemine on tülikas.
- Täitesõnade ja vaikuse kustutamisega seotud probleemide korral on vaja käsitsi sekkuda.
- Algajate jaoks keeruline.
- Transkribeeritud väljund ei ole kõnelejate kaupa eraldi ridadele jaotatud.
5. Happy Scribe
Happy Scribe pakub algajatele ja edasijõudnutele nii inimese kui ka masina abil tehtud transkriptsiooni ja subtiitrite teenust enam kui 45 keeles, sealhulgas eesti keeles. Põhifunktsioonide hulka kuuluvad masintõlge, koostööd võimaldavad tööruumid, andmeturbe ja konfidentsiaalsuse tagamine, väljundfaili eksport mitmes vormingus ning piiramatu üleslaadimise võimalus.
Hind. Saadaval on tasuta pakett, mille transkriptsioonimaht (paar minutit) ja funktsionaalsus on piiratud. Tasuliste pakettide hinnad algavad 10 eurost kuus.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Kasutajad saavad transkribeeritud teksti lugeda samal ajal kui kuulavad helifaili, ja teha seda samas aknas.
- Paistab teiste tehisintellektil põhinevate transkriptsioonilahenduste hulgast silma oma erakordse täpsuse poolest.
- Rakendust on lihtne kasutada, isegi algajatel.
- Kiire transkribeerimine ja mitmekülgus, s.t sobib näiteks koosolekute, intervjuude ja audiovisuaalse sisu transkribeerimiseks.
- Lihtsasti integreeritav teiste tööriistade ja platvormidega.
Puudused
- Kasutajatel on rakenduses esinenud raskusi transkriptsiooni vormistamisega, probleeme tekib näiteks teksti sisestamisel ja tühikute lisamisel.
- Mõnikord ei suuda rakendus kõnelejaid eristada, mistõttu mitme kõneleja tekst liidetakse kokku.
- Inglise keele puhul annab hea tulemuse, kuid teistes keeltes on veel arenguruumi.
IBM Watson Speech to Text on pilvelahendus, mis kasutab kõne üleskirjutamiseks tehisintellekti sügavõppe algoritme. Tööriista saab kohandada erisuguste kasutusjuhtude jaoks, näiteks klientide iseteeninduse, virtuaalse abilise ja kõneanalüütika tarbeks. Põhifunktsioonide hulka kuuluvad ülemaailmse keeletoe olemasolu, võimalus kohandada programmi spetsiaalsete ärivaldkondade jaoks (sõnavara kohandamine) ja andmeturve. Programm tunneb laialdasemalt kõneldavaid keeli, näiteks araabia, itaalia ja hiina keelt. Väikesi keeli, nagu eesti keelt, sellega transkribeerida veel ei saa.
Hind. Valida on tasuta ja tasulise paketi vahel, valik oleneb transkribeerimist vajavate failide mahust. Tasuta pakett võimaldab ühes kuus 500 minuti jagu tasuta kõnetuvastust.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- See lahendus pakub häid näiteid ja põhjalikku dokumentatsiooni, parandades kasutajate arusaamist.
- Tagatud on mitmekeelne tugi, mis vastab kasutajate eri vajadustele.
- Kiiduväärt sõnatuvastus.
- API-t on lihtne seadistada, see on kiire ja tagab kenasti vormindatud väljundi.
- Lisafunktsioonide hulka kuuluvad reaalajas transkribeerimise režiim, kohandatud mudelid ja märksõnade markeerimine.
Puudused
- Teatud sõnakombinatsioonide täpseks tuvastamiseks tuleb mõnikord teha mitu katset.
- Transkribeeritavate keelte arv on piiratud.
- Kasutajate hinnangul ei ole transkriptsiooni täpsus kuigi järjepidev.
- Esineb raskusi kõnelejate eristamisel, mistõttu mõnikord liidetakse mitme kõneleja tekst kokku.
- Ekraanikuva suurust ei saa muuta, mis muudab tööriista kasutamise ebamugavaks.
7. Fireflies.ai
Fireflies.ai on tehisintellektil põhinev häälassistent, mis on loodud koosoleku pidamisega seotud ülesannete automatiseerimiseks, näiteks transkribeerimiseks, kokkuvõtete ja märkmete tegemiseks ning ülesannete lõpuleviimiseks. Tehisintellektil põhinev assistent nimega Fred ühildub suuremate veebikonverentsi platvormide ja ärirakendustega. Põhifunktsioonide hulka kuuluvad reaalajas kõne transkribeerimine, märksõnade ja teemade jälgimine ning sentimentanalüüs. Programm ühildub enamiku veebikonverentsi platvormidega. Transkribeerida on võimalik enam kui 60 keeles, sealhulgas eesti keeles. Süsteem eristab ka kolme inglise keele varianti.
Hind. Tasuta pakett võimaldab piiramatut transkriptsiooni, kuid salvestusruum on piiratud ja funktsioone on vähem. Tasuliste pakettide hind oleneb salvestusvajadusest ja algab 10 dollarist kuus.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Ühendub kõnedega, võimaldab märkmete tegemist ja koostab koosolekutest kokkuvõtteid.
- Liides on kasutajasõbralik.
- Genereerib kõnelejate meeleolu ja kaasatust kajastavaid infokaarte.
- Transkribeeritud teksti on lihtne teistega jagada.
- Tuvastab osaleja nime täpselt.
- Esitab transkriptsiooni ja kogu sellega seotud teabe ühes kohas.
Puudused
- Transkriptsiooni täpsus vajab parandamist (osa kasutajaid väidab, et täpsuse määr on ainult 30–50%).
- Tuleb toime inglise keelega, aga muude keelte ja dialektidega jääb pigem hätta.
- Kui koosolekul on liiga palju osalejaid, tuvastab mitu kõnelejat ühe ja sama inimesena.
- Koosolekust kokkuvõtete tegemisel piiratud funktsionaalsus, kokkuvõtted on mõnikord sisuliselt ebatäpsed.
8. Otter.ai
Otter.ai on tehisintellekti rakendav koosoleku abiprogramm, mis võimaldab koosolekuid automaatselt salvestada ja transkribeerida ning neist kokkuvõtteid teha. Põhifunktsioonid: populaarsete videokonverentsi platvormidega ühildumine, reaalajas transkribeerimine, mitmekesi koos märkmete tegemine, tehisintellektiga vestlemine ning iOS-i ja Androidi rakenduste kasutamine silmast silma kohtumisteks. Erinevalt teistest transkriptsioonivahenditest tunneb Otter ainult inglise keelt.
Hind. Kasutajad saavad valida tasuta paketi (igas kuus 300 minuti jagu transkriptsiooni) ja mitmesuguste tasuliste pakettide vahel (suurem transkriptsioonimaht ja lisafunktsioonid).
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Transkribeerib efektiivselt ilma kasutaja sekkumiseta, mugav lahendus loengute, esitluste ja projektiülesannete tarbeks.
- Tuleb väga hästi toime ka kiire tempoga arutelude transkribeerimisega.
- Silmapaistvalt hea otsingufunktsioon transkribeeritud tekstist vajalike kohtade leidmiseks.
- Võimaldab reaalajas transkribeerimist, teemade kategoriseerimist ja isegi automaatset ülesandeloendite genereerimist.
- Tänu tõhusale märgistusele on kõnelejaid transkribeeritud tekstis lihtne eristada.
- Võimaldab transkribeeritud teksti enne allalaadimist redigeerida.
- Võimaldab teha koosolekutest kokkuvõtteid ja neis olulisi punkte esile tõsta.
- Kiire ja paindlik, ühildub hõlpsasti Chrome’i laienduse ja kalendrifunktsiooniga.
Puudused
- Transkriptsiooni kvaliteet võib olla kehv, kui helifailid sisaldavad mitut kõnelejat, kõneldakse tugeva aktsendiga, räägitakse üksteisest üle või esineb taustamüra.
- Lihtne on Otter.ai kogemata sisse unustada, mistõttu on oht, et salvestatakse ka tundlikke vestlusi.
- Seetõttu ei soovitata seda kasutada kliendikõnede korral.
- Jääb hätta tehnilise kõnepruugi kontekstuaalse mõistmisega.
- Lisafunktsioone saab kasutada ainult tasulise tellimuse korral, mis jääb näiteks hinnatundlikumatele õpilastele kättesaamatuks.
- Piiratud keeletugi, transkribeerida on võimalik ainult inglise keeles.
9. Rev
Rev võimaldab heli- ja videofailide transkriptsiooni, lubades 99% täpsust. See on mõeldud laiale kasutajaskonnale, sh ettevõtetele. Programmi saab kasutada suuremate keelte puhul, näiteks araabia, hispaania ja vene keel. Põhifunktsioonide hulka kuuluvad tehisintellekti abil transkribeerimine, subtiitrite koostamine ingliskeelsetele videotele, kasutaja enda kohandatud sõnastiku kasutamine õigekirja tagamiseks ja interaktiivne transkriptsiooni redaktor. Revi kaudu saab tellida ka inimese koostatud transkriptsioone.
Hind. Tasuta pakette ei ole. Hinnad algavad 0,25 dollarist minuti eest, kui soovitakse kasutada spetsiifilisemaid funktsioone. Ühe kuu tervikpakett maksab 29,99 dollarit.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Kiire töö, transkriptsioonid valmivad mõne tunni jooksul.
- Transkribeerimine on võimalik ka mobiilirakenduse abil.
- Faile on veebisaidil lihtne korrastada.
- Transkriptsioonid on detailsed ja sisaldavad täpseid viiteid muusikale ning muudele helidele.
- Subtiitrid saab lisada otse videole või väljastada need eraldi tiitrifailina.
- Valminud tekst sisaldab grammatikavigu üsna vähe ja on hästi struktureeritud (sisaldab alapealkirju).
Puudused
- Kõneleja nime kirjutatakse kord nii, kord naa.
- Puudub koht, kuhu saaks sisestada märksõnu, näiteks õigekirja tagamiseks, eriti häirib see sageli kasutatavate terminite puhul.
- Reaalajas transkribeerida ei ole võimalik.
- Veebisaidil navigeerimist on vaja parandada, et tekstifaile oleks allalaadimiseks lihtsam kätte saada.
- Transkriptsiooni allalaadimise nupp on mõnikord peidetud rippmenüüsse, mis tekitab kasutajas segadust ja töös viivitust.
10. Sonix
Sonix on veebiplatvorm, mis võimaldab heli- ja videofaile automaatselt transkribeerida, tõlkida ja subtiitritega varustada. Platvormi saavad kasutada nii algajad kui ka edasijõudnud kasutajad. Põhifunktsioonide hulka kuuluvad kõnelejate automaatne eristamine, automaatne kirjavahemärgistamine, transkribeeritud tekstist otsimine, mitmesugused ekspordi- ja ühildumisvõimalused ning võimalus teksti brauseris redigeerida. Lahendus võimaldab transkribeerida enam kui 30 keeles, sealhulgas eesti keeles.
Hind. Saadaval on erinevaid pakette, hinnad algavad 5 dollarist tunnis (olenevalt sellest, kas kasutaja valib aja- või projektipõhise paketi). Uued kasutajad saavad tööriista veebis kuni 30-minutilise helifaili peal tasuta järele proovida.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Heli- ja videofailide üleslaadimisel nende automaatne teisendamine tekstiks.
- Ühildub pilvesalvestuse rakendustega, nagu Google Drive ja Dropbox.
- Kasutajasõbralik liides, mida iseloomustab lihtsus, puhtus ja kergesti kasutatavus.
- Teenus on kiire, transkriptsioonid on enamasti täpsed ja vajaduse korral on neid võimalik ka redigeerida.
- Subtiitreid saab eksportida eri tüüpi failidena.
Puudused
- Ajatemplid ilmuvad iga lõigu järel ja nende puhul esineb ebatäpsusi.
- Kasutaja ei saa abi, kui jääb videofailide üleslaadimisel hätta, mistõttu peab piirduma helifailidega.
- Puuduvad mobiilirakendus ja tõlkefunktsioon ning reaalajas transkribeerimise võimalust ei ole.
- Esineb raskusi ka rahvusvaheliselt tuntud aktsentide tuvastamisel ja täpsel transkribeerimisel.
- Tunnipõhine hinnakiri on teiste samalaadsete lahendustega võrreldes üsna kallis.
11. Trint
Trint on tehisintellekti rakendav platvorm, mis on loodud heli- ja videofailide transkribeerimiseks ja redigeerimiseks ning nende puhul koostöö tegemiseks. Lahendus on suunatud algajatele, kes töötavad näiteks sisuloojate või ajakirjanikena. Põhifunktsioonide hulka kuuluvad võimalus eksportida faile mitmes vormingus, subtiitrid ja masintõlge, reaalajas koostöö tegemise võimalus koos teksti esiletõstmise ja kommenteerimise tööriistadega ning ühildumine teiste platvormidega. Tunneb enam kui 40 keelt, sealhulgas eesti, ukraina, prantsuse ja jaapani keelt.
Hind. Tasuta pakette ei pakuta, küll aga antakse kasutajatele 7-päevane tasuta prooviperiood. Sõltuvalt transkriptsioonivajadusest algavad tasuliste pakettide hinnad 48 eurost kuus.
Kasutajad on tagasisides esile toonud järgmised plussid ja miinused.
Eelised
- Liides on kasutajasõbralik ja hõlpsasti navigeeritav.
- Saab tõhusalt hakkama mahukate helifailidega.
- Transkribeerimine on väga kiire ja täpne, eriti inglise ja prantsuse keele puhul.
- Transkriptsioone on lihtne parandada. Kasutajad saavad mugavalt reguleerida taasesituse kiirust, transkriptsioonis navigeerida ja salvestisi eri kaustadesse paigutada.
- Võimaldab nii subtiitrite genereerimist kui ka helifaili transkribeerimist.
- Kasutajad saavad transkriptsioone redigeerida veebis ja mobiilirakenduses.
Puudused
- Töökindlus oleneb internetiühenduse kvaliteedist, mõnikord on kasutajatel probleeme automaatse salvestamisega.
- Algajatele mõnevõrra keeruline, tõhusaks töötamiseks oleks hea läbida sissejuhatav koolitus, eriti kui soovitakse tervet transkriptsiooni redigeerida.
- Täpsus ei ole just kõige parem, eriti kui tegemist ei ole inglise keelega.
- Mitme osalejaga vestluse transkribeerimisel jääb kõnelejate eristamisel hätta.
- Esineb raskusi erialaterminite tuvastamisel, neid tuleb tagantjärele käsitsi korrigeerida.
- Mõistab rahvusvahelisi aktsente, kuid mitmekeelsete salvestistega jääb hätta.
- Hind on teiste lahendustega võrreldes suhteliselt kõrge.
Transkriptsioonirakenduste ülevaatlik võrdlus
Rakendus | Hind | Põhifunktsioonid | Puudused | Kasutaja tase |
Tekstiks | Tasuta. | Eesti ja soome keele transkribeerimine. | Võimaldab transkribeerida ainult helifaile; töö alustamiseks tuleb kasutajal oodata elavas järjekorras. | Algaja |
Amazon Transcribe | Esimesed 12 kuud tasuta, igas kuus on võimalik transkribeerida 60 minuti jagu heli. Suuremas mahus transkribeerimine on tasuline. | Ühildub paljude failivormingutega, kõneleja tuvastamine, reaalajas transkribeerimine. | Mõne keele puhul on täpsus küsitav, pikk transkribeerimise aeg, eeldab varasemat kokkupuudet arendustööga. | Edasijõudnud |
Deepgram | Uuele kasutajale antakse 200 dollarit krediiti. Aastane kasutustasu jääb vahemikku 4000–10 000 dollarit. | Ülitäpsed mudelid, kiire transkribeerimine, lihtne integreerida. | Vigaderohkus, keeruline hinnastamine, isikuandmete kaitse ei pruugi olla tagatud. | Edasijõudnud |
Descript | Saadaval tasuta pakett, mis võimaldab ühes kuus transkribeerida ühe tunni jagu heli. Tasuliste pakettide hinnad algavad 12 dollarist kuus. | Automaatne kõnelejatuvastus, reaalajas koostöö tegemise võimalus, interaktiivne kasutusjuhend. | Esineb probleeme videofailide eksportimisega ja aktsendiga kõne transkribeerimisega; algaja jaoks keeruline, vajab mõningast koolitust. | Kesktase |
Happy Scribe | Tasuta pakett, mille maht on üsna piiratud (paar minutit). Tasuliste pakettide hinnad algavad 10 eurost kuus. | Piiramatu arv üleslaadimisi, kiire transkribeerimine, koostöö tegemiseks eraldi töökohad. | Vormindamisprobleemid, aeg-ajalt esineb raskusi kõnelejate eristamisel, mõne keele puhul annab ebatäpse väljundi. | Algaja |
IBM Watson Speech to Text | Nii tasuta pakett (500 minutit kuus) kui ka tasulised paketid, mille hind oleneb transkriptsiooni mahust. | Reaalajas transkribeerimine, äridomeenide jaoks kohandatav, andmeturve. | Kohati ebatäpne, piiratud keeletugi, raskused mitme osalejaga kõne transkribeerimisel. | Kesktase |
Fireflies.ai | Tasuta pakett, mille salvestusmaht on piiratud. Tasuliste pakettide hinnad algavad 10 dollarist kuus. | Reaalajas transkribeerimine, ühildub veebikonverentsidega, märksõnade jälgimine. | Transkriptsiooni täpsus vajab parandamist, murretega jääb hätta, teksti kokkuvõtted on ebatäpsed. | Algaja |
Otter.ai | Tasuta pakett võimaldab ühes kuus transkribeerida 300 minuti jagu heli. Saadaval ka tasulised paketid. | Reaalajas transkribeerimine, koostööd võimaldavad funktsioonid, tehisintellektil põhinev vestlus. | Nõrk kvaliteet mitme kõneleja transkribeerimisel, programmi on lihtne kogemata tööle unustada, kasutatav ainult inglise keele puhul. | Algaja |
Rev | Tasuline teenus alates 0,25 dollarist minuti eest. | Kiire tööaeg, saadaval mobiilirakendusena, lihtne faile korrastada. | Kõnelejate nimede kirjutamisel ebajärjekindel, reaalajas transkribeerimise võimalus puudub, keeruline veebis navigeerida. | Algaja |
Sonix | Mitmesugused paketid alates 5 dollarist tunnis. Tutvumiseks saab tasuta transkribeerida kuni 30-minutilise helifaili. | Automaatne failide teisendamine sobivasse vormingusse, kasutajasõbralik liides, transkribeeritud teksti sees on võimalik kasutada otsingufunktsiooni. | Ajatemplite ebatäpsus, probleemid videofailidega, liiga kõrge hind. | Algaja |
Trint | 7-päevane tasuta prooviperiood, tasulised paketid alates 48 eurost kuus. | Tehisintellektil põhinev transkriptsioon, reaalajas koostöö tegemise võimalus, täpne tulemus inglise ja prantsuse keele puhul. | Algaja vajab tutvumiseks mõningast koolitust, ebatäpne (v.a inglise keele puhul), probleemid kõnelejate tuvastamisel. | Kesktase |