Millist masintõlkeprogrammi eelistada 2024. aastal?
Masintõlge on 2024. aastal endiselt populaarne ning MTPE teenust kasutatakse üha enam. Automaatne tõlge on aasta-aastalt aina täpsemaks muutunud ning suurte tekstimassiivide tõlkimine on kõigest sekundite küsimus. See on suur võit ka tõlkijale, kellel on nüüd rohkem aega keskenduda naljade ja sõnamängude tõlkimisele, terminite otsimisele ning lokaliseerimisele.
Internetis on masintõlkeprogramme terve hulk ning sobivaima valimine võib osutuda parajaks pähkliks. Selles artiklis tutvustame viie tuntuima masintõlkeprogrammi eeliseid ja puudusi. Tegime väikese katse, et välja selgitada, kuidas eri masintõlkeprogrammid sama teksti tõlkimisega toime tulevad. Katsetasime kõige populaarsemaid masintõlkeprogramme.
2024. aasta populaarseimad masintõlkeprogrammid
Keeled | Failide üleslaadimine | API | Tasuta versioon | Lisafunktsioonid | |
DeepL | 32 | Jah | Jah | Jah | Tehisintellektipõhine teksti korrigeerimine (inglise ja saksa keele puhul) |
Google Translate | 133 | Jah | Tasulises versioonis | Jah | Kõrgetasemeline pilditõlge |
Microsoft Translator | 135 | Tasulises versioonis | Tasulises versioonis | Jah | Erifunktsioonid haridus- ja ärivaldkonna kasutajatele |
Amazon Translate | 75 | Jah | Tasulises versioonis | 12 kuud tasuta prooviperiood | Kompaktsuse funktsioon, kohatu sisu peitmine |
ChatGPT | ∼100 | Tasulises versioonis | Tasulises versioonis | Jah | Tõlke stiili kohandamine |
Vaatame ühe näidislõigu abil, kuidas on inglise-eesti tõlkega hakkama saanud DeepL, Google Translate, Microsoft Translator, Amazon Translate ja ChatGPT. Tõlgitav lõik on pärit rahvusvahelise reisiportaali Culture Trip blogist, mis pakub kultuurirohkeid ja keskkonnasõbralikke reisielamusi.
DeepL
DeepL tõlgib tasuta kuni 5000 tähemärki kuus. Tasuliste pakettide hinnad algavad 7,49 eurost kuus ja nende puhul on tõlgitava teksti maht piiramatu.
Tasuta versioon võimaldab üles laadida kolm kuni 5 MB suurust faili, mille sisu pärast üleslaadimist enam muuta ei saa. Lisaks on võimalik luua kuni kümne kirjega sõnastik.
Tasulise paketi korral saab üles laadida kuni 100 faili, mida on võimalik pärast üleslaadimist ka muuta. Ühe faili maht võib olla kuni 30 MB. Samuti saavad kasutajad luua kuni 2000 sõnastikku, igaühes kuni 5000 kirjet. Tasuline versioon pakub ka lisafunktsioone, näiteks kasutajate haldamine, ühekordne sisselogimine (SSO) ning sujuv ühendamine arvutipõhise tõlkimise (CAT) tööriistadega. Tasulise versiooni puhul on tagatud ka maksimaalne andmeturve.
DeepLi tasulistes pakettides saab kasutaja valida ka ametliku või mitteametliku stiili vahel. See võimalus on saadaval hollandi, prantsuse, saksa, itaalia, poola, portugali, vene, hispaania ja jaapani keele puhul. Iseäranis nõudlikult suhtutakse viisakusvormelite kasutamisse jaapani keeles. Selle keele puhul on vastava funktsiooni nimi plain/polite (ingl ‘lihtne/viisakas’).
DeepL on saadaval ka tasuta mobiilirakendusena, mille abil on võimalik tõlkida isegi piltidel olevat teksti. Paraku on pilditõlge võimalik kõigest käputäie keelte puhul ning rakendus ei tunne kreeka ega vene tähestikku.
DeepLi soovitatakse eelkõige selle täpsuse pärast. Ent programm tunneb ainult 32 keelt, mis näiteks Google Translate’i 133 keelega võrreldes on selge puudus.
Lähtetekst inglise keeles
While we all like to do our bit for the planet at home, it’s equally important to do so while travelling. Fortunately, Scotland’s offer of regenerative tourism and rewilding stays tick all those eco boxes: whether it’s staying in a cosy woodland cabin where profits are invested back into the surrounding family-owned forest, or touring one of the country’s newest rewilding projects.
DeepLi tõlge
Kuigi meile kõigile meeldib kodus oma osa planeedi heaks teha, on sama oluline seda teha ka reisil olles. Õnneks pakub Šotimaa taastav turism ja metsade taastamine kõiki neid ökoloogilisi võimalusi: olgu see siis majutus mõnusas metsamajakeses, mille tulu investeeritakse tagasi ümbritsevasse peremetsa, või reisimine ühes riigi uusimas metsade taastamise projektis.
Ehkki esimeses lauses sisulisi vigu ei ole, teeb harjumatu sõnajärg lugemise raskeks. See-eest tabas DeepL teises lauses ära, et ingliskeelset väljendit tick all the boxes (‘kõiki kastikesi märkima’, ülekantud tähenduses ‘kõiki nõudeid täitma’) otse eesti keelde tõlkida ei ole kohane. Programm asendas selle üldisema väljendiga „pakub […] kõiki võimalusi”, mis on eestlase jaoks igati arusaadav.
Rewilding on eesti keeles „looduslikkuse taastamine“, ent DeepL on tõlkinud selle kui „metsade taastamine“. See pole küll täpne vaste, ent võrreldes teiste vaadeldud programmidega annab mõtte kõige paremini edasi. Lause teise poole sõnastus „reisimine […] projektis“ kõlab aga lausa kummaliselt – olgu juba ette öeldud, et selle lahendas paremini Google Translate (vt järgmist tekstinäidist).
Google Translate
Ehkki Google Translate seostub paljudele halva tõlkega, on programm pärast neurotõlkele üleminekut teinud suuri edusamme.
Neuromasintõlge (NMT) on masinõppel põhinev masintõlke mudel. Ehkki ka neurotõlge kasutab keelekorpuseid ja statistilisi arvutusi, töötavad NMT-mootorid tehisnärvivõrkude toel. Tehisnärvivõrgud on treenitud treeningandmetega. Umbes nii nagu inimaju, otsib ka tehisnärvivõrk tekstidest mustreid ning koostab seejärel tõlke. NMT-mootor analüüsib üksikute fraaside asemel kogu lähtelauset. Nii on tulemus ladusam ja keeleliselt korrektsem.
Google’i tõlge pakub mitut lisafunktsiooni, näiteks rakenduste integreerimise võimalust ja veebisaidi tõlkevidinat, ning tõlgib 133 keelde. Programm töötab ka ilma võrguühenduseta ja võimaldab tõlkida paljusid faile korraga.
Google’i tugevus on piltidel oleva teksti tõlkimise funktsioon, mis hõlmab suurt hulka keeli ja tähestikke. Tõlgitud piltidel säilib algteksti kirjastiil ja kujundus. Seega sobib see suurepäraselt siis, kui on vaja kiiresti tõlkida näiteks kutseid või reklaame.
Google Translate’i tasuta veebiversiooni ei soovitata juhul, kui töötad konfidentsiaalse teabega. Google’i algoritmid töötlevad sisestatud andmeid ja võivad neid kasutada erinevatel eesmärkidel (näiteks turundusotsuste tegemiseks). Turvalisemat andmekaitset pakub programmi tasuline versioon, Google Cloud Translation API.
Lähtetekst inglise keeles
While we all like to do our bit for the planet at home, it’s equally important to do so while travelling. Fortunately, Scotland’s offer of regenerative tourism and rewilding stays tick all those eco boxes: whether it’s staying in a cosy woodland cabin where profits are invested back into the surrounding family-owned forest, or touring one of the country’s newest rewilding projects.
Google Translate’i tõlge
Kuigi meile kõigile meeldib kodus planeedi heaks oma panust anda, on sama oluline seda teha ka reisides. Õnneks märgib Šotimaa taastava turismi ja taaskasutamise pakkumine kõik need ökokastid linnukesega: olgu selleks siis ööbimine hubases metsamajakeses, kus kasum investeeritakse tagasi ümbritsevasse peremetsa, või mõne riigi uusima taaskasutusprojektiga tutvumine.
Google saab plusspunkte esimese lause eest, milles fraas do our bit on tõlgitud kui „panust andma“ – see kõlab eesti keeles märksa loomulikumalt kui DeepLi vaste „oma osa tegema“. Teisalt tõlkis Google tick all the boxes eesti keelde otse, mistõttu jääb teise lause algus üpris arusaamatuks.
Rewilding, mille eestikeelne vaste on „looduslikkuse taastamine“, on tõlgitud „taaskasutamiseks“, mis tähendab hoopis midagi muud. Keelelisest seisukohast lahendas Google aga DeepList paremini teise lause lõpuosa: „projektiga tutvumine“ on kahtlemata arusaadavam kui „reisimine […] projektis“.
Microsoft Translator
Microsoft Translator on Microsofti tõlketeenus, mille veebiliides on Bing Translator. Programm sarnaneb paljuski Google Translate’iga, ent Microsoft pakub paremat hinna ja tähemärkide suhet. See on koguni kaks korda soodsam kui Google Translate: Microsoft võimaldab ühes kuus tasuta tõlkida kaks miljonit tähemärki ning selle piiri ületamisel tuleb lisatähemärkide eest tasuda 10 dollarit miljoni tähemärgi kohta; seevastu Google Translate võimaldab tasuta tõlkida 500 000 tähemärki kuus ning iga miljoni lisatähemärgi eest tuleb maksta 20 dollarit.
Tavakasutaja jaoks hõlbustab veebiversiooni kasutamist asjaolu, et populaarseimad fraasid on jaotatud kategooriatesse (nt tähtpäevad, romantilised olukorrad, hädajuhtumid). Saadaval on ka mobiilirakendus, mis pakub kvaliteetset pilditõlget ja reaalajas kõnetuvastust. Microsoft Translator toetab tekstitõlget 105 keele vahel ning kõnetuvastusega tõlget 12 keele vahel.
Lisafunktsioonide hulka kuuluvad näiteks rakenduste integreerimise võimalus, veebisaidi tõlkevidin ja projektide haldamise leht. Funktsioone saab kohandada vastavalt sellele, kas programmi kasutab eraisik, ettevõte või haridusasutus.
Microsoft Translatori kasutajad on välja toonud, et kõige rohkem probleeme esineb tõlke täpsusega. Eriti kimpus on programm pikemate lausetega. Eelisena olgu mainitud aga asjaolu, et see programm ühildub kogu ülejäänud Microsofti ökosüsteemiga, sealhulgas Office’i, Skype’i ja Bingiga, mistõttu on see paljude kasutajate jaoks esimene valik.
Lähtetekst inglise keeles
While we all like to do our bit for the planet at home, it’s equally important to do so while travelling. Fortunately, Scotland’s offer of regenerative tourism and rewilding stays tick all those eco boxes: whether it’s staying in a cosy woodland cabin where profits are invested back into the surrounding family-owned forest, or touring one of the country’s newest rewilding projects.
Microsoft Translatori tõlge
Kuigi meile kõigile meeldib anda oma panus planeedi heaks kodus, on sama oluline seda teha ka reisides. Õnneks märgistab Šotimaa regeneratiivse turismi ja ümberpööramise pakkumine kõik need ökokastid: olgu see siis ööbimine hubases metsamajakeses, kus kasum investeeritakse tagasi ümbritsevasse pereomandisse kuuluvasse metsa, või riigi ühe uusima ümberpööramisprojekti külastamine.
Microsoft Translatori tõlgitud esimene lause ei ole nii ladus kui DeepLi ja Google Translate’i tõlge. Teises lauses mainitud ökokastide märgistamine paneb aga eesti keele kõneleja lausa kulme kergitama. Rewilding’u vastena on siin kasutatud „ümberpööramist“, mis on samuti sisuline viga. Ent selle lause teise poole on Microsoft lahendanud paremini kui DeepL: „projekti külastamine“ kõlab pisut loogilisemalt kui „reisimine […] projektis“.
Amazon Translate
Amazon Translate’i kasutamiseks tuleb esmalt luua Amazoni veebiteenuste (Amazon Web Services) konto. Programmi tasuta prooviaeg on 12 kuud, mille jooksul on võimalik tõlkida kuni kaks miljonit tähemärki kuus.
Amazon Translate võimaldab tõlget 75 keele vahel ning programmi saab ühendada eri rakenduste, veebisaitide ja teenustega.
Andmeturbele mõeldes pakub Amazon info krüpteerimise ja juurdepääsukontrolli võimalust ning kaitseb kasutaja andmeid valdkonnas kehtivate nõuete kohaselt.
Amazoni tõlkeprogramm sisaldab mitut lisafunktsiooni, näiteks saavad kasutajad luua terminibaasi, mis aitab ühtlustada valdkonnaspetsiifiliste tõlgete sõnakasutust. Samuti on võimalik kasutada funktsiooni, mis aitab sihtteksti lühemaks teha. See on kasulik tekstide puhul, mis ei tohi ületada teatud pikkust, näiteks pealkirjad, subtiitrid ja ankeedi tekstiväljad. Peale selle on võimalik valida, kas sihttekst peaks olema ametlik või mitteametlik, ning lasta kohatu sisu peita, et tekst ei sisaldaks vulgaarseid väljendeid.
Lähtetekst inglise keeles
While we all like to do our bit for the planet at home, it’s equally important to do so while travelling. Fortunately, Scotland’s offer of regenerative tourism and rewilding stays tick all those eco boxes: whether it’s staying in a cosy woodland cabin where profits are invested back into the surrounding family-owned forest, or touring one of the country’s newest rewilding projects.
Amazon Translate’i tõlge
Kuigi meile kõigile meeldib kodus planeedi heaks oma osa teha, on sama oluline seda teha reisimise ajal. Õnneks, Šotimaa taastava turismi ja ümbermetsustamise pakkumine märgib kõik need ökokastid: olgu see siis ööbimine hubases metsamajas, kus kasum investeeritakse tagasi ümbritsevasse peremetsasse, või külastada ühte riigi uusimat ümbermetsimisprojekti.
Esimeses lauses olev „reisimise ajal“ kõlab kehvemini kui „reisil olles“ või „reisides“, mida kasutasid eespool vaadeldud programmid. Teist lauset on alustatud sõnaga „õnneks“, mille järel on koma, kuid eesti keeles on selline lausekonstruktsioon halb. Sõnas „peremetsasse“ on kasutatud käändelõppu, mida vist ükski eestlane selle sõna puhul ei kasuta, ning „ümbermetsimine“ ei tähenda üldse mitte midagi. Seega, teised programmid maadlevad küll lausestusega, ent Amazon Translate’i puhul esineb ka tundmatuid sõnu ja tavatut käänamist.
ChatGPT
Ehkki tehisintellektil põhinev ChatGPT juturobot ei ole loodud spetsiaalselt tõlkimiseks, võib see siiski anda suurepäraseid tulemusi. ChatGPT on võimeline tõlkima umbes 100 keele vahel ning robotiga suhtlemine on piiramatu ka tasuta põhiversioonis. Lisafunktsioonidega versioon GPT-4 maksab 20 dollarit kuus ning võimaldab üles laadida faile ja kasutada rakendusliidest (API).
Erinevalt eespool mainitud tõlkeprogrammidest saab ChatGPT-le anda käsklusi teksti tooni ja stiili kohandamiseks. Näiteks kui soovid, et sinu kodulehe tõlge oleks vaba ja humoorikas, võid anda ChatGPT-le asjakohase käskluse. Kui pead aga kirjutama ametlikele nõuetele vastava kirja, saab ChatGPT sobiva käskluse korral sellegagi hakkama.
ChatGPT märkimisväärne puudus on paraku asjaolu, et rakendust ei uuendata piisavalt kiiresti. Seega ei pruugi programm alati ajakohaseid tulemusi anda. Lisaks on pidev käskluste väljamõtlemine ja nende täpsustamine üsna aeganõudev.
Järgnev tõlge on loodud ainult käskluse „Tõlgi“ abil.
Lähtetekst inglise keeles
While we all like to do our bit for the planet at home, it’s equally important to do so while travelling. Fortunately, Scotland’s offer of regenerative tourism and rewilding stays tick all those eco boxes: whether it’s staying in a cosy woodland cabin where profits are invested back into the surrounding family-owned forest, or touring one of the country’s newest rewilding projects.
ChatGPT tõlge
Kuigi me kõik armastame kodus oma panuse andmist planeedi heaks, on sama oluline seda teha ka reisides. Õnneks vastab Šotimaa regeneratiivse turismi ja metsastamise pakkumine kõikidele nendele ökoloogilistele nõuetele: olgu selleks siis viibimine hubases metsamajas, kus kasumid reinvesteeritakse ümbritsevasse perekonnale kuuluvasse metsa, või ringreis ühes riigi uusimatest metsastamisprojektidest.
Nagu DeepL, on ka ChatGPT hoidunud „kastide märgistamisest“ ning läinud hoopis „nõuetele vastamise“ teed, mis kõlab eesti keeles märksa loomulikumalt. See-eest mõjub siinses kontekstis kummaliselt mitmuslik sõna „kasumid“ ning taas mainitakse „projektis reisimist“, mille tähendust on keeruline tabada. Rewilding on tõlgitud kui „metsastamine“, mis ei ole õigest tähendusest küll valgusaastate kaugusel, ent pole ka päris täpne.
Allpool on esitatud sama tõlke ümbersõnastatud variant, mis on saadud käskluse „Sõnasta ümber humoorikas ja sõbralikus stiilis“ abil.
ChatGPT tõlge
Kuigi me kõik armastame kodus oma panuse andmist planeedi heaks, on sama oluline seda teha ka reisides. Õnneks vastab Šotimaa regeneratiivse turismi ja metsastamise pakkumine kõikidele nendele ökoloogilistele nõuetele: olgu selleks siis viibimine hubases metsamajas, kus kasumid reinvesteeritakse ümbritsevasse perekonnale kuuluvasse metsa, või ringreis ühes riigi uusimatest metsastamisprojektidest.
ChatGPT ümbersõnastatud tõlge
Kuigi me kõik armastame kodus planeedi heaks midagi ära teha, siis reisil olles võiks ju sama vaimus jätkata! Õnneks pakub Šotimaa rohkelt võimalusi regeneratiivse turismi ja metsastamise kaudu, mis rahuldavad kõikvõimalikud ökoloogilised soovid. Mõelge sellele kui võimalusele veeta aega mõnusas metsamajas, kus iga teie öö koos kasumiga aitab kaasa perekonnale kuuluva metsa arengule. Või hoopis osaleda ringreisil ühes riigi uusimas metsastamisprojektis – nii et teie seiklus jääb mitte ainult meeldejäävaks, vaid ka loodussõbralikuks! 🌿😄
Ümbersõnastatud teksti esimene lause on märksa ladusam ja arusaadavam kui algse tõlke oma. Küll aga on viga väljendis „sama vaimus“ (peaks olema „samas vaimus“). Teisest kuni neljanda lauseni on sõnastus kummaline, näiteks kõlab pentsikult fraas „iga teie öö koos kasumiga“. Ent kahtlemata on see tekst hoogne ja värvikas ning võib anda inspiratsiooni reklaamteksti struktuuri jaoks. Ühtlasi on ChatGPT lisanud teksti lõppu emotikonid, mis muudavad tulemuse pilkupüüdvamaks. Ent keelelise poole pealt tuleb siiski ette võtta põhjalik vigade parandus.
Analüüsitud tõlgetest ei olnud ükski täiuslik. Selles võib ehk oma osa mängida eesti keele keeruline käändesüsteem ja inglise keelest väga erinev lauseehitus. Keeleliselt ja sisuliselt kõige parema tulemuseni jõudis DeepL: väikestest ebatäpsustest ja mõnetisest kohmakusest hoolimata võib tõlgitud lõigu üpris lihtsa vaevaga muuta soravaks eestikeelseks tekstiks. Kõige kehvema tõlkega sai hakkama aga Amazon Translate: lisaks komaveale ja üldisele kohmakusele kasutas programm ka sõnu, mida ei ole eesti keeles olemas.
Kokkuvõtteks võib öelda, et masintõlge on viimase paari aasta jooksul teinud hüppelise arengu ja tõlke kvaliteet on läinud üha paremaks. Siiski ei ole see veel piisavalt hea, et ilma inimese abita veatu tulemuseni jõuda.