Millist masintõlkeprogrammi eelistada 2024. aastal?

machine-translation-guide

Masintõlge on 2024. aastal endiselt populaarne ning MTPE teenust kasutatakse üha enam. Automaatne tõlge on aasta-aastalt aina täpsemaks muutunud ning suurte tekstimassiivide tõlkimine on kõigest sekundite küsimus. See on suur võit ka tõlkijale, kellel on nüüd rohkem aega keskenduda naljade ja sõnamängude tõlkimisele, terminite otsimisele ning lokaliseerimisele.

Internetis on masintõlkeprogramme terve hulk ning sobivaima valimine võib osutuda parajaks pähkliks. Selles artiklis tutvustame viie tuntuima masintõlkeprogrammi eeliseid ja puudusi. Tegime väikese katse, et välja selgitada, kuidas eri masintõlkeprogrammid sama teksti tõlkimisega toime tulevad. Katsetasime kõige populaarsemaid masintõlkeprogramme. 

2024. aasta populaarseimad masintõlkeprogrammid

KeeledFailide üleslaadimineAPITasuta versioonLisafunktsioonid
DeepL32JahJahJahTehisintellektipõhine teksti korrigeerimine (inglise ja saksa keele puhul)
Google Translate133JahTasulises versioonisJahKõrgetasemeline pilditõlge
Microsoft Translator135Tasulises versioonisTasulises versioonisJahErifunktsioonid haridus- ja ärivaldkonna kasutajatele
Amazon Translate75JahTasulises versioonis12 kuud tasuta prooviperioodKompaktsuse funktsioon, kohatu sisu peitmine
ChatGPT∼100Tasulises versioonisTasulises versioonisJahTõlke stiili kohandamine
2024. aasta populaarseimad masintõlkeprogrammid

Vaatame ühe näidislõigu abil, kuidas on inglise-eesti tõlkega hakkama saanud DeepL, Google Translate, Microsoft Translator, Amazon Translate ja ChatGPT. Tõlgitav lõik on pärit rahvusvahelise reisiportaali Culture Trip blogist, mis pakub kultuurirohkeid ja keskkonnasõbralikke reisielamusi.

DeepL

DeepL tõlgib tasuta kuni 5000 tähemärki kuus. Tasuliste pakettide hinnad algavad 7,49 eurost kuus ja nende puhul on tõlgitava teksti maht piiramatu.

Tasuta versioon võimaldab üles laadida kolm kuni 5 MB suurust faili, mille sisu pärast üleslaadimist enam muuta ei saa. Lisaks on võimalik luua kuni kümne kirjega sõnastik.

Tasulise paketi korral saab üles laadida kuni 100 faili, mida on võimalik pärast üleslaadimist ka muuta. Ühe faili maht võib olla kuni 30 MB. Samuti saavad kasutajad luua kuni 2000 sõnastikku, igaühes kuni 5000 kirjet. Tasuline versioon pakub ka lisafunktsioone, näiteks kasutajate haldamine, ühekordne sisselogimine (SSO) ning sujuv ühendamine arvutipõhise tõlkimise (CAT) tööriistadega. Tasulise versiooni puhul on tagatud ka maksimaalne andmeturve.

DeepLi tasulistes pakettides saab kasutaja valida ka ametliku või mitteametliku stiili vahel. See võimalus on saadaval hollandi, prantsuse, saksa, itaalia, poola, portugali, vene, hispaania ja jaapani keele puhul. Iseäranis nõudlikult suhtutakse viisakusvormelite kasutamisse jaapani keeles. Selle keele puhul on vastava funktsiooni nimi plain/polite (ingl ‘lihtne/viisakas’). 

DeepL on saadaval ka tasuta mobiilirakendusena, mille abil on võimalik tõlkida isegi piltidel olevat teksti. Paraku on pilditõlge võimalik kõigest käputäie keelte puhul ning rakendus ei tunne kreeka ega vene tähestikku.

DeepLi soovitatakse eelkõige selle täpsuse pärast. Ent programm tunneb ainult 32 keelt, mis näiteks Google Translate’i 133 keelega võrreldes on selge puudus.

Ehkki esimeses lauses sisulisi vigu ei ole, teeb harjumatu sõnajärg lugemise raskeks. See-eest tabas DeepL teises lauses ära, et ingliskeelset väljendit tick all the boxes (‘kõiki kastikesi märkima’, ülekantud tähenduses ‘kõiki nõudeid täitma’) otse eesti keelde tõlkida ei ole kohane. Programm asendas selle üldisema väljendiga „pakub […] kõiki võimalusi”, mis on eestlase jaoks igati arusaadav.

Rewilding on eesti keeles „looduslikkuse taastamine“, ent DeepL on tõlkinud selle kui „metsade taastamine“. See pole küll täpne vaste, ent võrreldes teiste vaadeldud programmidega annab mõtte kõige paremini edasi. Lause teise poole sõnastus „reisimine […] projektis“ kõlab aga lausa kummaliselt – olgu juba ette öeldud, et selle lahendas paremini Google Translate (vt järgmist tekstinäidist).

Google Translate

Ehkki Google Translate seostub paljudele halva tõlkega, on programm pärast neurotõlkele üleminekut teinud suuri edusamme.

Neuromasintõlge (NMT) on masinõppel põhinev masintõlke mudel. Ehkki ka neurotõlge kasutab keelekorpuseid ja statistilisi arvutusi, töötavad NMT-mootorid tehisnärvivõrkude toel. Tehisnärvivõrgud on treenitud treeningandmetega. Umbes nii nagu inimaju, otsib ka tehisnärvivõrk tekstidest mustreid ning koostab seejärel tõlke. NMT-mootor analüüsib üksikute fraaside asemel kogu lähtelauset. Nii on tulemus ladusam ja keeleliselt korrektsem.

Google’i tõlge pakub mitut lisafunktsiooni, näiteks rakenduste integreerimise võimalust ja veebisaidi tõlkevidinat, ning tõlgib 133 keelde. Programm töötab ka ilma võrguühenduseta ja võimaldab tõlkida paljusid faile korraga.

Google’i tugevus on piltidel oleva teksti tõlkimise funktsioon, mis hõlmab suurt hulka keeli ja tähestikke. Tõlgitud piltidel säilib algteksti kirjastiil ja kujundus. Seega sobib see suurepäraselt siis, kui on vaja kiiresti tõlkida näiteks kutseid või reklaame.

Google Translate’i tasuta veebiversiooni ei soovitata juhul, kui töötad konfidentsiaalse teabega. Google’i algoritmid töötlevad sisestatud andmeid ja võivad neid kasutada erinevatel eesmärkidel (näiteks turundusotsuste tegemiseks). Turvalisemat andmekaitset pakub programmi tasuline versioon, Google Cloud Translation API.

Google saab plusspunkte esimese lause eest, milles fraas do our bit on tõlgitud kui „panust andma“ – see kõlab eesti keeles märksa loomulikumalt kui DeepLi vaste „oma osa tegema“. Teisalt tõlkis Google tick all the boxes eesti keelde otse, mistõttu jääb teise lause algus üpris arusaamatuks.

Rewilding, mille eestikeelne vaste on „looduslikkuse taastamine“, on tõlgitud „taaskasutamiseks“, mis tähendab hoopis midagi muud. Keelelisest seisukohast lahendas Google aga DeepList paremini teise lause lõpuosa: „projektiga tutvumine“ on kahtlemata arusaadavam kui „reisimine […] projektis“.

Microsoft Translator

Microsoft Translator on Microsofti tõlketeenus, mille veebiliides on Bing Translator. Programm sarnaneb paljuski Google Translate’iga, ent Microsoft pakub paremat hinna ja tähemärkide suhet. See on koguni kaks korda soodsam kui Google Translate: Microsoft võimaldab ühes kuus tasuta tõlkida kaks miljonit tähemärki ning selle piiri ületamisel tuleb lisatähemärkide eest tasuda 10 dollarit miljoni tähemärgi kohta; seevastu Google Translate võimaldab tasuta tõlkida 500 000 tähemärki kuus ning iga miljoni lisatähemärgi eest tuleb maksta 20 dollarit.

Tavakasutaja jaoks hõlbustab veebiversiooni kasutamist asjaolu, et populaarseimad fraasid on jaotatud kategooriatesse (nt tähtpäevad, romantilised olukorrad, hädajuhtumid). Saadaval on ka mobiilirakendus, mis pakub kvaliteetset pilditõlget ja reaalajas kõnetuvastust. Microsoft Translator toetab tekstitõlget 105 keele vahel ning kõnetuvastusega tõlget 12 keele vahel.

Lisafunktsioonide hulka kuuluvad näiteks rakenduste integreerimise võimalus, veebisaidi tõlkevidin ja projektide haldamise leht. Funktsioone saab kohandada vastavalt sellele, kas programmi kasutab eraisik, ettevõte või haridusasutus.

Microsoft Translatori kasutajad on välja toonud, et kõige rohkem probleeme esineb tõlke täpsusega. Eriti kimpus on programm pikemate lausetega. Eelisena olgu mainitud aga asjaolu, et see programm ühildub kogu ülejäänud Microsofti ökosüsteemiga, sealhulgas Office’i, Skype’i ja Bingiga, mistõttu on see paljude kasutajate jaoks esimene valik.

Microsoft Translatori tõlgitud esimene lause ei ole nii ladus kui DeepLi ja Google Translate’i tõlge. Teises lauses mainitud ökokastide märgistamine paneb aga eesti keele kõneleja lausa kulme kergitama. Rewilding’u vastena on siin kasutatud „ümberpööramist“, mis on samuti sisuline viga. Ent selle lause teise poole on Microsoft lahendanud paremini kui DeepL: „projekti külastamine“ kõlab pisut loogilisemalt kui „reisimine […] projektis“.

Amazon Translate

Amazon Translate’i kasutamiseks tuleb esmalt luua Amazoni veebiteenuste (Amazon Web Services) konto. Programmi tasuta prooviaeg on 12 kuud, mille jooksul on võimalik tõlkida kuni kaks miljonit tähemärki kuus.

Amazon Translate võimaldab tõlget 75 keele vahel ning programmi saab ühendada eri rakenduste, veebisaitide ja teenustega.

Andmeturbele mõeldes pakub Amazon info krüpteerimise ja juurdepääsukontrolli võimalust ning kaitseb kasutaja andmeid valdkonnas kehtivate nõuete kohaselt.

Amazoni tõlkeprogramm sisaldab mitut lisafunktsiooni, näiteks saavad kasutajad luua terminibaasi, mis aitab ühtlustada valdkonnaspetsiifiliste tõlgete sõnakasutust. Samuti on võimalik kasutada funktsiooni, mis aitab sihtteksti lühemaks teha. See on kasulik tekstide puhul, mis ei tohi ületada teatud pikkust, näiteks pealkirjad, subtiitrid ja ankeedi tekstiväljad. Peale selle on võimalik valida, kas sihttekst peaks olema ametlik või mitteametlik, ning lasta kohatu sisu peita, et tekst ei sisaldaks vulgaarseid väljendeid.

Esimeses lauses olev „reisimise ajal“ kõlab kehvemini kui „reisil olles“ või „reisides“, mida kasutasid eespool vaadeldud programmid. Teist lauset on alustatud sõnaga „õnneks“, mille järel on koma, kuid eesti keeles on selline lausekonstruktsioon halb. Sõnas „peremetsasse“ on kasutatud käändelõppu, mida vist ükski eestlane selle sõna puhul ei kasuta, ning „ümbermetsimine“ ei tähenda üldse mitte midagi. Seega, teised programmid maadlevad küll lausestusega, ent Amazon Translate’i puhul esineb ka tundmatuid sõnu ja tavatut käänamist.

ChatGPT

Ehkki tehisintellektil põhinev ChatGPT juturobot ei ole loodud spetsiaalselt tõlkimiseks, võib see siiski anda suurepäraseid tulemusi. ChatGPT on võimeline tõlkima umbes 100 keele vahel ning robotiga suhtlemine on piiramatu ka tasuta põhiversioonis. Lisafunktsioonidega versioon GPT-4 maksab 20 dollarit kuus ning võimaldab üles laadida faile ja kasutada rakendusliidest (API).

Erinevalt eespool mainitud tõlkeprogrammidest saab ChatGPT-le anda käsklusi teksti tooni ja stiili kohandamiseks. Näiteks kui soovid, et sinu kodulehe tõlge oleks vaba ja humoorikas, võid anda ChatGPT-le asjakohase käskluse. Kui pead aga kirjutama ametlikele nõuetele vastava kirja, saab ChatGPT sobiva käskluse korral sellegagi hakkama.

ChatGPT märkimisväärne puudus on paraku asjaolu, et rakendust ei uuendata piisavalt kiiresti. Seega ei pruugi programm alati ajakohaseid tulemusi anda. Lisaks on pidev käskluste väljamõtlemine ja nende täpsustamine üsna aeganõudev.

Järgnev tõlge on loodud ainult käskluse „Tõlgi“ abil.

Nagu DeepL, on ka ChatGPT hoidunud „kastide märgistamisest“ ning läinud hoopis „nõuetele vastamise“ teed, mis kõlab eesti keeles märksa loomulikumalt. See-eest mõjub siinses kontekstis kummaliselt mitmuslik sõna „kasumid“ ning taas mainitakse „projektis reisimist“, mille tähendust on keeruline tabada. Rewilding on tõlgitud kui „metsastamine“, mis ei ole õigest tähendusest küll valgusaastate kaugusel, ent pole ka päris täpne.

Allpool on esitatud sama tõlke ümbersõnastatud variant, mis on saadud käskluse „Sõnasta ümber humoorikas ja sõbralikus stiilis“ abil.

Ümbersõnastatud teksti esimene lause on märksa ladusam ja arusaadavam kui algse tõlke oma. Küll aga on viga väljendis „sama vaimus“ (peaks olema „samas vaimus“). Teisest kuni neljanda lauseni on sõnastus kummaline, näiteks kõlab pentsikult fraas „iga teie öö koos kasumiga“. Ent kahtlemata on see tekst hoogne ja värvikas ning võib anda inspiratsiooni reklaamteksti struktuuri jaoks. Ühtlasi on ChatGPT lisanud teksti lõppu emotikonid, mis muudavad tulemuse pilkupüüdvamaks. Ent keelelise poole pealt tuleb siiski ette võtta põhjalik vigade parandus.

Analüüsitud tõlgetest ei olnud ükski täiuslik. Selles võib ehk oma osa mängida eesti keele keeruline käändesüsteem ja inglise keelest väga erinev lauseehitus. Keeleliselt ja sisuliselt kõige parema tulemuseni jõudis DeepL: väikestest ebatäpsustest ja mõnetisest kohmakusest hoolimata võib tõlgitud lõigu üpris lihtsa vaevaga muuta soravaks eestikeelseks tekstiks. Kõige kehvema tõlkega sai hakkama aga Amazon Translate: lisaks komaveale ja üldisele kohmakusele kasutas programm ka sõnu, mida ei ole eesti keeles olemas.

Kokkuvõtteks võib öelda, et masintõlge on viimase paari aasta jooksul teinud hüppelise arengu ja tõlke kvaliteet on läinud üha paremaks. Siiski ei ole see veel piisavalt hea, et ilma inimese abita veatu tulemuseni jõuda.

SAADA MEILE PÄRING!

Lisa ka oma e-posti aadress ja failid ning saada päring. Ootame.