Kuidas koostada masintõlkimiseks sobiv tekst?

Masintõlke tehnoloogia

Tekstide paljususe tingimustes on üha olulisem, et tõlkimisega seotud kulud oleksid võimalikult väikesed. Tõlketeenuse hinda mõjutavad erinevad tegurid, näiteks tõlgitava teksti sõnade arv, võimalikud ajapiirangud ja erinevate lisateenuste, näiteks lokaliseerimise vajadus.

Masintõlge muutub üha populaarsemaks. Masintõlge sobib eriti hästi just tehniliste dokumentide tõlkimisel ja ka e-kaubanduses, näiteks tootekirjelduste tõlkimisel. Kvaliteetne masintõlge aitab ettevõttel kulusid märkimisväärselt kokku hoida.

Tekst peab olema masintõlke jaoks väga hästi optimeeritud, et ka pärast tõlkimist oleks see täpne, ladus ja loetav. Allpool jagame mõningaid praktilisi näpunäiteid, mis aitavad sul luua lähteteksti, mille põhjal sünnib täpne ja ladus masintõlge.

Kasuta lähtekeelena inglise keelt

Kui ettevõtte tõlkestrateegia on üles ehitatud masintõlke kasutamisele, siis annab inglise keele valimine lähtekeeleks mitu eelist. Seda eriti juhul, kui plaanid tõlkida teksti paljudesse erinevatesse keeltesse. Inglise keel on lingua franca – tänu kasutajate ja arenduste arvukusele eristuvad ingliskeelsed tõlkemudelid teistest keeltest eelkõige kvaliteedi poolest.

Ingliskeelne tekstikorpus on kõige suurem. Selle kohta on olemas rohkesti kakskeelseid ja paralleelseid treeningandmeid, mis aitavad masintõlkesüsteemi kvaliteeti parandada. Inglise keel mängib paljude keelepaaride puhul sildkeele rolli, suurendades tõlke täpsust ja usaldusväärsust. Kuigi lähtekeele valik sõltub konkreetsetest nõuetest ja keelepaarist, on inglise keel oma laialdase kasutuse ja rohkete ressursside tõttu masintõlke puhul populaarne ja praktiline valik.


Pööra tähelepanu vormistusele

Järgi tavapärast vormistust ja ära esita olulist teavet piltidel ega muudes tekstivälistes elementides, kuna tänapäeva masintõlkesüsteemid ei suuda veel sel viisil esitatud teksti tuvastada. Kui kasutad liiga palju paksu kirja, kaldkirja ja allakriipsutamist või muudad teksti kuju muul viisil, võid masintõlkesüsteemi segadusse ajada.

Ka kirjavahemärkide puhul on järjepidevus ülioluline, näiteks tuleks kogu tekstis kasutada ühetaolisi jutumärke. Inimene võib kirjavahemärgivea hõlpsasti tuvastada ja selle parandada, kuid masintõlkesüsteem lähtub lauseehituse ja tähenduse kindlakstegemisel just olemasolevast kirjavahemärgistusest ning vea korral võib tõlke kvaliteet kannatada.

Kaalu internatsionaliseerimist

Internatsionaliseerimine on tõlgitava teksti sõnastamine selliselt, et see sobiks erinevatele kultuuridele, keeltele ja piirkondadele. Teksti koostamisel on tähtis silmas pidada rahvusvahelist lugejaskonda ja vältida sellise lähteteksti kasutamist, mis võiks olla piirkonna- või kultuurispetsiifiline.

Masintõlke kasutamine

Samuti eelista sooneutraalset keelekasutust, juhul kui see sobib lähteteksti ja sihtkeelega. See aitab tõlkimist lihtsustada ja hoida ära võimalikke väärtõlgendusi. Pööra tähelepanu ka teksti stiilile, kuna mõnes keeles tehakse vahet näiteks ametlikul ja mitteametlikul väljenduslaadil.

Kasuta piiratud keelt

Piiratud keele (ingl controlled language) kasutamine on kirjutamismeetod, mille korral võetakse aluseks keele lihtsustatud versioon, mille grammatika ja sõnavara on piiratud. See on tõhus moodus luua selge ja kokkuvõtlik tekst, mida masinal on lihtne tõlgendada. Eriti kasulik on see igasuguste juhendite koostamisel, mille puhul täpsus on äärmiselt oluline. Piiratud keele kasutamisel väheneb ebamäärasus ja kahaneb teksti vääriti tõlgendamise oht. Tänu tõlkeprotsessi lihtsustamisele säästab see raha ning lisaks muudab tõlketeksti kasutatavaks ka erivajadustega inimestele või neile, kellele keerukas keelekasutus raskusi valmistab.

Pea aga meeles, et piiratud keel ei sobi igasse konteksti. Loomingulistes valdkondades, näiteks kirjanduses, kunstis ja turunduses, sobib kasutada mitmekesist keelt, milles on ruumi ka idioomidele ja emotsioonidele.

Ole terminite kasutamisel järjepidev

Masintõlke jaoks teksti koostades on tähtis kasutada tekstis läbivalt ühesugust terminoloogiat. Tõlkesüsteemid töötavad tehisnärvivõrkudel (need simuleerivad inimaju tööd) – süsteeme treenitakse etteantud tekstidest mustreid otsima. Ka masintõlge põhineb mustritel ja sõnadevahelistel seostel – kui kasutad sama objekti tähistamiseks erinevaid termineid või sünonüüme, võib see masintõlkeprotsessi häirida ning tulemuseks on ebaühtlane tõlge.

Loo konkreetsete mõistete jaoks selge ja ühtlane terminibaas ning kasuta mõisteid läbivalt samal kujul. Nii paraneb tõlke täpsus ja sidusus.

Väldi kirjavigu

See on elementaarne, kuid ülioluline reegel. Masintõlkesüsteem ei suuda valesti kirjutatud sõna õigesti tõlkida. Enne masintõlkesüsteemi kasutamist loe oma tekst alati hoolikalt läbi ning veendu, et kirjavigu ei ole.

Ole lühendite ja akronüümidega ettevaatlik

Masintõlkesüsteemil on lühendeid ja akronüüme tihtipeale keeruline mõista. Kui lühendil ametlikku tõlget ei ole, on enamasti parem sõna pikalt välja kirjutada. Ideaalis kasuta tekstis läbivalt tervet sõna või tervet nime. Samuti võid teha nii, et esmakordsel mainimisel kasutad tervet sõna või nime ning selle järele sulgudesse lisad lühendi või akronüümi. Seegi aitab masintõlkesüsteemil teksti paremini mõista.

Mõtle lause pikkusele

Masintõlkesüsteemil võib olla raske mõista ka keeruka ülesehitusega või liiga pikka lauset. Üldjuhul püüa ühe lausega anda edasi ainult üks mõte, nii saad segaduseohtu vähendada. Samuti tuleks võimaluse korral vältida sidesõnade ja kõrvallausete liigset kasutamist. Teisalt aga ei pruugi süsteem suuta tõlkida ka liiga lühikest lauset (seitse sõna või vähem), kuna see ei sisaldada tõlkimiseks piisavalt konteksti.

Ära kirjuta kogu lauset suurte tähtedega

Täislauset kirjutades järgi tavapäraseid väike- ja suurtähe kasutamise reegleid. Ära kirjuta kogu lauset suurtähtedega. Kui tõlgitav tekst on esitatud suurtähtedes, ei ole masintõlkemootor enam nii täpne ja võib anda kohati kummalisi tulemusi.

Kasuta erimärgi või sümboli asemel sõna

Masintõlkemootoril võib esineda raskusi ka selliste märkide ja sümbolite mõistmisel, mis ei ole sihtkeeles eriti levinud. Seetõttu soovitame sümbolite ja märkide asemel kasutada neile vastavaid sõnu. Näiteks on võimalik, et sümbolit „&“ sihtkeeles ei kasutata, seega tuleb parema tõlketulemuse saamiseks asendada see sidesõnaga „ja“.

Masintõlge

Pane rõhk kvaliteetsele lähtetekstile

Lähteteksti kvaliteet mõjutab oluliselt ka tõlketeksti kvaliteeti. Kvaliteetne sisend võimaldab tagada kvaliteetse tõlke.

Kasuta asesõnu arusaadavalt

Pööra tähelepanu sellele, et oleks üheselt arusaadav, millele asesõna viitab, kuna ebaselge viide võib tekitada segadust.

Kasuta isikulist tegumoodi

Isikuline tegumood vähendab teksti ebamäärasust ja mitmetähenduslikkust, mis võivad tõlkesüsteemile raskusi valmistada.

Väldi klišeesid, kõnekeelseid väljendeid ja kultuurilisi viiteid

Metafoore ja kõnekeelseid fraase ei pruugi süsteem osata õigesti tõlkida. Samuti võivad need teise emakeelega lugejates segadust tekitada, kuna on kultuurispetsiifilised.

Kohane muutustega

Keel areneb ja samamoodi peaks arenema ka masintõlke kasutamine. Vaata oma tõlkestrateegiad regulaarselt üle ja vajaduse korral kohanda neid.

Pea meeles, et masintõlge ei pruugi lähteteksti tooni, stiili ega peensusi täielikult edasi anda. Seetõttu on oluline oma ootusi realistlikuna hoida. Igal juhul, siinseid näpunäiteid järgides on sul võimalik koostada lähtetekst, mis on üheselt mõistetav ja paremini arusaadav.

Seotud postitused

SAADA MEILE PÄRING!

Lisa ka oma e-posti aadress ja failid ning saada päring. Ootame.