Friday, November 24, 2023

Tõlkimisest: Tehisaru vs Inimene

Kes mu blogi lugenud, teab, et olen üks laisk ludri, kes pingutada ei viitsi. Kas olete kunagi mõelnud selle peale, miks inimesed igatsugu asju leiutavad - ainuüksi sulaselgest laiskusest, selleks et mingile tegevusele vähem vaeva kulutada. Juba ürginimene leiutas vibu ja oda, et saaki kergemini kätte saada, kasutas tuld, sest küpset liha pidi vähem närima. Ratas leiutati, et kergema vaevaga kiiremini edasi liikuda. Relvi täiustatakse et lihtsam ja kiirem oleks kaaskodanikke maha tappa. Ma lihtsalt mõtlesin (tunnistan, et ei ole mingi suur ja originaalne avastus), et uue keele äraõppimise asemel on ju hulka lihtsam ja kiirem meetod tõlkerobot.

Eile tekkis huvi, kui edukalt saaks kasutada tehisaru võõral maal turistina sünkroontõlkeks. Ehk siis nii, et mina räägin oma keeles ja mobla räägib sünkroonselt tõlgituna sama jutu teises keeles. Kunagi ammu 10 aastat tagasi kui Jaapanis käisime kasutasin mingit algelist programmi, mis inglist jaapani keelde ümber pani. Selles mõttes oli täitsa kasu, et sai jaapanlastega väga rudimentaalsel tasandil suhelda - nad ju suures enamuses inglist ei jaga ehkki see nende kooliprogrammis. Tuletab meelde Kanada prantsuse keele õpetamist/õppimist siinsetes koolides - kohustuslik aga sisuliselt keegi peale quebecklaste pole võimeline peale aastaid õppimist vestlema või isegi aru saama. Kokkuvõttes maha visatud aeg, mis pani lapsed seda keelt pigem vihkama mitte oskama. Jah, ma tean et iga keel on kasulik omada, aga proovi sa seda eelteismelisele selgeks teha.

Jälle läks jutt oma teed lendu. Tahtsin ju kirjutada tõlkerobotitest, mis audiosignaali ehk kõnet nii sisendi kui väljundina pakuvad. Kui juba teksti tõlkimine on paras pähkel siis audio juures on vaja lisaks aru saada hulgast erinevalt rääkivatest inimestest ja keeltest (kõne analüsaator) ja ka rääkida eri keeltes (kõne süntesaator). Olles laisk ja kasutades tänapäeva tehnoloogiat küsisin kohe Bingi (ChatGPT-4) ja Bardi käest milliseid tasuta tõlkeroboteid nad soovitaks. Üks hea kokkuvõtlik artikkel ka juunikuises PCmag'is: "Google Translate vs LLM". Kuna eesmärk polnud kokku panna teaduslikku uurimustööd selgus suht kiiresti, et Google Translator on see, mida kasutada. Oluliseks eeliseks ka ilma netiühenduseta töötamine, mis terves hulgas riikides kas mitte eriti hea või kole kallis. Peab vaid vastavad keelepakendid eelnevalt mälusse laadima. Katsetasin oma tuttavate keelte raamides ja pean tunnistama, et töötas üllatavalt hästi - janusse suremist pole kuskil karta, ehk siis õltsi🍺 oskas kenasti ja korrektselt küsida😜

Google translatori puhul ei saavat väidetavalt väljundkeele sugu ega tonaalsust muuta. Enamus keeli räägib ta naise häälega, eesti keel üksikute meeshäälte hulgas, oleks huvitav teada miks. Olen kuulnud, et osa professionaalsemaid kõnesüntesaatoreid räägivad peale mõningast treenimist su enda tonaalsuse ja kõlaga - paraku momendil ilmselt tegu suht mahukate ja kallite programmidega. Nii või teisiti, tundub et Star-Treki tüüpi sünkroontõlge on vaid mõne aasta kaugusel ja inimtõlkimine väljasurev amet muutudes vaid mõne üksiku eksperdi pärusmaaks. Ehk siis nagu kooli külastanud sõjaväe hävituslendur valmistas vaimustunud poisikestekambale pettumuse väites, et selleks ajaks kui nemad suureks kasvavad on sõjaväe lenduri amet kadunud kuna palju odavam on ehitada palju efektiivsemat droonlennukit, mis ei pea suutma pilooti elus hoida ega vaja piloodi treenimiseks minevat aja ja rahakulu. Hea paralleel on robotite Marsile saatmine, palju odavam ja lihtsam, inimene ei anna tehisintellekti ajastul enam lisaväärtust. Nii pole peagi vaja ei tekstide ega kõne massilist inimtõlget võõrkeele oskusest rääkimata, ehk vaid üksikud super-eksperdid, kes legaalselt olulised masintõlke dokumendid üle vaatavad.

Kas kasutate masintõlget ja millised kogemused kui olete kasutanud?

13 comments:

  1. ma elan tõlkimisest ja kasutan masintõlget ühe tööriistana teiste hulgas. Sellega peab ettevaatlik olema, sest mõnikord näeb tema tekst piisavalt kaua piisavalt adekvaatne välja, nii et uinutab ära, ja siis viskab mingi uskumatu lolluse sisse, mõni paneb lausa imestama, kuidas see on saanud tekkida, sest vähimatki loogikat ei paista.

    Ühesõnaga, tööprotsessi iseloom on muutunud, vähem käsitsi toksimist ja rohkem tähelepanu suunamist, seega on hakanud mõnevõrra rohkem meenutama toimetaja tööd. Ja siis tuleb teha vähemalt veel üks ring valmis peale, et ennast isegi pakutud adekvaatsetest vastetest lahti rebida, sest tekst võib nendega puine tulla (see risk on muidugi ka tõlketarkvaras n.ö käsitsi tõlkides, sest tekst tuleb lause- või lõikhaaval ette ja tervikutaju kannatab). Puisus ja voolavus on omadus, mida masin ei taba (just nagu robottekstid on lamedad).

    Laiatarbekaubaks ja kiireks olmetõlkeks käivad need mootorid ilmselt küll.


    Mu kogemused (kuidas ma pean ise paar ringi pärast üle käima) on sealjuures põhiliselt õigustõlkega, mis on küll keerukas, aga mitte teab mis kujundlik tekst. Aeg-ajalt näitab mu blogistatistika, et keegi on seda tõlkemasinaga lugenud, vaatan siis seda, mida masin on talle näidanud ja vähegi kunstiliselt uljama postitusega on oi-oi-oi... Huvitav, kas need lugejad sealt üldse arugi said, millest juttu.

    ReplyDelete
    Replies
    1. see asi ka, et masintõlge saab alati olla maksimaalselt nii hea, kui keelekorpus, mis tema kasutada on. Aga ma tahaks ise ikka vahel olla enneolematult hea! ja mul on see põhimõtteliselt võimalik. Nt kui ma tahan kummutada mingit arulagedat vastet, mille keegi on kunagi lohakusest tekitanud ja mis seejärel on tekstist teksti vohama läinud nagu viirus, tahab see kõigest mõnda aega vaidlemist ja õiendamist.

      Masin muidugi niiviisi ei vaidle. Ja järgmine küsimus on selles, kas klient tahab võimalikult sõnakuulelikku töötegijat, milleks masin on ilmselt parem kui miski muu, või ta tahab tõlkijat just sellepärast, et tahab eksperti, ning oma arvamus ja otsustusvõime käivad ekspertlusega komplekti.

      Delete
    2. toon ühe lihtsa näite sellest, kuidas tõlkimine ei ole puhtmehaaniline- vt mu konna ja kala postitust.

      Pealtnäha lihtne tekst, aga selle korralikuks tõlkimiseks peaks ära tundma kaks Daniil Harmsi tsitaati, otsima need üles sihtkeelses tõlkes (lootusega, et see eksisteerib) ja vaatama, et Harms oleks ka tõlgitud tekstis tajutav. Või kui Harmsi sihtkeeles ei ole, siis sokutama sisse mingi samaväärse/-laadse allusiooni.

      Delete
  2. Väga huvitav eksperdi arvamust kuulda! Ma ei kahtlegi, et praegune tõlketase inimesele veel vastu ei saa, vähemalt see millele tavakodanikul ligipääs. Personaalselt arvan, et korraliku sisulise ja kunstiliselt ilusa tõlke tegemiseks peab olema AGI, lihtsalt andmemahtude suurendamisest ei piisa. Samas tõlkerobotid turistile või lähemas tulevikus võõrkeelse audioraamatu kuulamiseks, filmi vaatamiseks väga mugavaks abivahendiks.

    ReplyDelete
    Replies
    1. jaa, muidugi, ja nagu ma ütlesin, ka tõlkijale endale.

      Delete
  3. Suulise tõlke maailmast oskab Sitsidsatsidpatsid kindlasti paremini rääkida, mulle meenub aga tõlkija taustateadmiste olulisuse kohta tõestisündinud lugu, kui Mart Laar olevat kuskil euroinstitutsioonis oma kõnes öelnud "sellist rehepaplust ei saa ometi sallida" ja tõlkijate kabiinides oli korraks olnud pikk mõttetihe paus...

    ReplyDelete
    Replies
    1. 😁 seda lauset mingisse võõrkeelde tõlkida on paras pähkel, eriti kui tahad ilusti tausta ka veel edasi anda.

      Delete
    2. ragistasin täna natuke sel teemal ajusid, aga haigest peast ei kuku väga hästi välja, igatahes kaalusin, et ingliskeelses kultuuriruumis leiaks võib-olla Dickensilt mõne analoogi.

      prantsuskeelsest - Thénardier'd? aga see pole päris see.

      hea mõtteülesanne igatahes.

      notsu

      Delete
    3. aga viimastel aastatel olen laisalt mõelnud ühe teksti eesti keelde panemise võimaluste üle. See on üks 16. sajandi alguse Prantsuse tantsutekst - osalt õpetus, aga osalt väga lõbus kommentaar. Tõlkida tahaks, sest just nimelt lõbus ja naljakas. Aga osa naljast tuleb keelekasutusest. See tekst on kirjutatud muidu ladina keeles ja klassikalises vormis (eleegilises distihhonis), aga see ladina keel on tal makarooniline, tähendab, ta puistab sinna ladina käände- ja pöördelõppudega selliseid prantsuse sõnu, mis ei ole mitte kuidagi ladina keelest pärit. Nagu "nachtigallid schlaigivad", kui eesti keel oleks üks peen rahvusvaheline kultuurkeel, mille suhtes saksa keel oleks uuem ja madalam.

      novott ja kuidas seda siis edasi anda. Kui ma tõlgiks ära ainult prantsuse sõnadega kohad ja jätaks ladina keele, nagu on, ei saaks eestlased aru. Kui ma tõlgin ladina keele ära ja jätan prantsuse sõnad, nagu on, ei mõju nad eesti keeles selliste barbarismidena nagu originaalis, vaid pigem peenutsemisena.

      hetke parim idee on tõlkida ladina keel ära ning võimalikult peende eesti keelde, à la Ants Orase tõlked (mille headuse juures on tüüpviga see, et ta kipub originaalist peenem olema), ja prantsuse sõnad asendada mingite tänapäeva slängihõnguliste võõrtüvedega.

      aga selle risk on jälle see, et tekst kukub oma ajastust välja.

      aga teisest küljes ei ole meil eesti keeles korralikku 16. sajandi kihistust nagunii ja kui oleks, siis oleks ta tänapäeva eestlasele raskesti arusaadav (eesti keel on minu hinnangul sestsaadik rohkem muutunud kui prantsuse keel).

      Ja see kõik enne, kui asuda vormiküsimuste juurde, eeskätt kuidas tõlkida klassikalisi värsimõõte, mis töötavad pika ja lühikese silbi binaarse vastanduse peal, eesti keelde, kus on kolmes suhtelises pikkuses silbid. Minu lahendus on kasutada keskmise pikkusega (st teises vältes) silpe jokkerina - kui vaja, pruugin pikas, kui vaja, lühikeses positsioonis, aga ma kipun selle süsteemi raames eri sorti keskmisi silpe erinevalt tajuma, nii et see on tegelikult keerulisem. Ja noh siis see väike asi, et see tekst oleks ka värsimõõdus ikkagi arusaadav ja voolaks enam-vähem loomulikult.

      põhiline niisiis, et sellist asja tõlkides tuleb vastata paljudele küsimustele, millel ei olegi üht õiget vastust. Mis tähendab mõistagi, et samast tekstist saab teha mitu erinevat, aga head tõlget. Georg Mere ja Ants Orase Shakespeare mõjub üpris erinevate autoritena.

      notsu

      Delete
    4. Pean ausalt tunnistama, et sinu tõlketeooria kõvasti üle minu arusaamise taseme. Olen küll võimeline suhtlema 5 keeles aga peensusteni küünin ehk kolmes.

      Tavataseme tõlgete puhul (filmide subtiitrid, ajakirjade tõlked) vahepeal häirib kui tõlkija puusse paneb aga võtan seda kui paratamatust. Ilmselt makstakse liiga vähe, et tipptasemel tõlkijat ja keelevaldajat palgata. Keerulisema tekstiga puutun kokku inglise keeles, mida suht hästi tunnen ja üldiselt on tõlked tasemel. Väga spetsiifilise tekstiga, mis eeldab eksperti, praktiliselt kokku ei puutugi.

      Delete
    5. kui sa loed vahel eestikeelset tõlkekirjandust, mis on lugedes sundimatu ja ei tekita vajadust kogu aeg tagasi tõlkida, et aru saaks, vaid on tunne, et teisiti ei saagi seda asja väljendada, siis tglt sa oled eksperdi tööga kokku puutunud. Selline sundimatus ei tule lihtsalt.

      Delete
    6. Hea point, et ekspert on ilukirjanduses nii hea et ei märkagi!

      Delete
    7. või märkad lihtsalt, et raamat ise on tore, ja mõtled, milline hea autor. Kui tõlkija on lasknud autoril ja raamatul mõjule pääseda.

      Delete

Kõik kommentaarid ootavad modereerimist!