Kas kellelgi peaks väga häbi olema?

Pole selge, mida täpselt TÜ diplom näitab. Kui ilmvõimatu ikkagi on ingliskeelsete magistritööde pealkirja ja sisukokkuvõtte A5-mahus tõlkimine riigikeelde?

ANTO VELDRE

Tahan teadusuudistega kursis olla, sestap vaatan kord aastas läbi mind huvitavate erialade lõputööd. Pole vahest üllatus, et näiteks TTÜ tehnika-alade lõputööde keele kvaliteet on äärmiselt niru juba vähemalt kümnendi. Nüüd tahan maarahvast teavitada asjaolust, et samasse auku on astunud ka meie prestiižikaim ülikool ning tekkinud on täiesti uus õudusžanr. Omi töid indoeuroopa keeltes esitavad tudengid ei täi pädevatele tõlkijatele-toimetajatele raha välja käia, mistõttu on täiesti paigast ära nii tööde eestikeelsed pealkirjad kui ka sisukokkuvõtted. On valiku küsimus, kas eestikeelse küündimatu tõlke puhul piirduda vaid märkamisega või süveneda ja leida, et vigane oli juba ingliskeelne pealkiri.1

Tudengitel on õnnestunud TÜ arvutustehnika instituudis aastal 2024 ära kaitsta näiteks sääraseid pealkirju kandvad tööd2.

„A Metrics-based Approach for Evaluating the Quality of Microservices-based Systems“ – „Meetritel põhinev lähenemisviis mikroteenustel põhinevate süsteemide kvaliteedi hindamiseks“. Jutt on mõõtmisest, mitte meetritest, kahekordsest põhinemise stilistikast tulnuks hoiduda ja metrics based approach vajaks tunnustatud tõlget. Seega võiks pealkiri olla „Mõõdupõhine meetod mikroteenustele tuginevate süsteemide kvaliteedi hindamisel“ või, kui teada, et katse käigus tekivad arvandmed, isegi „Mikroteenustel põhinevate süsteemide kvaliteedi hindamine arvandmete alusel“.

„Few-Shot Prompt-Tuning of Language Models for App Review Classification: An Evaluation Study“ – „Keelesuurmudelite väheste näidete põhine häälestamine rakenduste arvustuste klassifitseerimiseks: hindamis­uuring“. Teatavasti on suured keelemudelid, mingeid keelesuuri pole olemas. Kui näiteid on vähe, kas ongi statistiliselt representatiivne nendega tegeleda? Rääkimata sellest, et review vaste terminina on läbivaatus ja mitte arvustus ning klassifitseerimise asemel objekte pigem liigitatakse. Ka hindamisega peaks eesti keeles ette vaatama, see on assessment, evaluation, estimation ja veel paljutki muud. Evalveerimine!

Tõlkimatu. Eurofraasi an evaluation study aktsepteeritud tõlge hetkel puudub, väljendi App Review Classification tähendus pole selge, nõuab töö läbilugemist (võtab aega tunde).

„Analysing Model Attacks in Ma­chine Learning Pipeline“ – „Masin­õppe torujuhtme mudelirünnakute analüüs“ on totruse tipp – selge ka, miks: see on Google’i tõlge. Arvutustehnikas räägitakse konveiertöötlusest ning pealkirjast ei selgu, mille mudelit see torujuhe siis ikkagi ründab (IT-alal teatavasti toimuvad ründed, mitte rünnakud nagu sõjaväljal). Seega „Masinõppe andmekonveieril toimuvate mudelirünnete analüüs“. Rohitsemist vajaks juba ingliskeelne pealkiri, mis võiks sel juhul eesti keeli olla „Mudelirünnete analüüs masinõppe protsessis“.

Meditsiiniinformaatikat puudutava magistritöö „Stacks of Gold: Utilizing GANs to Enhance 3D Microscopy Imaging Data“ – „Kullakuhilad: 3D-mikroskoopia pildikvaliteedi parandamine GAN-idega“ tõlkes on sõnadest Stacks of Gold virna või pinu või kihtide asemel saanud kullakuhilad. Tore ja poeetiline, kuid tehnilise terminina kõlbmatu ja väga tõenäoliselt liigne. Tegelikult pidanuks (arvatavasti) olema „Vastandgeneratiivsete võrkude kasutamine andmete stereomikroskoopia kujutiste täiustamiseks“.

„Systematic Evaluation of Trust­worthy AI Augmentation in Modern Applications“ – „Usaldusväärse AI süstemaatiline hindamise laiendus kaasaegsetes rakendustes“. Kandvaks on siin laienduse süstemaatilisus, kuid terminil systematic on vähemalt viis vastet ja siin käib jutt pigem süsteemsusest. Problemaatilist tüve augmentation sobib siin asendama rikastamine, seega „Usaldusväärse AI-põhise andmerikastuse süsteemne hindamine tänapäevastes rakendustes“.

„Discovery and Simulation of Business Process with Multiple Data Attributes and Conditions“ – „Äriprotsessi Avastamine ja Simuleerimine Mitme Andmeatribuudi ja Tingimustega“. Taas Google’i tõlge, milles küll kõik sõnad suurtäheliseks tehtud. „Mitme tingimustega …“ küll, kuid huvitav, mis asi on äriprotsessi avastamine? Viisakates firmades äriprotsess konstrueeritakse, mitte ei kirjutata seda maha tegeliku elu pealt. Tööd lugedes selgub, et tegelikult äriprotsessi pelgalt uuritakse ning üldse, mitte teda ennast, vaid ta simuleeritud mudelit ja tolle käitumist. Seega on juba töö ingliskeelne pealkiri väär ka sisuliselt. Konsultandiga suheldes selgus, et simuleerimise asemel võinuks ingliskeelses pealkirjas olla emuleerimine. Seega: „Äriprotsessi kirjeldamine ning emuleerimine mitmete andmeatribuutide ja tingimuste abil“, kuid tõenäoliselt saab seda veelgi selgemini öelda – kui on selge, milline condition’i tähendustest siia passib ja kas tingimus või nõue (stipulation, requirement jne).

Kuid edasi! „Weakly Supervised Segmentation in Medical Imaging: A Counterfactual Approach“ – „Nõrga juhendatud segmenteerimine meditsiinilises kujutamises: kontrafaktuaalne meetod“. Kes küll on see Nõrk, kes seal juhendamas käis? Osutub, et weakly supervised käib hoopis AI kohta. Imaging oli vanasti pigem pildindus või pildistus. Kujutamine, sh anatoomiliselt korrektne, jäägu rahvakunstnike kapsamaale. Nii et pealkiri võiks olla „Vähe juhendatud segmentimine meditsiinilises pilditöötluses. Kontrafaktuaalne meetod“.

„Development and Analysis of a Crowdsourced Safety Map: User Input Study in Barcelona“ – „Rahvaühendusliku turvakaardistiku arendamine ja analüüs: kasutaja sisendi uuring Barcelonas“. Kas oskate selle indoeuroopa keelde tagasi tõlkida? Mina ei osanud, sestap spikerdasin. Crowdsourcing pole mitte rahvast ühendav ega rahvaühenduslik, vaid rahvahange või talguhange. Kaardistik eeldab tervet posu kaarte, siin ent leidub üksainus – Safety Map: Safety on ilmselgelt ohutus, üldsegi mitte turb. Parim lahendus (lugesin kiirelt läbi selle töö): „Teabe talguhankeline kogumine naistele ohtlike Barcelona linnaosade kaardi tarbeks. Süsteemi analüüs ning arendus“.

Töö pealkirjaga „Prosumer Net Consumption Forecasting: The Impact of Behind-the-Meter Self-Consumption and Weather Forecast ehk „Prosumerite netotarbimise prognoos: mõõtmata enesetarbimise ja ilmaennustuse mõju“ ei räägi sumeritest ega ajaloost üldse. Ennast ei tarbita. Eesti keeles enamasti ei moodustata lühendeid sulandsõnadena, nt Geheime+StaatsPolizei = GeStaPo ja Professional Consumer = ProSumer, mistõttu Behind The Meter osutub millekski hoopis intrigeerivamaks, kui lihtsalt „mõõtmata“ jäänud energiahulgaks. Nimelt: kui unustad oma kodu peakilpi paigutada omatarbimist mõõtva energiaarvesti, siis saab tekkiva määramatuse vormistada magistritööna. Eesti keeles sõnale prosumer tähenduses „klient, kes nii toodab kui ka tarbib“ vastet pole, EKI Sõnaveebi kaasatud tarbija elektrialale ei sobi. Net vs neto- vajab täpsustamist. AKIT ei luba impact’i mõjuks tõlkida. Seega: „Ilmaennustuse ja arvestitaguse omatarbimise toime energia väiketootja tegeliku tarbimise prognoosile“. „Zero-shot Machine Unlearning using GANs“ – „Zero-shot masinõppe unustamine kasutades GAN-e“. Unustatakse siin loomulikult miskit muud kui masinõppe valdkonda. Raskesti tõlgitav pealkiri, sest ingliskeelsed un-eesliitega verbid ei tõlku eesti keelde üheselt ning vastav termin seni puudus. Siinne kontekst on spetsiifiline: visata mudeli treeningandmetest välja need infokillud, mida seadus (nt GDPR) keelab mudeli treenimiseks kasutada. Võiks kaaluda eiramist. GANi tõlget vt eespool, konsultatsioonid andsid zero-shot’i vasteks uue terminikandidaadi: nullnäiteline. Kui see sõna juurdub, siis „Nullnäiteline unustamine masinõppes vastandgeneratiivsete võrkude abil“.

Ei suutnud üle saada kiusatusest ja vaatasin ka eestlaste magistritööde pealkirju, nagu „Terviseandmete üldistamine sagedaste andmehulkade abil“ ning „Hierarhilised prognoosimeetodid elektritarbimise päev-ette prognoosides“. Tööd ise on loomulikult (köh-köh) ingliskeelsed: „Generalising health events by using frequent itemset mining“ ja „Hierarchical Forecasting Methods in Day-Ahead Electricity Consumption Forecasting“. Intrigeeriv sage hulk osutub inglise keeles millekski hoopis vähem proosaliseks: frequent itemset mining, kuid pole selge, kas frequent on epiteet mining’u või itemset’i juurde. Kuidas põhisõnast kaevandamine järsku sage hulk sai, seda minu harimatu pea kinni ei võta. Öelnud siis: pundikaeve. Sõnastus päev-ette prognoosima ei sobi eesti keelesüsteemi ühtki pidi. Esmane pakkumine oleks: „Tervisesündmuste üldistamine sagepundi kaevega“, kuivõrd kaeve, punt ja sagepunt on AKITi vasted. Konsultant arvas, et kohendamist vajaks juba ingliskeelne pealkiri, seega võiks tõlkeks jääda „Terviseandmete üldistamine sagedaste andmepäringute abil“ ja teise puhul „Hierarhilised meetodid järgmise päeva elektritarbimise prognoosimisel“.

Lõpetan ülevaate magistritööga, mille pealkiri on „Multivocal Literature Review on Data Quality Challenges in Data Pipelines“ – „Multivokaalne kirjanduse ülevaade andmekvaliteedi probleemidest andmetorudes“. Eespool ette tulnud data pipeline on siin torujuhtme asemel tõlgitud andmetoruks, mida AKIT isegi aktsepteerib. Huvitava asjaoluna põlnd andmekvaliteedil häda miskit, kuni ta (kvaliteet) andmetorudesse sattus. Multivocal on allikate säärane valik, kus peale teaduskirjanduse vaadeldakse ka blogisid, kontseptsioonikirjutisi, videoid jm halli materjali. „Mitmehäälne kirjandus“ oleks tõenäoliselt liiga #metoo ning ega blogi ja video olegi eesti keeles enam kirjandus. Tulemus: „Erinevatel seisukohtadel allikate ülevaade andmekvaliteedi probleemidest andmekonveieril“.

Pika jutu kokkuvõtteks. Paistab, et tegu on süsteemse ja süveneva tendentsiga ning pole vähimatki märki õuduskirjanduse selle žanri taandumisest. Samuti pole selge, mida täpselt TÜ diplom ikkagi näitab. Kas tõesti vaid seda, et lõpetanu trampis kahe jalaga meie kalli emakeele otsas? Kui ilmvõimatu ikkagi on sisukokkuvõtte ja pealkirja A5-mahus tõlkimine riigikeelde?

1 Tänan konsultanti Paavo Heldet tõlkevõimaluste üle kaasamõtlemise eest. On ka selge, et kui pole töid läbi lugenud, võivad mingid terminikasutust määravad asjaolud olla jäänud mul märkamata.

2 TÜ arvutiteaduse instituudi lõputööde register https://comserv.cs.ut.ee/ati_thesis/?year=2024 (vaadatud 24. IX 2024).

Kui sulle meeldis see postitus jaga seda oma sõpradega

[LoginRadius_Share]

Leia veel huvitavat lugemist

Värske Rõhk
Hea laps
LR
Keel ja kirjandus
Akadeemia
Kunstel
Muusika
Õpetajate leht
Täheke
TeaterMuusikaKino
Vikerkaar
Looming
Müürileht