Eesti esimene keeletehnoloog
Mõte Johannes Aavikust kui keeletehnoloogist ilmus uuesti kuhugi ajukäärudesse, kui vaatasin Anu Lambi tudengitega 2006. aastal lavastatud „Keeleuuenduse ∞ kurvi”. Noor näitlejatar proovis publiku peal läbi kõikvõimalikud Aaviku veenva valemi põhjal moodustet häälikukombinatsioonid valimaks kõlaliselt sobivaimat vastet mõistele ’kedagi uskuma panema’. Innukas neidis loendas neid järjekindlalt kui arvuti ja kombinatsioone endid oli kolmesaja kanti!
Aaviku geenius
Eks tunta Aavikut mitmetahulise tegevuse järgi. Peale tuntuima – tõhusa sõnaloome – jõudis ta programmiliselt ja süstemaatiliselt uuendada paljutki eesti vormimoodustuses. Ühtlasi oli Aavik osav keeleuuenduse mainekujundaja, levitades oma aateid ja vaateid menukirjanduse abiga. Mööngem, et noored inimesed, kes keeleuuenduse teooriat ja keelekorralduse praktikat koolitunnis mõttetuks ajaraisuks pidasid, said Aaviku keelepruugi ja uudissõnad märkamatult külge isukalt roima-kirjandusele kaasa elades.
Eesti kauaaegseim Aaviku-uurija Helgi Vihma ütleb usutluses Maalehele, et „kuigi samu põhimõtteid on hiljem rakendanud ka meie teine tuntud keelemees Johannes Voldemar Veski, oli Aavik siiski algataja. Veski taipas üsna kiiresti, et Aaviku puhul on tegemist geeniusega.”
Vanarahvas ütleb selle koha peal, et „pea lõikab kui koorelahutaja”. Koorelahutaja oli kunagi tõsiseltvõetav tehnoloogiline uuendus, sestap pole ime, kui eriti taiplikku või uusi seoseid loovat mõtlemist võrreldakse ütluse tekkimise ajal levinud tehnikaimega.
Miks ma õigupoolest seon Aavikut nii moodsa nähtusega kui keeletehnoloogia? Esiteks, tehnoloogia pole ainuüksi materiaalne. Juba põhikoolis õpitakse tehnoloogia mõistet: materjali töötlemise meetodite kogum, mida rakendatakse tööprotsessis. Keeletehnoloogia materjaliks on keel. Hans Uszkoreit, üks keeletehnoloogia korüfeesid, laiendab käsitlust: „Keeletehnoloogia peab looma formaalsete esituste süsteemid, mis seovad omavahel keele, mõisted meeles ja objektid tegelikkuses.” Just kõlalis-vormiliste põhjenduste kaudu uute sõnade loomise süsteemiga Aavik innukalt tegeleski!
Aaviku enese (keele)tehnoloogiline maailmavaade väljendub aga eredalt mõtteavalduses: „Kordame veel, keel on riist, keel on masin. Seepärast ei pea tema pääle vaatama mitte üksi loodusteadlase silmaga, keda huvitab ainult nähtuste konstateerimine ja seletus, vaid ka tööstusinimese, inseneri, tehniku silmaga, kes nähtusi oma kasuks, oma otstarvete kohaselt pyyab painutada ja kasutada”.
Teine põhjus on puhtalt ajalooline. Tänapäeval on keeletehnoloogias sõbralikult kõrvu kasutusel nii ratsionalistlikud (reeglipõhised) kui ka suuremat arvutustehnilist võimsust nõudvad empiirilised (statistilised) mudelid ja meetodid. Keeletehnoloogia esiaegadel ehk kaugetel 1950ndatel olid lootusrikasteks rakenduslikeks eesmärkideks masintõlge ja tehisintellekt – et ka arvutusmasinal „pea lõikaks kui koorelahutaja”. Toona puudusid võimalused korjata suuremahulisi tekstikorpusi, veelgi rohkem aja- ja arvutusressurssi oleks nõudnud neis korpustes statistiliste meetodite abil keelematerjali töödelda. Intuitiivsel ehk teadvustamata tasandil suutis statistilise keeletöötlusega hakkama saada ainult inimene. Kaasasündinud keelestruktuurist igapäevases keeletegevuses saadud kogemuste najal rehkendatud tulemustele toetudes olid algusaegade keeletehnoloogid oma „koorelahutajaga” võimelised koostama inimkeele kohta üldisi ja ka üksikasjalikumaid reegleid, mida omakorda arvutusmasinatele ette sööta. Kuid ka ilmakuulsa Noam Chomsky ideed kaasasündinud universaalsetest keelestruktuuridest ja unikaalsete inimkeelte kasutamisest ei tekkinud tühjale kohale. XX sajandi alguse tehnikasaavutustega üheaegselt arenes keeleteaduses strukturalism, väidetavalt alguse saanud Ferdinand de Saussure’i loengukursusest. Strukturalismi uskudes said hiljem võimalikuks nii lausetransformatsioonide kui ka generatiivse grammatika ideed. Polnuks strukturalismi varem, tulnuks see ilmselt hiljem välja mõelda, et arendada keele arvutitöötlust.
Keel on masin
Aaviku süstemaatilisus keele vormikäsitluses võib viia mõttele, et tegu on pesueht strukturalistiga. Ka ideeline taustsüsteem on ajastuse mõttes igati sobiv. Kummatigi pole Aavik oma muidu täpsetes viidetes ja vihjetes kedagi strukturalistidest nimepidi maininud. „Kui Saussure’i loengukursus ta õpilaste toimetamisel trükki jõudis, oli keeleuuendus Eestis juba alanud,” ütleb Eva Lepik vaimukalt oma semiootika seminaritöös.
Strukturaalses lingvistikas postuleeritakse keel kui märkide süsteem. Keelemärgil omakorda on tähistatava ja tähistaja pool, mis on omavahel lahutamatult seotud.
Aavik läks oma eufoonia-ideedega tehiskeelendite loomisel tugevasse vastuollu strukturalismi teesiga keelemärgi lahutamatute poolte seose meelevaldsusest. Aavik väitis, et isegi häälik kannab teatavat, olgu siis emotsionaalset või esteetilist tähendust ja seega mõjutab märgatavalt kogusummat ehk sõna tähendust. Loodushääli matkivais ja kirjeldavais sõnus on häälikutel tõesti tajutav(am) seos tähistatava nähtusega, kuid Aavik püüab sellelt kõigile tuttavalt pinnalt tuletada häälikute universaalseid tähenduslikke omadusi ehk häälikusümboolikat. Paljud tema eufoonia-argumentidest kannatavad psühho- või neurolingvistika seisukohalt teaduslikus mõttes subjektiivsuse all (s.t pole suudetud katseliselt või näiteks assotsiatsioonitestide abil tõestada, et ühel või teisel häälikul või häälikuühendil oleks eesti keeles nii- või naasugune tähenduslik mõju), kuid kognitiivselt (tajumuslikult, adumuslikult) võib vist enamik eestlasist neile Aaviku väidetele alla kirjutada.
Keeleuuenduse äärmiseks võimaluseks pidas Aavik tehiskeelendite loomist. Ometi ei talitanud Aavik selles äärmuses uisapäisa, vaid välmis uudissõnu argumenteeritud struktuurivalemite abil. Aaviku argumendid keeleloome tehnoloogiliste võtete pakkumises ulatuvad häälikute kõlasümboolikast kaugemale ja tajutav mõju omistatakse ka häälikute ning sõnade pikkusele ja muutetüübi haruldusele.
Kummastaval moel paistab Aavik olevat ajast ees isegi statistilises keeletöötluses. Oma väiteid ühe või teise hääliku või konstruktsiooni sobimatusest üritab ta põhjendada nende liigsuure sagedusega, teatades näiteks t/d osakaaluks häälikute üldarvust 13%.
Ja lõpuks, arvukaid Aaviku tsitaate ja uudissõnu arvutisse tippides lasin neile kohe peale ka moodsa keeletehnoloogia vahendi, vormikontrolli ehk spelleri. Väga vähesed vormid arvati vigaseks, peamiselt y-märgi kasutamise tõttu. Eks ole seegi märk Aaviku keeletehnoloogilisest pädevusest, mille viljad ulatuvad tehnoloogiliselt ülegi arenenud tänapäeva.