VASTAB Anto Veldre, Riigi Infosüsteemi Ameti infoturbeekspert

A.K.

Kui näed kuskil must valgel või kuuled raadiost näiteks säästukampaaniast, mille kohta kästakse vaadata aadressilt http://www. kummimees.ee/michelin-saast, kerkib paratamatult küsimus: millal ometi saab Eesti meili- ja koduleheaadressides eesti tähestikku tarvitada ja y-dest, sh-dest, zh-dest jms loobuda? See pidi juba praegu võimalik olema, kuid miskipärast seda ei tehta. Miks?          Interneti aluseks olevad tehnoloogiad on välja töötatud aastakümneid tagasi USAs ning ingliskeelsete sõjardite huvides. Täiesti kindlasti polnud kavas luua midagi universaalset ega boonusena pakkuda keeletuge kõigile maailma rahvustele. Kuid läks nii nagu läks. Interneti domeenide nimed ning e-posti aadressid pruugivad muldvana 7-bitist ASCII kooditabelit ning täpitähti selles lihtsalt ei sisaldu. Üldse on seal tabelis tähtede jaoks maksimaalselt 32 kohta, mis üksvahe sundis näiteks venelasi jo-tähest loobuma.    

Ladina tähestikku kasutavad rahvad seevastu ajasid esialgu läbi kas ilma täpitähtedeta (sh eestlased) või tegid kooditabelis omavolilist haltuurat (nagu soomlased, kes ohverdasid  nurksulud oma täpitähtedele). Teema tuli teravalt päevakorda seoses ida keelte ja kultuuridega, kus vajalike sümbolite hulk oli palju suurem kui 32. Vanemad arvutikasutajad mäletavad olukordi, kus täpitähtede asemel näidati hoopis kirillitsat. See asjaolu osutab, et tähtede kodeerimises arvutikeelde ei ole midagi kindlat ja jäävat, küsimus on vaid kokkulepetes (standardites) ja nende järgimises. Lahendus on lihtne: tegelik aadress, mida  arvutid näevad, esitatakse sigrimigriks kodeeritult ning inimesele paistab asi ekraanil ilusam, kui see reaalsuses on. Beekmanit parafraseerides: las arvuti töötab (teisendab ja kodeerib), tema on rauast. Meetodi teaduslik nimetus on MIME – Multipurpose Internet Mail Extensions.     

Nii näiteks, kui e-post saadetakse isikule, kelle nimi on Õnne-Üllatus Jää-Äär, siis masinad näevad seda pärisnime hoopis kujul 1W5uZS3cbGxhdHVzIErk5C3k5HI=. Kurb küll, aga trikk aitab vaid nime puhul. Postiaadress ise peab endiselt olema muldvana kooditabeli piires ehk enesetsensuuri korras tuleb valida midagi selletaolist: onneullatus. jaa-aar@abcde.ee. Lisaks tuleb masinatele  öelda, millisesse kooditabelisse tulemus tõlkida, kas eesti või hoopis jaapani omasse. Lõppkokkuvõttes saame aadressireale säärase jõleduse: To: =?windows-1257?B?1W5uZS3cbGxhdHVzIErk5C3k5HI= <onne-ullatus.jaa-aar@abcde.ee>   

Šoki vähendamiseks võib koera saba raiuda ka jupikaupa: To: Niit ja =?utf-8?q?N=C3=B5el?= Interneti domeenidega on asi peaaegu et veelgi lihtsam. Eesti Interneti Sihtasutus juba reserveerib täpitähtedega domeeninimesid ja  13. juunist saab neid päris vabalt tellida. Siiski on ka siin mõned piirangud. Täpitähena defineeritakse vaid 6 objekti ehk õ, ä, ö, ü, š ja ž, kuid näiteks Čapek.ee domeeni registreerida ei saa. Jaapanis ja Hiinas seevastu on tugi olemas ka hieroglüüfdomeenidele. Standardi teaduslik nimetus on IDN – International Domain Names. 

Kodeerimispõhimõte on küllaltki sarnane e-postiga. Masinatele näidatakse mingit sigrimigrit. 

Eeldusel, et keegi registreerib domeeni õnneüllatus.ee, siis masinad näevad seda kujul: xn- -nnellatus-p7a4f.ee. Ütleme ausalt, mõni sirvik muudab selle mudru kasutajale suupäraseks, mõni mitte. Isegi säärane suur riik nagu Venemaa realiseeris oma rahvusliku tähestiku domeeninimedes alles eelmisel aastal. Näiteks kui keegi riskib külastada säärast linki nagu http://xn– d1abbgf6aiiy.xn- – p1ai/, siis tegelikult satub ta  hoopis karuonu kodulehele (президент.рф). Täpitähtede olukord veebilingi sabaosas on kõige nutusem ja perspektiivitum, kuigi uus standard IRI (Internationalized Resource Identifiers) üritab seda ääri-veeri parandada. Kui keegi tahab oma veebiserveris serveerida faili õ.html, siis ise teab, millega riskib. Ei saa välistada, et mingis teises kultuuris võib masin kliendile selle koha peal näidata hoopis mingit muud roppu tähte. 

Kui sulle meeldis see postitus jaga seda oma sõpradega

[LoginRadius_Share]
 

Leia veel huvitavat lugemist

Värske Rõhk
Hea laps
LR
Keel ja kirjandus
Akadeemia
Kunstel
Muusika
Õpetajate leht
Täheke
TeaterMuusikaKino
Vikerkaar
Looming
Müürileht