Keele Infoleht

  • Miks masin tõlkija? Poiss ei tea grammatika

    Setu-prantsuse masintõlke loomiseks pole praegu vaja kumbagi keelt osata. Masintõlkeprogrammi treenimiseks piisab universaalsest keelteülesest masintõlkemootorist ja treeningmaterjalist – hulgast asjakohaste keelte rööptekstidest. Milline on paras hulk? Olenevalt keelte keerukusest (nt muutevormide rohkusest jm parameetritest) on treenimiseks vaja sadu miljoneid sõnu. Sääraste süsteemide loomisest on kirjutanud Keeles ja Kirjanduses ladusalt Heiki-Jaan Kaalep ja Mare Koit.2
    Eesti-inglise keelepaari jaoks on kogutud saja miljoni sõnaga rööpkorpus. Paraku on see…
Sirp