TESTATUT TUOTTEET Google Translate Promt Translator SDL FreeTranslation Systranet Netti on kutistanut maailman, mutta se ei ole poistanut kieliongelmia. Päinvastoin, entistä useammin silmien eteen tulee jotain kiinnostavaa, joka on kirjoitettu oudolla kielellä. TEKSTI: MIRJA PAATERO KUVITUS: ERIC LERAILLEZ Konekäännöksestä Hankkisinko koreankielisen sähköpostiystävän niin, että hoidan kirjeenvaihdon webin automaattisten käännöspalvelujen kautta? Tuloksena voisi olla yllättäviä elämyksiä, jopa kaksi rinnakkaista todellisuutta yksi käännöksen kummallakin puolella. Mutta toisaalta: ilman käännöstä en pystyisi ollenkaan kommunikoimaan korealaisen ummikon kanssa. Testasimme ilmaisia käännöspalveluja, jotka eivät vaadi rekisteröitymistä. Palvelut kääntävät lyhyitä tekstejä sekä verkkosivuja. Haulla löytyy kääntimiä monelle muullekin kielelle kuin testatuissa palveluissa on. Suomi on harvinaisuus automaateissa, mutta käännös englantiin on useille suomalaisille ymmärrettävä. Miten automaatti toimii? Onko printer tulostin vai kirjanpainaja? Hyvä käännösautomaatti tietää, että palkkaa saava printer on ihminen ja sähköllä käyvä on laite. Sanojen kääntämiseen tarvitaan siis paljon muutakin tietoa kuin vastine sanakirjassa. Aihepiirin rajaus helpottaa: tietoteknisessä tekstissä puhutaan todennäköisesti tulostimesta. Mutta sanojen hallinta ei riitä. Konekäännöksessä on kolme vaihetta. Ensin lähtötekstin sanat ja rakenteet analysoidaan kieliopillisesti. Analyysiä voi maistella sivulla www.xrce.xerox.com/ competencies/content-analysis/demos/ finnish vaikkapa testilauseella Haavasta vuosi verta. Kääntimen pitäisi pystyä valitsemaan oikeat muoto- ja merkitysvaihtoehdot. Siihen tarvitaan tekstin sisällön analyysiä. Jos analyysissä ei selviä, kuka tekee ja mitä, käännös ei voi onnistua. Sitten lähtökielen rakenteet korvataan kohdekielen rakenteilla. Korvaussäännöstö on rakennettava erikseen kutakin kieliparia varten. Helpoimmin se käy sukulaiskielten välillä. Lopuksi muodostetaan kohdekieliset lauseet noudattaen tämän kielen sääntöjä. Hyvässä käännöksessä pitäisi ottaa huomioon laajemmatkin kokonaisuudet kuin yksi lause. Googlen käännin toimii toisin. Se ei piittaa sanastoista eikä kieliopista. Se luottaa puhtaasti arvaukseen, joka perustuu laajojen tekstimassojen tilastolliseen analyysiin ja erikielisten tekstiversioiden vertailuun. Se päättelee, että usein esiintyvät sanat ja ilmaukset ovat todennäköisesti oikeita käännöksiä. Mutta käännös voi mättää pahastikin, kun esimerkiksi suomen kieliopille viitataan kintaalla. Xeroxin sivuilla on palvelu, joka tunnistaa näytteestä, mikä kieli on kysymyksessä. Tunnistus vaikuttaa varsin pätevältä. www.xrce.xerox.com/competencies/contentanalysis/tools/guesser.en.html Myös Googlen käännössivu tunnistaa haluttaessa automaattisesti, mikä kieli on kyseessä. Fuzzums-niminen palvelu tunnisti vähän miten sattuu: sen mielestä viro on suomea, suomi on latviaa ja islanti on indonesiaa. Ammattilaisten apuvälineitä Ammattikäyttöisiä käännösjärjestelmiä opetetaan jatkuvasti: kielen ammattilaiset määrittelevät sääntöjä, joita käännös 30 MikroPC 5/2009
on hyötyä Vinkki noudattaa. Googlenkin käännintä opetetaan: käyttäjät voivat ehdottaa parempia käännöksiä. Kääntimissä voidaan yhdistää monenlaisia menetelmiä. Ainakin Systranin järjestelmä käyttää apuna tilastollista analyysiä, siis arvaustekniikkaa. Järjestelmiin voi sisältyä myös niin sanottu käännösmuisti, johon tallentuneita lauseita tai muita kokonaisuuksia hyödynnetään niiden toistuessa. EU on kääntämisen suurkuluttaja ja hyödyntää myös automaatteja. Euroopan suurkielillä onkin hyvä edustus automaateissa. Automaatit tuottavat raakakäännöksiä, jotka ihminen tarkistaa ja viimeistelee. Konekäännös on helpompi toteuttaa, jos se voidaan optimoida jotain rajattua tietyntyppistä aihepiiriä ja kielenkäyttöä varten. Yleiskäyttöistä konekäännössoftaa on vaikeampi toteuttaa, arvelee Jari Selenius, joka on Lionbridge Oy:n konekääntämisen asiantuntija. Käännösautomaatit eivät voi luultavasti koskaan olla aivan valmiita. Koska luonnolliset kielet kehittyvät ja muuntuvat, automaattejakin on kehitettävä jatkuvasti. Selenius tuumii, että parhaat tulokset saataisiin koneilla, jotka olisivat aidosti eläviä, lisääntyisivät suvullisesti ja kantaisivat sikiöitään noin yhdeksän kuukautta, minkä jälkeen uusi kone syntyisi yhtä avuttomana ja siis avoimena kasvatukselle ja ympäristön, siis kulttuurin, vaikutukselle kuin ihmislapsi. Testi tuotti käännöksiä ja käännöksiä Ilmaisten automaattien tuotoksia ei oikeastaan edes pitäisi nimittää käännöksiksi. Kuitenkin niistä on hyötyä monessa tilanteessa. Testitekstit oli poimittu nettisivuilta etsimättä erikoisen vaikeita tai erikoisen helppoja näytteitä. Pari lyhyttä näytekäännöstä eivät tietenkään kerro kaikkea palvelun kyvyistä toisentyppisen tekstin parissa. Tuloksista emme etsineet virheitä niitä on riittämiin. Sen sijaan vertailimme, onko käännös ymmärrettävissä. Ymmärrettävyys edellyttää, että sekä sanat että kieliopilliset rakenteet ovat sinne päin. Parhaissa käännöksissä jokseenkin jokaisen virkkeen olennainen sisältö välittyi oikein. Parhaiten tuntuvat toimivan Euroopan suurten kielten väliset käännökset. Käännöskonetta voi käyttää kirjoitusapuna pieneen tarpeeseen. Jos osaat vaikkapa venäjää tai kiinaa, mutta näppäilytaito ja teksturin kielituki puuttuu, saat kuitenkin sanoja paperille poimimalla niitä automaatin käännöstuloksesta. Kiina ja japani olivat haasteellisempia. Joukosta poikkesi Google, joka joskus onnistuu ja joskus sotkee asiat perinpohjin. Jos osaat kieltä vajavaisesti, tekstin merkitys tarkentuu automaatin avulla nopeammin kuin etsimällä sanoja yksitellen sanakirjapalvelusta. Eksoottisessa verkkokaupassakin on mukavampi asioida, kun on käännös tukena. Käännös tulee parilla klikkauksella ja useimmiten vailla viivettä, hitaimmillaankin muutamassa sekunnissa. Osa palveluista tarjoaa sähköpostin tai kokonaisten dokumenttien kääntämistä. Näitä ei testattu, koska valvomattomia käännöksiä ei voi suositella. Samasta syystä ei juuri testattu käännöstä tutuista outoihin kieliin päin. MikroPC 5/2009 31
01 Google Translate translate.google.com, translate.google.fi Google Translate näyttää verkkosivun tekstin alkukielellä, kun hiirtä lepuuttaa tekstin päällä. + paljon kieliä, mukana suomi - epäluotettava käännöstulos Google Translate albania korea slovakia arabia kreikka slovenia bulgaria kroatia suomi englanti latvia tagalog espanja liettua tanska galicia malta thai heprea norja tsekki hindi portugali turkki hollanti puola ukraina indonesia ranska unkari italia romania venäjä japani ruotsi vietnam katalaani saksa viro kiina serbia Lähde- ja kohdekielen voi valita 41 kielen joukosta vapaasti, mutta useimmiten käännöksissä on välikielenä englanti. LÄHDE- JA KOHDEKIELEN voi valita vapaasti mittavasta valikoimasta, mutta käännökset koukkaavat englannin kautta, jopa ruotsista norjaan käännettäessä. Siksi on parempi tyytyä englanninnoksiin aina kun mahdollista. Testissä vain suomen ja viron väliset käännökset menivät suoraan. Tilastollinen arvausmenetelmä voi tuottaa siistejä tuloksia käännettäessä esimerkiksi verkkokaupan sivuja, mutta tekstissä merkitykset kääntyvät jopa vastakohdikseen. Jos käännettäväksi antaa yksittäisen sanan, kaikki sanakirjamerkitykset tulevat näkyviin. Käännettävän tekstin pituudelle ei ole ilmoitettu ylärajaa, mutta kymmenientuhansien merkkien teksti on jo kömpelö käsitellä. Käyttöliittymä on myös suomeksi. Palvelulla on beetaversion status. 02 Promt www.promt.com Promtin virtuaalinäppäimistö on kätevä, mutta sillä voi lisätä merkkejä vain käännettävän tekstin loppuun. Valituista kielistä riippuen käytettävissä on erikoissanastoja. Promt Kohdekieli englanti venäjä espanja, ranska, saksa italia portugali englanti - kyllä kyllä ei kyllä venäjä kyllä - kyllä ei ei espanja, ranska, kyllä kyllä kyllä ei ei saksa italia kyllä kyllä ei - ei portugali kyllä ei ei ei - Huomaa, että Promt ei käännä italiaan päin. VENÄLÄINEN PROMT yllätti. Etenkin venäjä ja saksa tuntuvat olevan hallinnassa. Riippuen valituista kielistä ja käännössuunnasta käyttöön voi valita jonkin erikoisalan sanaston. Käännin on siis kehitetty kaupallisiin sovelluksiin. Advanced mode -valinnan takana on hyviä apuvälineitä. Valitulle sanalle voi katsoa kattavat sanakirjakäännökset. Esiin voi ottaa valitun kielen mukaisen virtuaalinäppäimistön. Verkkosivun käännös tulee omaan ikkunaansa Promtin sivulle, joten sivua joutuu vierittelemään. Kun hiirtä lepuuttaa tekstin päällä, alkuperäinen teksti tulee kuplaan näkyviin. Palvelun käynnistys hämää: oli kohteeksi valittu mikä kieli tahansa, ruutuun tulee venäjän käännös. Nyt vasta ollaan varsinaisella käännössivulla, ja se toimiikin sujuvasti. Rekisteröitynyut käyttäjä pääsee kääntämään laajempia tekstejä. + eri kielten virtuaalinäppäimistöt - kielivalikoima ei kovin laaja 32 MikroPC 5/2009
03 Systranet www.systranet.com SYSTRANETIA KANNATTAA kokeilla ensimmäiseksi, kun jotain pitäisi kääntää. Yrityksen ammattimainen ote ryhdistää ilmaiskäännintäkin. Esiin voi ottaa kätevän valikoiman tarkekirjaimia ja muita erikoismerkkejä, jos kirjoittaa käännettävää tekstiä suoraan käännöskenttään. Sanakirjatoiminto on omalla välilehdellään. Ulottuvilla on Systranin omien sanakirjojen lisäksi erinomainen ranskan Larousse. Web-käännin hidastelee hitusen. Sivujen asettelu särkyi jonkin verran. Käännetty sivu aukeaa uuteen ikkunaan, ja alkuperäisen sivun saa helposti esille. Ilmaisen rekisteröinnin takana on muun muassa dokumenttien kääntö, oman sanaston kartuttaminen ja käännettävän tekstin pituuden kasvatus 10 000 merkkiin. Systranin kääntimen käyttöliittymä on selkeä: alkuteksti ja käännös vierekkäin, ja kielet valitaan valikosta. Webin kääntäminen ja sanakirja ovat omilla välilehdillään. + parhaat käännökset - web-käännös tahmaa hiukan Systranet Kohdekieli englanti ranska espanja, italia, hollanti, arabia, japani, kiina, korea, portugali, saksa kreikka puola, ruotsi, venäjä englanti - kyllä kyllä kyllä kyllä ranska kyllä - kyllä kyllä ei espanja, italia, kyllä kyllä kyllä ei ei portugali, saksa hollanti, kreikka kyllä kyllä ei ei ei arabia, japani, kiina, korea, puola, ruotsi, venäjä kyllä ei ei ei ei 04 SDL www.freetranslation.com SDL Kohdekieli englanti espanja, hollanti, italia, japani, portugali, saksa, ranska, venäjä kiina, norja englanti - kyllä kyllä espanja, hollanti, kyllä ei ei italia, japani, portugali, saksa, ranska, venäjä kiina, norja ei ei ei Kaikki käännökset ovat englannista tai englantiin. Kiina ja norja ovat vain kohdekielinä. SDL:n käännösikkunassa on pikku valikot, joista on helppo poimia tekstiin eri kielissä tarvittavia merkkejä. Samantapainen toiminto on myös Systranetissa. + kauttaaltaan kohtalainen suoritus - ei tarjoa ekstroja TÄMÄNKIN PALVELUN taustalla on kaupallinen järjestelmä, ja käännökset ovatkin tolkullisia. Kaikissa kännöksissä joko lähde- tai kohdekieli on englanti. Lähtötekstissä voi merkitä erisnimet ja muut sanat, joita ei pidä kääntää. Web-sivujen käännös pitää sivut kohtalaisen siistinä, mutta käännetyltä sivulta avattavat uudet sivut ovat alkukielisiä. Käännössivulla on helppo antaa uuden käännettävän sivun url-osoite. 10 dollarin vuosimaksusta on tarjolla muun muassa erikoissanastot ja pitempien tekstien kääntäminen. MikroPC 5/2009 33
Ilmaiset käännöspalvelut Google Translate Promt Translator SDL FreeTranslation Systran Systranet Www translate.google.com www.promt.com www.systranet.com www.freetranslation.com Kieliä 41 7 11 15 Tekstin pituusraja ei ilmoitettu 3000 merkkiä 750 sanaa 3000 merkkiä Sanakirjatoiminto on on, hyvä ei on, hyvä Web-sivun käännös on on on on Muuta myös suomeksi virtuaalinäppäimistöt tarkkeiden kirjoitusapu tarkkeiden kirjoitusapu Käännösnäytteitä Tässä on muutamia käännöksiä ilman alkutekstejä, jotta voit arvioida ymmärrettävyyttä käännösten varassa. MikroPC.netissä on alkutekstit sekä vähän laajemmat näytteet. Siellä on myös muiden kielten käännöksiä. Käännös ranskasta Teksti liittyy taidemuseon näyttelyyn. Se käännettiin myös kotimaisiin kieliin niillä kääntäjillä, jotka siihen pystyvät. Vertaile, mistä kielestä ymmärrät sisällön parhaiten. Google englantiin Emil Nolde, celebrated throughout the world, has received no major retrospective in France. This ambitious exhibition pays tribute to this great figure of modern art by bringing together over 90 paintings and 70 engravings, watercolors and drawings. Google suomeen Emil Nolde, jota vietetään kaikkialla maailmassa, ei ole saanut merkittäviä Retrospektiivinen Ranskassa. Tämä kunnianhimoinen näyttely kunnioittaa tätä suurta lukua nykytaiteen tuomalla yhteen yli 90 maalaukset ja 70 kaiverrukset, vesiväri-ja piirustukset. Google ruotsiin Emil Nolde, firas över hela världen, har fått några större retrospektiv i Frankrike. Detta ambitiösa utställningen hyllar denna stora siffra för modern konst genom att samla över 90 målningar och 70 gravyrer, watercolors och teckningar. Systranet englantiin Emil Nolde, celebrated in the whole world, still profited from no major retrospective in France. This ambitious exposure pays homage to this great figure of the modern art while gathering more than 90 fabrics and 70 engravings, watercolours and drawings. Systranet ruotsiin Emil Nolde som firades i den hela världen, stillbilden gagnade från inget ha som huvudämne retrospektiv i Frankrike. Denna ambitiösa exponeringslönvördnad till denna store figurerar av modern konststunderna som samlar mer än 90 tyger och 70 gravyrer, akvareller och teckningar. Mitä pienempi kielialue, sen heikommat käännökset. Googlen ruotsinnoksessa ensimmäisen lauseen merkitys on kääntynyt päinvastaiseksi. Joukossa oleva englannin sana vahvistaa, että teksti on kääntynyt välikielen kautta. Systranin ruotsinnos puutteineenkin on paljon parempi kuin Googlen. Käännös saksasta Ote saksalaisen verkkokaupan ehdoista englantiin käännettynä. Google The purchase is completed when the seller of the acceptance of the order within 2 weeks or deliver the goods ordered. Promt The bill of sale is concluded if the shop assistant confirms the acceptance of the order within 2 weeks or delivers the ordered product. SDL The purchase contract is locked if the salesman confirms the acceptance of the order within 2 weeks or delivers the ordered good. Systranet The sales contract is final, if the salesman confirms the acceptance of the order within 2 weeks or delivers the ordered commodity. Käännös japanista Mikään versio ei tee kovin selväksi kesäseminaarin tarkoitusta. Muistakin aasialaisista kielistä tuli takkuisia käännöksiä. SDL:n käännöksen alussa oli huomautus subjektin puuttumisesta japaniksi. Google And training to improve network capacity among teachers and Japanese teachers of Japanese professors Europe. SDL The improvement of the network between the Japanese professor power and teacher of the Japanese teacher of Europe I give a/the training to a/the purpose. Systranet The Japanese professor power of teacher European Japanese and improvement of network between the teachers you study in purpose. Näin saatat onnistua TÄRKEÄT TEKSTIT pitää ehdottomasti käännättää kunnon kääntäjällä. Ihmisten tekemiäkin käännöksiä voi tilata netin kautta. Kannattaa etsiä samoilta sivustoilta, joilla on automaattikääntimiä. Kun pitäisi saada selvä tekstistä: Suhtaudu automaattikäännökseen terveen epäluuloisesti. Tärkeät asiat tulee tarkistaa jollakin tavalla. Suomi on automaateille vaikea. Jos mahdollista, käännä outo kieli jollekin maailmankielelle, jota ymmärrät. Pyri käyttämään sellaista palvelua ja kieliparia, että eri käännökset eivät ketjutu. Tulos thai > englanti on parempi kuin thai > englanti > suomi. Kääntimiä kannattaa käyttää valmistajan omilta sivuilta, jotta käsillä on tuorein versio. Jos yksi käännin ei tee tolkullista käännöstä, on helppo ottaa toinen palvelu tueksi. Tulokset täydentävät toisiaan. Jos oma tekstisi menee automaatin käännettäväksi: Kirjoita selkokieltä: lyhyitä selkeitä lauseita, ei kuvailmauksia, ei erikoisia sananvalintoja. Oikolue huolellisesti. Kone on tyhmä. Älä käännä tekstiä automaatilla suomesta vieraalle kielelle lähettääksesi sen vieraskieliselle ihmiselle. Automaatin käyttö jääköön vastaanottajan vastuulle. Kun käännät tekstisi vielä takaisin oudosta kielestä, saat hiukan vihjettä käännöksen tasosta. Jos takaisinkäännös on puuroa, alkuperäinen käännös on luultavasti spagettia. 34 MikroPC 5/2009