SOKEA IDIOOTTI KONEKÄÄNTÄMISEN ONGELMIA JA MAHDOLLISUUKSIA



Samankaltaiset tiedostot
Konekäännös: mitä sillä tehdään?

Ammattimaista viestintää. Ruotsin asiatekstinkääntäjien liitto

Alkukartoitus Opiskeluvalmiudet

Kielen ymmärtäminen kieliteknologian näkökulmasta. Kimmo Koskenniemi täysinpalvellut kieliteknologian professori Helsingin yliopisto

Suomen kielen Osaamispyörä -työkalu

Tavoite Opiskelija osaa käyttää englannin kielen rakenteita, hallitsee kielen perusilmaukset ja ymmärtää opiskelijan arkielämään liittyvää kieltä

3. Ryhdy kirjoittamaan ja anna kaiken tulla paperille. Vääriä vastauksia ei ole.

E-kirjan kirjoittaminen

Käyttöliittymä. Ihmisen ja tuotteen välinen rajapinta. ei rajoitu pelkästään tietokoneisiin

Finnish ONL attainment descriptors

SUOMI L3-KIELEN OSAAMISTASON KUVAUKSET yläkoulu ja lukio

Yhdyssana suomen kielessä ja puheessa

SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.

Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto

Pisteytysohje loppuraporttien vertaisarviointiin

4. Lausekielinen ohjelmointi 4.1

Englanti. 3. luokan keskeiset tavoitteet

Kiipulan ammattiopisto. Liiketalous ja tietojenkäsittely. Erja Saarinen

Politiikka-asiakirjojen retoriikan ja diskurssien analyysi

Kielten oppiminen ja muuttuva maailma

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

Ohjelmoinnin perusteet, syksy 2006

MONIKULTTUURISEN OPETUKSEN JA OHJAUKSEN HAASTEET. Selkokielen käyttö opetuksessa. Suvi Lehto-Lavikainen, Koulutuskeskus Salpaus

Reaaliaineiden ja äidinkielen työpaja

Heikosta vastauksesta puuttuvat konkreettiset faktat, mikä näkyy esimerkiksi

Kääntämisen sisäkkäiset etenevät ympyrät

Tutkintojen, oppimäärien ja muiden osaamiskokonaisuuksien sijoittuminen vaativuustasoille

Meidän visiomme......sinun tulevaisuutesi

Tieteellisen artikkelin kirjoittaminen ja julkaiseminen

7.LUOKKA. Tavoitteisiin liittyvät sisältöalueet. Laaja-alainen osaaminen. Opetuksen tavoitteet

83450 Internetin verkkotekniikat, kevät 2002 Tutkielma <Aihe>

Kieliohjelma Atalan koulussa

Mitä taitoja tarvitaan tekstin ymmärtämisessä? -teorian kautta arkeen, A.Laaksonen

PIENI KAMPANJAKOULU. Ohjeita onnistuneen kampanjan toteuttamiseen 1 PIENI KAMPANJAKOULU

Koulussamme opetetaan näppäilytaitoa seuraavan oppiaineen yhteydessä:

Kulttuuritaidot Oppilas oppii tuntemaan Ranskaa ja ranskankielisiä alueita ranskankielisille kulttuureille ominaisia tapoja ja kohteliaisuussääntöjä

Selkokeskus Selkoa selkokielestä Kuka sitä tarvitsee? Mitä se on?

Monikielisen viestinnän ja käännöstieteen syventävien opintojen vastaavuustaulukko

Kerta 2. Kerta 2 Kerta 3 Kerta 4 Kerta Toteuta Pythonilla seuraava ohjelma:

Yleistä tarinointia gradusta

Pia Hägglund, Pohjanmaan tulkkikeskus. Monikulttuurisuus ja perehdyttäminen

Kuinka laadin tutkimussuunnitelman? Ari Hirvonen I NÄKÖKULMIA II HAKUILMOITUS

Euroopan unioni ja monikielisyys Verkkojen Eurooppa Automaattinen käännösalusta. Kimmo Rossi European Commission, CNECT.G3

Systemointiosamäärä. Nimi: ********************************************************************************

ÄIDINKIELEN TEKSTITAIDON KOE

Humanistiset tieteet

Kuka on arvokas? Liite: EE2015_kuka on arvokas_tulosteet.pdf tulosta oppilaiden lomakkeet tehtäviin 1 ja 2.

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Kuvattu ja tulkittu kokemus. Kokemuksen tutkimus -seminaari, Oulu VTL Satu Liimakka, Helsingin yliopisto

Saa mitä haluat -valmennus

ELM GROUP 04. Teemu Laakso Henrik Talarmo

Käännösten ostajan opas

Miten lokalisointityö kohtaa kielen normatiivisuuden?

Osaava henkilöstö kotouttaa kulttuurien välisen osaamisen arviointi. Työpaja Hämeenlinna

4. Lausekielinen ohjelmointi 4.1

RANSKAN KIELI B2 RANSKAN KIELI B2 8 LUOKKA

Vinkkejä kirjoittamiseen. Kultaiset säännöt:

Oppilas keskustelee ryhmässä ja tuo esille mielipiteitään. Oppilas osallistuu luokan ja koulun ilmaisuesityksiin. Oppilas harjoittelee

Automaattinen semanttinen annotointi

Kieli-, käännös- ja kirjallisuustieteiden yksikkö

LUKUVUOSITODISTUKSEN ARVIOINTILAUSEET VUOSILUOKILLE 1 4

Käännösstrategioiden rajoilla. maltillisuus vastaan uudistavuus

10 yleistä hakukoneoptimointivirhettä

LUONNOLLISTEN KIELTEN KÄÄNTÄMINEN JA KONEKÄÄNNÖS. Taustaa, teoriaa ja menetelmiä

Näkökulmia ja haasteita Venäjäliiketoimintaympäristössä. Живи и учись. Век живи - век учись

-miksi lause 'ensimmäisenä aloittaneet tienaavat kaiken rahan' ei pidä paikkaansa?

Kielellisen datan käsittely ja analyysi tutkimuksessa

Berlitzin taitotaso 1 CEF-taso A 1

Testaus ja säästöt: Ajatuksia testauksen selviämisestä lama-aikana

T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä

HALLITUKSEN ESITYS LIITON KIELISTRATEGIAKSI

Kiinan kursseilla 1 2 painotetaan suullista kielitaitoa ja kurssista 3 alkaen lisätään vähitellen myös merkkien lukemista ja kirjoittamista.

PUHU MINULLE KUUNTELE MINUA

Kielet sähköistävät. Mitä muutoksia perusopetuksen opetussuunnitelmaprosessi on tuomassa kieliin? Opetusneuvos Anna-Kaisa Mustaparta

Laadullinen tutkimus. KTT Riku Oksman

Yhteentoimivuusvälineistö

Käännösten ostajan opas

Tietotekniikan valintakoe

Hyvän salasanan tunnusmerkit Hyökkääjästä salasanan pitää näyttää satunnaiselta merkkijonolta. Hyvän salasanan luominen: Luo mahdollisimman pitkä

Pilviratkaisut ovat entistä suositumpia. Mutta mikä on oikea ratkaisu sinun maailmassasi? Lähde matkalle läpi avaruuden, ajaan ja maalaisjärjen

Tehyn. avain- sanat. päättäjille

Nimeni on. Tänään on (pvm). Kellonaika. Haastateltavana on. Haastattelu tapahtuu VSSHP:n lasten ja nuorten oikeuspsykiatrian tutkimusyksikössä.

Uudet kielten opetussuunnitelmat käytäntöön :

YHDISTYKSEN VIESTINTÄ

Workshop Palveluiden ideointi ja kehittäminen Miia Lammi Muotoilukeskus MUOVA. Ohjelma. Luovuuden ainekset. Odotukset.

Kerro kuvin 3:n uudet ominaisuudet

Opas koulujen VALO-hankintaan. Elias Aarnio Avoimet verkostot oppimiseen -hanke Educoss Innopark Oy

JYVÄSKYLÄN YLIOPISTO. Tarja Nikula Soveltavan kielentutkimuksen keskus. kehittämisverkosto

Arkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14

KUN LUKEMINEN ON HANKALAA. Helena Sorsa

1 Määrittelyjä ja aputuloksia

TEKOÄLY JA TIETOISET KONEET

Kieli ja työelämä Marjut Johansson & Riitta Pyykkö

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Oppilas esittää ajatuksiaan ja ilmaisee mielipiteensä parille tai ryhmälle. Oppilas osaa kuunnella toisia.

Hyvästä paras. Miksi jotkut yritykset menestyvät ja toiset eivät?

Lapsen tyypillinen kehitys. -kommunikaatio -kielellinen kehitys

1) Kirjoittamisen aiheen tai näkökulman on tunnuttava tuoreelta, maistuttava uudelta.

Transkriptio:

SOKEA IDIOOTTI KONEKÄÄNTÄMISEN ONGELMIA JA MAHDOLLISUUKSIA Anni Malmivaara Tampereen yliopisto Kieli ja käännöstieteiden laitos Käännöstiede (saksa) Pro gardu -tutkielma Toukokuu 2007

Tampereen yliopisto Käännöstiede (saksa) Kieli- ja käännöstieteiden laitos MALMIVAARA, Anni: Sokea idiootti Konekääntämisen ongelmia ja mahdollisuuksia Pro gradu -tutkielma, 72 sivua + liitteet (3 kpl) + saksankielinen lyhennelmä, 13 sivua. Toukokuu 2007 Tässä tutkielmassa tarkastellaan konekääntämisen mahdollisuuksia ja ongelmia. Konekääntämisestä on sen alkuajoista, siis noin 1950-luvulta, lähtien povattu tulevaisuuden suurta menestystä, joka korvaa ihmiskääntäjät täysin. Kuitenkin on osoittautunut, että luonnolliselta kielelle toiselle kääntävää ohjelmaa on käytännössä hyvin vaikea toteuttaa. Kääntäminen on ihmisellekin hankalaa; se vaatii kahden tai useamman kielen erinomaista osaamista sekä laajaa kulttuurien tuntemusta. Ihmisen käyttämä kieli on monimutkaista ja välillä monitulkintaista. Kone ei ymmärrä kieltä, saatikka että se osaisi kääntää toiselle kielelle. Konekäännökset sisältävät usein vääriä käännöksiä, sanajärjestysvirheitä sekä kääntämättä jääneitä sanoja. Koneelle on lähes mahdotonta syöttää monitulkintaisia sanoja, kaikkien sanojen eri taivutusmuotoja ja synonyymejä. Elektroniset sanakirjat paisuisivat järjettömän suuriksi, mikä johtaisi hitaampiin käännösohjelmistoihin. Tutkin konekääntämisen erilaisia menetelmiä ja taustoja. Pohdin myös, mihin konekäännöksiä voidaan käyttää laatuongelmista huolimatta. Konekääntämisen tutkijat ovat perustelleet, että konekääntäminen on erinomainen tapa selvittää vieraalla kielellä kirjoitetun tekstin sisältö. Asiantuntijalle usein riittää, että tekstin ydinasiat tulevat selviksi, vaikka sanajärjestys- tai kielioppivirheet estäisivätkin tekstin julkaisemisen sellaisenaan. Konekäännöksiä käytetään yleisesti esimerkiksi Euroopan komission käännöspalvelussa nopeuttamaan ihmiskääntäjien työtä. Vieraskielisestä tekstistä tehdään ensin konekäännös, jonka pohjalta ihminen muokkaa julkaisukelpoisen tekstin. Joskus virkamiehet teettävät konekäännöksiä itselleen, saadakseen selville mitä teksti käsittelee. Internetissä on tarjolla kaupallisia konekäännösohjelmia, joista osa tarjoaa käännöksiä ilmaiseksi. Tutkimuksessani käänsin kolme erilaista teknisen alan tekstiä Babel Fish -nimisellä ohjelmalla tarkoituksenani selvittää konekäännösten laatua. Tulokseni ei ollut yllättävä, vaan päinvastoin tuki ennakkokäsitystä siitä, että nykyiset konekäännösohjelmat eivät sovellu kääntämiseen sellaisenaan. Koneen tekemät käännökset täytyy ihmisen toimesta muokata jälkikäteen. Konekäännökset sisälsivät paljon vääriä sanajärjestyksiä, kääntämättä jääneitä sanoja sekä kielioppivirheitä. Avainsanat: konekääntäminen, konekäännös, ihmiskääntäjä, luonnollinen kieli

1. JOHDANTO...5 2. KÄÄNTÄJÄN TOIMENKUVA...8 3. KONEKÄÄNTÄMINEN...11 3.1 HISTORIAA... 11 3.2 KONEKÄÄNTÄMISEN PERUSMENETELMÄT... 12 3.3 AUSTERMÜHLIN JAOTTELU... 14 3.4 BERGENIN (BOWKERIN) JAOTTELU... 15 3.5 ELEKTRONISET SANAKIRJAT OSANA KÄÄNNÖSOHJELMAA... 16 4. MIKSI KONEKÄÄNTÄMISTÄ?...19 4.1 LIIKAA KÄÄNNETTÄVIÄ TEKSTEJÄ... 20 4.2 TEKNISET TEKSTIT OVAT TYLSIÄ... 21 4.3 TERMINOLOGIAN YHDENMUKAISUUS... 22 4.4 PIDEMPIÄ TEKSTEJÄ NOPEAMMIN... 22 4.5 HUIPPULAATUA EI AINA TARVITA... 23 4.6 YRITYKSET HALUAVAT LASKEA KÄÄNNÖSTEN KUSTANNUKSIA... 24 5. KONEKÄÄNTÄMISEN MENETELMIÄ...25 5.1 SUORA KÄÄNTÄMINEN... 25 5.2 SIIRTOMENETELMÄ... 25 5.3 INTERLINGVAALINEN MENETELMÄ... 26 5.4 KÄÄNNÖSÄLY... 26 5.5 ONGELMIA... 27 6. KONEKÄÄNNÖKSEN KÄÄNNÖSPROSESSI...29 6.1 LÄHTÖTEKSTIN EDITOINTI... 29 6.2 LÄHTÖTEKSTIN ANALYYSI... 30 6.2.1 Morfologinen analyysi...31 6.2.2 Syntaktinen analyysi...32 6.2.3 Semanttinen analyysi...32 6.3 KÄÄNNÖSSTRATEGIAN VALINTA... 33 6.4 INTERAKTIIVISET VAIHEET... 34 6.5 KÄÄNNÖKSEN JÄLKIEDITOINTI... 36 7. LUONNOLLINEN KIELI JA SEN YMMÄRTÄMISEN ONGELMA...38 7.1 KIELEN SUHDE AJATTELUUN JA TODELLISUUDEN HAHMOTTAMISEEN... 39 7.2 MONISELITTEISET ILMAUKSET... 40 7.2.1 Homonymia...40 7.2.2 Polysemia...41 7.3 KIELEN RAKENTEELLISET ONGELMAT... 42 7.4 VERTAUSKUVALLINEN KIELENKÄYTTÖ... 43 7.5 KIELEN VIITTAUSSUHTEET... 44 8. KONEKÄÄNNÖSOHJELMIA...46 8.1 EUROTRA... 47 8.2 SYSTRAN... 47 8.3 KAUPALLISET KÄÄNNÖSOHJELMAT... 48 3

9. BABEL FISH...49 9.1 AINEISTON JA TUTKIMUSMENETELMÄN ESITTELY... 50 9.2 AINEISTO 1... 51 9.3 AINEISTO 2... 56 9.4 AINEISTO 3... 61 10. BABEL FISH -KÄÄNNÖSTEN ANALYYSIN YHTEENVETO...68 11. KONEKÄÄNTÄMISEN TULEVAISUUS...70 LÄHDELUETTELO...71 LIITTEET...75 DEUTSCHE KURZFASSUNG 4

1. Johdanto Maallikoilla tuntuu olevan yleisesti käsitys, että käännösala on täysin automatisoitu. Kun käännöstoimistolta pyydetään 24 000 sanan käännös huomiseksi, on kysyjä yllättynyt, kun vastaus on Ei onnistu. Tällöin maallikko kysyy huolestuneena: Kai teillä siellä jotkut käännöskoneet on? Todellisuus on kuitenkin vielä kaukana tästä. Tämänhetkiset käännöskoneet eivät hallitse kieltä eivätkä kääntämistä niin sujuvasti, että ne voisivat täysin korvata ihmisen. Toki raakakäännöksiä voidaan tehdä koneilla, ja toki kääntäjät ja muutkin tekstinkäsittelijät saattavat käyttää konekäännöksiä apunaan luodessaan uusia tekstejä. Mutta siihen se useimmiten jää. Tällä hetkellä ei ole olemassa niin kehittynyttä konekäännösohjelmaa, että esimerkiksi 24 000 sanan käännöksen tekeminen onnistuisi ilman ihmisen puuttumista käännösprosessiin tai ihmisen tekemää käännöksen viimeistelyä. Kääntäminen on monimutkainen prosessi, joka vaatii inhimillistä älykkyyttä, kykyä metaajatteluun sekä luovuutta. Tässä tutkielmassa tarkastelen konekääntämistä, sen menetelmiä, historiaa, ongelmia ja mahdollisuuksia. Muun muassa Jorma Tommola (2004: 9) on kirjoittanut, että edes kahden kielen sujuva osaaminen ei välttämättä tarkoita sujuvaa kääntämistä. Kääntäminen ei ole pelkästään sanojen kääntämistä toiselle kielelle, vaan on otettava huomioon monia seikkoja, jotta käännös olisi samalla tavalla ymmärrettävä kuin lähtöteksti. Konekääntäminen on periaatteeltaan yksinkertaista: Lähtötekstin sanat muutetaan kohdekielisiksi, ja koneelle syötetyn kieliopin avulla käännöksestä tulee ymmärrettävää kieltä. Jokaisella asiaan perehtyneellä tuntuu olevan mielipide joko puolesta tai vastaan. John Hutchins (2005: 5 6) perustelee kantaansa konekäännösten puolesta kuudella argumentilla: 1. Käännettäviä tekstejä on liikaa 2. Ne ovat liian tylsiä ihmiskääntäjille 3. Koneen on helpompi pysytellä orjallisesti yhdenmukaisessa sanastossa 4. Kone on nopeampi kuin ihminen 5. Huippulaatu ei ole aina tarpeen

6. Koneen edulliset kustannukset verrattuna ihmiskääntäjään. Konekäännösohjelman tärkein osa on sen sanakirja. Sanakirjat ovat usein puutteellisia, koska kaikkia kielen sanojen kaikkia muotoja on mahdoton listata. Nämä puutteet näkyvät konekäännöksissä kääntämättä jääneinä sanoina ja väärinä käännösvastineina. Ihminen ymmärtää, että menen on taivutusmuoto verbistä mennä, mutta kone ei tällaista päätelmää osaa automaattisesti tehdä. Ihminen osaa myös tehdä lähtötekstianalyysia ja harkita erilaisia käännösmenetelmiä, mutta koneella ei ole muuta mahdollisuutta kuin valita ne menetelmät, jotka sille on syötetty. Luonnollinen kieli on osa ihmistä. Sen opettaminen koneelle on mahdotonta, sillä kielen ymmärtäminen ei rakennu pelkästään yksittäisten sanojen ymmärtämiseen tai kieliopin analysoinnin varaan, vaan sanojen ja ilmausten tulkinta edellyttää monipuolista sanojen välisten merkityssuhteiden ja myös epäsuorien merkitysten ymmärtämistä. Kielen ymmärtäminen edellyttää myös paljon kielenulkoista käytännön tietoa ympäröivästä yhteiskunnasta. Koneelle tuottaa suuria ongelmia käsitellä esimerkiksi moniselitteisiä ilmaisuja, kielen viittaussuhteita sekä eri kielten kieliopillisia rakenteita. Konekääntäminen on myös teknisesti vielä haasteellista. Insinöörit eivät ole onnistuneet kehittelemään ohjelmaa, joka osaisi tuottaa muuta kuin kömpelöä ja epäluontevaa kieltä. Erikoisalojen kääntäminen saattaa onnistua paremmin, mutta mitä yleisemmällä tasolla kieli on, sitä vaikeampaa koneen on kääntää sitä toiselle kielelle. Markkinoilla on kuitenkin saatavilla kohtuullisen hyviä konekäännösohjelmia, joita esimerkiksi eri viranomaiset käyttävät raakakäännösten tekemiseen. Kehitteillä on myös niin kutsuttu käännösäly. Käännösäly perustuu tekoälytutkimukseen, ja sitä pidetään käännösmuistiohjelmien seuraavan sukupolven edustajana. Tutkielman lopussa esittelen oman tutkimusaineistoni ja -tulokset. Käänsin kolme erilaista teknistä tekstiä Internetissä ilmaiseksi saatavilla olevalla Babel Fish -käännösohjelmalla. Tulokset eivät yllättäneet, vaan pikemminkin tukivat ajatusta siitä, että kaupalliset 6

konekäännösohjelmat tuottavat ainoastaan kelvotonta materiaalia. Konekäännökset vilisivät vääriä sanajärjestyksiä, kieliopillisesti virheellisiä lauseita sekä kääntämättä jääneitä sanoja. Parempi tietysti olisi ollut, jos olisin voinut tutkia aineiston jollain vakavasti otettavalla ohjelmalla, mutta sellaista mahdollisuutta ei käytännössä valitettavasti ollut. Uskon, että laadukas käännösohjelma olisi osannut kääntää tekstit paremmin, jopa ymmärrettävään, joskaan ei välttämättä julkaisukelpoiseen muotoon. Tämä on kuitenkin vain tuntumaa, eikä perustu tutkimustuloksiin. 7

2. Kääntäjän toimenkuva Kääntäminen ei ole yksinkertainen asia, eikä sitä voida kuvailla yksinkertaisesti. Vaikka osaisi kieliä sujuvasti, ei ole itsestään selvää, että osaa kääntää sujuvasti. Kääntäminen on vaikeaa ihmisellekin: pitää osata kahta tai useampaa kieltä todella hyvin ja osata tuottaa hyvää tekstiä. Sellainenkaan kaksikielisyys, joka riittää päivittäisten asioiden hoitamiseen välttävästi tai jopa erinomaisesti, ei automaattisesti tarkoita sitä, että osaa kääntää sujuvasti. Kääntäminen ei ole tavanomaista kielenkäyttöä. Jorma Tommolan (2004: 9) mukaan se vaatii erityisvalmiuksia ja tekniikoita, jotka eivät luonnostaan seuraa kielitaidosta. Ne vaativat kulttuurien, erilaisten elämänalojen ja aihepiirien tavanomaista syvempää tuntemusta. Kääntäjältä vaaditaan kykyä analysoida, arvioida ja kehittää omaa suoritustaan. Tämän lisäksi yhteiskunnan globalisaatiosta johtuen monissa prosesseissa jo suorastaan vaaditaan monikielisyyttä. Kääntämisestä tulee entistä vaativampi asiantuntijatehtävä. (Mts.) Kääntäjän tärkein työkalu on oma äidinkieli. Käännöstieteen piirissä ajatellaan yleisesti, että kääntäjän pitäisi kääntää vain omalle äidinkielelleen, koska siitä ja sen kulttuurista hänellä on kattavimmat tiedot. Kuten Ulla Palomäki (2004: 21) kirjoittaa: Kääntäjän ammattitaidon tärkeä mittari on juuri äidinkielinen kohdeteksti ja äidinkielen taito. Kääntäjän on hallittava äidinkielensä kattavasti: normitettu yleiskieli ja sen rakenne oikeakielisyys- ja oikeinkirjoitusvaatimuksineen sekä välimerkkien käyttö, eri tyylilajit, sanontatavat, idiomit, kielen vaihtelut tilanteesta toiseen eli rekisterit, murteet ja niin edelleen. (Mts.) Myös lähtökielestä tulisi olla erittäin hyvät tiedot, jotta merkitysten siirtäminen toiselle kielelle onnistuu. Useimmiten kyseessä ei ole vain kieleltä toiselle kääntäminen, vaan kielen vaihtuessa vaihtuu myös kulttuuri. Tarkan käännöksen tekemiseksi pitää tietää konteksti ja tuntea sekä lähtö- että kohdekielen rakenteet ja säännöt. On osattava verrata lähtökulttuuria kohdekulttuuriin. Kääntäminen ei voi tapahtua muuttamalla konemaisesti lähtökielen sanoja suoraan kohdekielisiksi, vaan käännettäessä on otettava huomioon monia seikkoja. Kääntämisessä korostetaan merkityksen siirtämisen ensisijaisuutta. Minna Häyrysen (1992: 4 5) mukaan vaikeimpana ongelmana voidaan pitää lähtökielen ilmauksen merkityksen siirtämistä 8

mahdollisimman samanlaisena toiseen kielijärjestelmään. Keskeisenä ongelmana voidaan myös pitää ekvivalenssin eli vastaavuuden sekä vertailukriteerien ongelmaa. Sågvall Hein (2004: 7) sanoo laatukriteereiden olevan korkealla, kun on kyse ihmisen tekemästä käännöksestä. Käännökseltä odotetaan samaa kielellistä tasoa kuin lähtötekstiltä sekä samaa informaatiosisältöä. Toisaalta muun muassa Pertti Nuutila (2005: 7) kirjoittaa, että konekäännöksiä tehdään paljon myös sellaisista teksteistä, joita ei ilman mahdollisuutta saada ilmaista ja nopeaa raakakäännöstä tehtäisi ollenkaan. Jukka Pohjolan (2004) mukaan tietokone on ottanut miltei kaikessa kääntämisessä pääroolin ja jättänyt ihmiskääntäjän lähes statistin asemaan. Tietoyhteiskunta on muuttanut kääntäjän työtä enemmän kuin monien muiden alojen ammattilaisten työtä. Tietoa on saatavilla enemmän kuin ennen ja elektroniset työkalut helpottavat työn tekemistä. Kääntäjän tietotekniikan hallintaa pidetään itsestäänselvyytenä. Kääntäjän elektroniset työkalut eivät tarkoita yksinomaan konekäännösohjelmia, vaan on olemassa paljon muitakin teknisiä apuvälineitä, esimerkiksi termipankkeja tai käännösmuisteja. Koska konekääntämisessä ei oikeastaan ole kyse kommunikatiivisten, kulttuuristen tai sanakirjamaisen suorien käännösten tuottamisesta, Frank Austermühl (2001: 1) perustellusti kysyy, voidaanko tässä yhteydessä edes puhua varsinaisesta kääntämisestä. Elektroniset työkalut eivät ole ihmiskääntäjän korvike, vaan ne pikemminkin toimivat sen tukena. Mikään ohjelma ei pysty syrjäyttämään ihmistä, mutta laadukkaat käännösohjelmat tarjoavat huomattavia etuja kääntämiseen. Oikeat työkalut auttavat kääntäjää tekemään työtään ja parantamaan työn laatua. Tänä päivänä tietotekniset taidot ovat edellytyksenä lähes jokaisessa, varsinkin kielten parissa tapahtuvassa työssä. David Bergen (2004: 141) huomauttaa, että käännösteknologiaksi voidaan luokitella lähes mikä tahansa teknologia, joka on kehittyneempi kuin kynä ja paperi. Ammattimaisella kääntäjällä ei ole enää vaihtoehtoa olla käyttämättä Internetiä ja verkostoja työnsä apuna. Kääntäjä, joka työskentelee pelkästään kynien ja kirjojen parissa, ei ole enää realiteetti, vaan nykyajan kääntäjä käyttää sähköpostia toimeksiantojen vastaanottamiseen ja valmiiden käännösten lähettämiseen, elektronisia sanakirjoja termien hakuun, käännösmuistiohjelmia, elektronista arkistointia ja niin edelleen. Perinteinen posti tai faksi ei vastaa näihin vaatimuksiin. (Austermühl 2001: 19.) 9

Nykyajan kääntäjän tärkein elektroninen työkalu lienee käännösmuisti. Se ei ole automaattinen käännösohjelma, sillä se ei anna mitään käännöksiä valmiina. Käännösmuistiohjelma tallentaa kääntäjän tekemät käännökset lause tai niin sanottu segmentti kerrallaan. Ohjelma etsii muistista vastaavan tai lähes vastaavan käännösvastineen ja ehdottaa sitä kääntäjälle, jolloin kääntäjä päättää, käyttääkö hän vanhaa käännöstä sellaisenaan vai muuttaako hän sitä toisenlaiseksi. Jos vastaavaa käännöstä ei löydy, täytyy segmentti kääntää manuaalisesti. Uusi käännös tallentuu muistiin. Kääntäessä muisti siis päivittyy jatkuvasti. 10

3. Konekääntäminen 3.1 Historiaa Hutchinsin (2005b) mukaan jo ennen kuin tietokoneet oli keksitty, oli olemassa ajatus luonnollista kieltä kääntävästä automatiikasta. Kuitenkin vasta 1900-luvulla ajatusta voitiin käytännössä pitää realistisena, ja kun 1940-luvulla matemaattisia laskelmia tekevä tietokone oli onnistuttu rakentamaan, ryhdyttiin miettimään myös luonnollisen kielen kääntämistä koneella. Ensimmäiset konekäännösohjelmat sisälsivät kaksikielisen sanakirjan, joista ne tarjosivat lähtökielen sanalle yhden tai useamman kohdekielisen vastineen, ja mahdollisesti myös vaihtoehdon sanajärjestyksen muuttamiseksi kohdekielen konventioiden mukaiseksi. (Hutchins 2005b.) Vuonna 1954 Yhdysvalloissa esiteltiin ensimmäinen suppea konekäännösjärjestelmän prototyyppi, joka käänsi englannista venäjään. Sen seurauksena Yhdysvalloissa saatiin konekäännöksen tutkimukseen mittava rahoitus ja se synnytti lukuisia tutkimusryhmiä eri puolilla maailmaa. (Arppe 1994.) Seuraavat 10 vuotta oltiin hyvin optimistisia ja konekääntämisen ennustettiin tekevän läpimurtoja piankin. Optimismi karisi kuitenkin nopeasti, kun tutkijat törmäsivät kielen semanttisiin rajoituksiin eikä konekäännösten laatu parantunut yhtä nopeasti kuin oli odotettu (Hutchins 2005b). Konekääntämisen alkuaikoina tietokoneet olivat hitaita ja niiden muisti oli hyvin rajallinen verrattuna nykytietokoneisiin. Tuolloin puhuttiin paljon sanakirjan laajuudesta ja hakusanojen lataamisen nopeudesta. (Hutchins 1986: 40 41.) Vuonna 1966 ilmestyneessä kuuluisassa ALPAC:in (Automatic Language Processing Advisory Committee) raportissa (National Academy of Sciences 1966) todettiin konekääntämisen olevan hitaampaa, laadultaan huonompaa ja tuplasti niin kallista kuin ihmiskääntäminen. Raportissa konekääntämistä pidettiin saavuttamattomana tavoitteena. ALPAC:in raportin antama tuomio lopetti käytännössä konekääntämisen rahoituksen Yhdysvalloissa 1960- ja 1970-luvuilla. Raportin keskeinen sisältö oli, ettei konekäännösjärjestelmiltä olisi koskaan odotettavissa riittävää 11

parannusta käännöstyössä, eikä niitä välttämättä edes tarvittaisi, sillä ihmiskääntäjiä uskottiin riittävän tyydyttämään kaiken käännöstarpeen. (Arppe 1994.) Konekääntämisen tutkimisen sijaan raportissa suositeltiin tietokoneavusteisen kääntämisen, kuten automaattisten sanakirjojen, sekä kieliteknologian kehittämistä (Hutchins 2005b). Raportin julkaisemisen jälkeen konekääntämisen tutkimuksen rahoitus ehtyi etenkin Yhdysvalloissa ja sen painopiste siirtyi Eurooppaan. 1970-luvun loppupuolella ensimmäiset vieläkin toimivat konekäännösjärjestelmät otettiin käyttöön: Systran Euroopan Yhteisön komissiossa ja Météo Kanadan sääpalvelussa. (Arppe 1994; Hutchins 2005b.) Météo on konekäännösohjelma, joka kääntää säätiedotuksia ja -ennustuksia englannin ja ranskan välillä. Sen sanasto käsittelee niin suppeaa aihealuetta, että käännökset ovat suhteellisen hyvälaatuisia (Kay 2001). 1980-luvulla tutkittiin kehittyneempiä menetelmiä ja tekniikoita: tilastoihin ja esimerkkeihin pohjautuvat menetelmät, niin sanotut korpuspohjaiset tai tilastolliset ratkaisut. Ne perustuvat suurten elektronisten tekstimäärien ja niiden käännösten olemassaoloon, analysointiin ja systemaattiseen kasvattamiseen (Arppe 1994). Vielä 1980-luvulla tutkijoiden tavoitteena oli kehittää ohjelma, joka kääntäisi tekstejä sujuvasti luonnolliselta kieleltä toiselle (Hutchins 1986: 15). 3.2 Konekääntämisen perusmenetelmät Tietokoneisiin liittyy lukemattomia ennusteita, joista suurin osa ei ole koskaan toteutunut. Vielä 1960-luvulla kuviteltiin, että kun tietokoneelle syötetään kielioppi ja sanakirja, ne syrjäyttävät ihmiskääntäjät nopeasti. Mutta kun käännösohjelma käänsi out of sight - out of mind muotoon sokea idiootti, huomattiin, ettei konekääntäminen ollutkaan niin yksinkertaista kuin oli luultu. Jo vuonna 1996 Petteri Järvinen kirjoitti: Tämän päivän koneet pystyvät kääntämään kohtuullisella tarkkuudella yksinkertaisia tekstejä, mutta lopullisen hiomisen tekee aina ihminen. (Järvinen 1996.) Konekääntämisen perusidea on Star Trekin universaali kielenkääntäjä tai mekaaninen versio Douglas Adamsin Babel Fishistä: kone, joka muuttaa lähtötekstin täydelliseen kohdekieliseen tekstiin ilman minkäänlaista ihmisen vuorovaikutusta. Alun perin käännösten toimeksiantajien 12

unelma (tai kääntäjien painajainen) oli täysin automaattinen konekääntäminen, jossa ihmisen työpanosta ei tarvittaisi lainkaan (Bergen 2004: 143). Konekääntäminen on aihe, josta puhutaan yhä enemmän. Elektronisista käännöstyökaluista se herättää kenties eniten huomiota julkisuudessa, varsinkin maallikkojen keskuudessa (Austermühl 2001: 153). Konekääntämiseksi kutsutaan sitä, kun käännösohjelma kääntää kokonaisen tekstin automaattisesti ja esittää valmiin lopputuloksen. Kun ihminen kääntää tekstin, hän ehkä käyttää apunaan käännösmuistia tai elektronista termipankkia, mutta se ei ole konekääntämistä. Ihmisen tekemän käännöstyön ja konekääntämisen välissä on harmaata aluetta: kone saattaa ehdottaa kokonaisia aikaisemmin käännettyjä lauseita tai tarvittaessa tehdä pienehköjä muutoksia. Kuitenkin tällä harmaallakin alueella jokainen lause on alun perin joko ihmisen tai käännösohjelman kääntämä. Konekäännöksiksi voidaan kutsua vain sellaisia käännöksiä, jotka ovat kokonaan käännösohjelman tuottamia. (Melby 2001.) Konekääntäminen terminä on vakiintunut tarkoittamaan yleistä nimitystä järjestelmälle, joka käyttää tietokonetta muuttamaan lähtökielisen tekstin kohdekieliseksi (Hutchins 1986: 1). Se siis pyrkii jäljittelemään ihmistä kääntäjänä (Häyrynen 1992: 9). Nykyiset kehittyneimmätkään ohjelmat eivät käännä yhtä sujuvasti kuin äidinkielinen puhuja tai ammattimainen kääntäjä. Häyrysen (mts.) mukaan ihmiskääntäjän ja konekäännösohjelman lähtökohdat ja päämäärät ovat pitkälti samanlaiset. Molemmat pyrkivät tuottamaan lähtökielen sanomalle kohdekielelle siten, että sanoman merkitys pysyy niin lähellä alkuperäistä kuin mahdollista. Automaattinen kielen kääntäminen on hyvin vaikea toteuttaa, ja suurin ongelma on sanojen merkityksen eli semantiikan kuvaaminen koneelle. Merkitys riippuu käyttöyhteydestä eli kontekstista. Vaikka insinöörit ja kielitieteilijät ratkovat näitä ongelmia, lienee tällä hetkellä mahdotonta, että kukaan pystyisi tarjoamaan nopeaa ja täysin saumatonta konekäännöspalvelua. Konekäännösalalla kehitys ei ole ollut niin huikeaa kuin aluksi luultiin. Toisaalta paljon asioita, joita pidettiin tietokoneille mahdottomina, saatiin toteutettua 1950 1970-luvuilla. Teknologian kehittyminen on muuttanut maailmaa ja ihmisten elämää nopeammin kuin olisi voitu ennustaa. On vaikea kuvitella, mitä tapahtuu seuraavina vuosikymmeninä, kun elektroniikka on monta kertaa nykyistä nopeampaa ja halvempaa. Journalisti Matti Lintulahti 13

(2003) kirjoittaa, että jos tietokoneiden tietojenkäsittelykyky kasvaa nykyvauhtia, vuoden 2030 tienoilla voi olla mahdollista rakentaa oikeasti älykäs ja itsestään tietoinen robotti. Historia on myös osoittanut, että se, mitä on pidetty mahdottomana, voi muuttua yllättävänkin nopeasti mahdolliseksi. Viime vuosina mielenkiinto tietokoneen avulla tapahtuvaan kääntämiseen on kasvanut. Konekääntäminen tunnetaan kuitenkin valitettavasti useimmiten sen tekemien virheiden, eikä niinkään sen onnistumisien vuoksi. 3.3 Austermühlin jaottelu Koneen ja ihmisen osallistumisen astetta kääntämiseen Frank Austermühl (2001: 157 158) kuvaa seuraavasti: FAHQT FAMT HAMT MAHT HT MT Fully Automatic High Quality Translation (automaattinen hyvälaatuinen kääntäminen) Fully Automatic Machine Translation (automaattinen konekääntäminen) Human-Aided Machine Translation (ihmisavusteinen konekääntäminen) Machine-Aided Human Translation (tietokoneavusteinen ihmiskääntäminen) Human Translation (ihmiskääntäminen) Machine Translation (konekääntäminen) Näistä voidaan heti jättää pois HT sekä FAHQT, koska ne eivät ole nykyaikaa (Austermühl 2001: 11). Jäljelle jäävät MAHT (elektronisten sanakirjojen ja terminologiatietokantojen käyttö sekä tekstinkäsittelyohjelmat), HAMT (käännösmuistit, jotka ovat aluksi tyhjiä ja jotka täyttyvät käännöksiä tehdessä) ja MT eli konekääntäminen, joka vaatii tekstin esi- ja jälkieditointia. Käytettyään sievoisen summan rahaa konekäännösohjelmien kehittelyyn tutkijat ovat luopuneet täysin automaattisen korkealaatuisen käännösohjelman (FAHQT) toivosta. Sen sijaan on keskitytty käyttämään konekäännösohjelmia tietyn rajoitetun alan tekstien 14

kääntämiseen. Täysin automaattista kääntämistä on toki jo tarjolla Internetissä. Näiden palveluiden heikkous on David Bergenin (2004: 143) mukaan se, että laatu ei yleensä ole high quality. 3.4 Bergenin (Bowkerin) jaottelu David Bergenin (2004: 144) mukaan kaikkea kääntämistä voitaisiin kutsua ihmiskääntämiseksi (HT), koska mikään tietokone ei osaa luoda omaa käännösmuistiaan tai tietokantaansa ilman ihmisen väliintuloa. Sinänsä tietokone ei suomenkielisestä nimestään huolimatta tiedä mitään eikä se myöskään käsittele tietoa samassa mielessä kuin ihminen. Tietokoneelle voidaan syöttää merkkijonoja, informaatiota, jota se mekaanisesti käsittelee siihen ohjelmoitujen käskyjen mukaisesti. Yhtä lailla voidaan sanoa, että nykyään kaikki kääntäminen on jossain määrin tietokoneavusteista. Sen takia Bergen (mts.) ehdottaakin, että ihmiskääntämistä (HT) ei pitäisi enää luokitella erikseen. Myös Bergenin (2004: 147) lainaama Bowker (2002) käyttää samankaltaista jakoa ja jättää perinteisen ihmiskääntämisen (HT) pois laskuista kokonaan. Hän jakaa käännösmenetelmät kolmeen osa-alueeseen seuraavasti: 1. HT (Human translation): tekstinkäsittelyohjelmat, kieliasun tarkistus, Internet ja muut elektroniset lähteet 2. CAT (Computer-Aided Translation): skannerit, termipankit, käännösmuistit 3. MT (Machine Translation): konekäännösohjelmat Vaikka Austermühl (2001: 157 158) sanookin, että perinteinen ihmiskääntäminen (HT) ei ole nykyaikaa, hän haluaa silti edelleen erottaa sen tietokoneavusteisesta ihmiskääntämisestä (MAHT). Bowker luokittelee yhteen ihmisavusteisen konekääntämisen ja tietokoneavusteisen ihmiskääntämisen ja kutsuu sitä kokonaisuudessaan ihmiskääntämiseksi (HT). 15

3.5 Elektroniset sanakirjat osana käännösohjelmaa Elektronisen sanakirjan luominen ja täydentäminen on yksi konekääntämisen tärkeimmistä tehtävistä. Tällaiset sanakirjat olivat alkuaikoina konekääntämisen kehittäjien keskeisin huolenaihe, ja ne ovat edelleen ratkaisevan tärkeässä asemassa. Kuten muutkaan sanakirjat, myöskään elektroniset sanakirjat eivät ole täydellisiä: niistä puuttuu sanoja ja merkityksiä. Joskus joukkoon voi myös livahtaa suorastaan vääriä käännösvastineita. Tällaiset seikat johtavat virheellisiin käännöksiin. Hakumuotona käytetään sanan perusmuotoa, koska monissa kielissä sanat esiintyvät useissa eri muodoissa. Ohjelman sanakirjoihin voitaisiin tietysti lisätä sanojen kaikki taivutusmuodot, mutta Hutchinsin (1986: 44) mukaan on täysin tarpeetonta sisällyttää kaikkien sanojen kaikkia muotoja, koska sanakirjat paisuisivat turhan suuriksi. Esimerkiksi nykysuomen sanakirjassa on tällä hetkellä noin 210 000 perusmuotoista hakusanaa. Yksikielisistä sanakirjoista jätetään joskus pois itsestäänselvyyksiä, jotta mukaan mahtuisi enemmän sanoja (Westman 1998: 85). Kone käyttää kaksikielisiä sanakirjoja, ja niistä ei tietenkään voida jättää pois mitään, sillä sille ei mikään ole itsestään selvää. Kone ei ymmärrä sanojen taivutusmuotoja, vaan käsittelee samankin sanavartalon eri muodot erillisinä yksikköinä, mikä hankaloittaa sanakirjan käyttöä ja päivittämistä (Nuutila 2005: 21). Sanakirjojen päivitys ei onnistu samassa tahdissa kuin yleiskielen sanaston uusiutuminen. Kieli muuttuu koko ajan. Sanat ja niiden merkitykset muuttuvat tilanteesta toiseen. Uusia sanoja voi muodostaa vanhan, vakiintuneen mallin mukaan, ja samalla elvyttää epäproduktiivisiksi muuttuneita elementtejä. (Häkkinen 1998: 140; Nuutila 2005: 19.) Ihmiset keksivät uusia sanoja jatkuvasti, joista osa jää kieleen pysyvästi ja toiset elävät vain hetken; entisiä sanoja jää pois käytöstä ja uusia voidaan vaikkapa lainata muista kielistä. Johtamalla ja yhdistämällä saadaan helposti myös tilapäisiä sanoja, jotka eivät tule yleisesti tunnetuiksi eivätkä vakiinnu kieleen (Häkkinen 1998: 143). Sana voi myös vähitellen siirtyä tyylilajista toiseen. Esimerkiksi vuosia sitten sanaa kännykkä käytettiin ainoastaan leikillisissä yhteyksissä, mutta nykyään talousuutisissakin puhutaan jo kännykkämarkkinoista. (Palomäki 2004: 23.) 16

Elektroniset sanakirjat eivät osaa kovin hyvin luoda uusia yhdyssanoja tai sanaliittoja. Tavallisiin yksikielisiin sanakirjoihin ei ole tapana kirjata sellaisia yhdyssanoja, jotka ihminen pystyy päättelemään, esimerkiksi keltaoranssi tai sohvaostos. Konekäännösohjelmalle tarkoitetussa sanakirjassa kaikki vaihtoehdot tulisi luetella, sillä kuten seuraava esimerkki osoittaa, konekäännösohjelma epäonnistuu sanaliittojen tunnistamisessa ja kääntämisessä. Kyseessä on TransAction-käännösohjelmalla tehty käännös englannista saksaan (Schmid 1991: 134): Healthy living by the numbers: The vaunted benefits of the eat-right, stay-fit movement have always been slippery when applied to individuals. Die gepriesenen Vorteile des essen-richtig, sind-bleiben-fite Bewegung immer heikel wenn gewesen auf Individuen angewandt. Esimerkin käännöksessä on muitakin virheitä, mutta uusien sanaliittojen kääntäminen toiselle kielelle on epäonnistunut. Elektronisten sanakirjojen avulla käännösohjelma tekee sanasta-sanaan-käännöksen, jossa sanajärjestys on useammin väärä kuin oikea (Hutchins 1986: 41). Tällaisia alkeellisia ohjelmia ovat tosin enää kaupalliset ilmaisohjelmat, jotka käyttävät suoran kääntämisen menetelmää. Tästä kerron tarkemmin kappaleessa 5.1. Joskus teksteissä on käytetty sekaisin kahden tai useamman kielen sanoja. Jos vaikkapa ruotsinkielisen tekstin kirjoittaja ei muista tai keksi sopivaa ruotsinkielistä ilmausta, hän saattaa käyttää esimerkiksi englannin-, saksan- tai ranskankielistä vastinetta. Saattaa olla myös niin, että kyseistä termiä ei ruotsin kielessä ole olemassa. Tällöin konekäännösohjelmalle pitäisi olla annettu useamman kielen sanakirjat käyttöön, mikä taas kuormittaa muistikapasiteettia ja usein hidastaa ohjelman käyttämistä. Sanakirjojen yleinen ongelma on se, että luonnollisissa kielissä ei aina ole täydellisiä vastineita sanoille. Lähtökielen sanalla saattaa olla kohdekielessä monta käännösvaihtoehtoa. Tällöin käännösohjelma joko antaa kaikki vaihtoehdot tai koettaa valikoida niistä sopivimman 17

kyseiseen kohtaan. (Hutchins 1986: 41 42.) Tarkastelen moniselitteisiä ilmauksia tarkemmin kappaleessa 7.2. 18

4. Miksi konekääntämistä? Konekääntäminen herättää paljon mielipiteitä puolesta ja vastaan. Teksasin yliopiston lingvistiikan lehtori Jonathan Slocum kirjoitti jo vuonna 1984, että tuskin kukaan voi pysyä mielipiteissään täysin neutraalina kun kyse on konekääntämisestä. Useimmilla asiaan perehtyneillä ihmisillä varsinkin kääntäjillä on mielipide, jota he puolustavat. Melbyn (1995) mukaan toiset uskovat, että ihmisen ja tietokoneen välillä ei ole mitään perustavaa eroa: He ovat sitä mieltä, että tulevaisuudessa konekäännösten laatu tulee saavuttamaan ihmisen tekemien käännösten laadun. Tietokone osaa tehdä laskutoimituksia nopeammin ja tarkemmin kuin ihminen, ja matematiikka on monille ihmisille vaikeampaa kuin lingvistiikka. Lisäksi heidän argumenttinaan on, että ihmisaivot ovat tietynlainen tietokone. Näiden ihmisten mukaan on vain ajan kysymys, milloin tullaan kehittämään uudenlainen tietokone, joka toimii kuin ihmisaivot, mutta nopeammin ja paremmin, ja joka ylittää ihmisen suorituskyvyt kielentuottamisen alueella. Tekniikan lisensiaatti Risto Kaivola (2006) kirjoittaa Tiedelehdessä, että tietokoneet voivat hyvinkin alkaa pärjätä aivoille, jos numerolaskentaan ja valmiiseen ohjelmakoodiin perustuvan tekoälyn sijaan saadaan tietokone itse oppimaan ja ymmärtämään. Toiset ovat vastakkaisella kannalla: Heidän mukaansa ihmisaivot ja tietokone toimivat niin eri tavoin, ettei tietokone milloinkaan tule saavuttamaan ihmisen käännöstaitoja (Melby 1995). Ihmisen aivot ovat paljon monimutkaisempi ja hienompi kuin parhainkaan tietokone, ja ajatus siitä, että tietokone voisi oppia ajattelemaan samalla tavalla kuin ihminen, on pelottava ja kauhistuttava. Perusteena voidaan myös pitää sitä tosiasiaa, että tietokoneen piirikytkentä ei ole aivojen kaltainen systeemi (Kaivola 2006). Toki tietokoneet ovat tänä päivänä hyvinkin älykkäitä, mutta niiden älyä ei voi verrata ihmisen älyyn. Kääntäminen vaatii korkeatasoista kokonaisuuden hallintaa, jota kone ei voi saavuttaa lyhyessä ajassa. Konekäännösohjelmien interaktiiviset vaiheet yrittävät kiertää ongelmat käyttämällä hyväksi ihmisen tietoa ja ymmärrystä. Tällaiset vaiheet kuitenkin hidastavat kääntämistä. Voidaan 19

myös pohtia, onko kyseessä enää automaattinen konekääntäminen, jos ihminen osallistuu käännösprosessiin ja valitsee käännösvaihtoehdot. John Hutchinsin (2005a: 5 6) mukaan on olemassa ainakin kuusi syytä, joiden takia konekäännöksiä tulisi käyttää: 1. Käännettäviä tekstejä on aivan liikaa. 2. Tekniset tekstit ovat ihmiskääntäjille liian tylsiä. 3. Terminologian yhdenmukaisuus on taattava. 4. Konekääntäminen mahdollistaa paljon pidempien tekstien kääntämisen paljon nopeammin kuin mihin ihmiskääntäjät pystyvät. 5. Ihmiskääntäjien tuottamaan huippulaatua ei aina tarvita. 6. Yritykset haluavat laskea käännösten kustannuksia. Käsittelen seuraavaksi näitä kohtia yksitellen hieman tarkemmin. 4.1 Liikaa käännettäviä tekstejä Ihmiskääntäjiä ei ole tarpeeksi. Internetin kautta ihmiset törmäävät vieraskielisiin teksteihin enemmän kuin koskaan ennen. He seuraavat linkkejä kiinnostaville sivuille ja löytävät tekstiä, joiden kieltä he eivät ymmärrä. Sivujen sisällön ymmärtämiseksi on kehitetty onlinekäännösohjelmia, kuten Babel Fish. Tällaiset ilmaisohjelmat eivät kuitenkaan ole ammattimaiselle kääntäjälle tarpeeksi laadukkaita, vaikka ne maallikolle kelpaavatkin. Myös teollisuudessa ja yritysmaailmassa käännettäviä tekstejä on aiempaa enemmän. Koneet kääntävät tällä hetkellä jo määrällisesti enemmän tekstejä kuin ihminen (Lisa 2004). Globalisoitumisen myötä maailma kutistuu kovaa vauhtia: englannista tulee yhä vallitsevampi kieli ja yhä useammat kansainväliset yritykset käyttävät ainoastaan englantia myös sisäisessä dokumentoinnissa ja viestinnässä. Englannista tulee universaali käyttökieli, uusi lingua franca. Englannin yleistyminen voi toisaalta osaltaan vähentää käännettävien tekstien määrää, kun kaikkien oletetaan ymmärtävän englanninkieliset lähtötekstit. 20