Konekäännöksen rooli, laatu ja odotukset

Samankaltaiset tiedostot
Konekääntimien tuottaman tekstin oikeellisuuden arvioinnista: konekäännöksen editointitehtävä

Konekäännös ja käännöskone: Korvataanko kääntäjä napin painalluksella?

Käännösvirheiden vaikutus posteditoijien kykyyn muokata konekäännöstä

Maarit Koponen. Kites Symposium

Gap-filling methods for CH 4 data

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Konekäännös: mitä sillä tehdään?

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Capacity Utilization

Efficiency change over time

RANS0002 P2. Phonetics and Pronunciation (Fonetiikka ja ääntäminen), O, 2 ECTS. RANS0010 P3. Translation Exercise (Käännösharjoitukset) s, O, 3 ECTS

Other approaches to restrict multipliers

APA-tyyli. Petri Nokelainen

MEETING PEOPLE COMMUNICATIVE QUESTIONS

Alternative DEA Models

make and make and make ThinkMath 2017

Lataa Legislating the blind spot - Nikolas Sellheim. Lataa

Co-Design Yhteissuunnittelu

Results on the new polydrug use questions in the Finnish TDI data

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

Constructive Alignment in Specialisation Studies in Industrial Pharmacy in Finland

Valuation of Asian Quanto- Basket Options

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

ReFuel 70 % Emission Reduction Using Renewable High Cetane Number Paraffinic Diesel Fuel. Kalle Lehto, Aalto-yliopisto 5.5.

Kliininen päättely. Thomsonin mallin mukaisen yhteistyön näkyminen fysioterapiatilanteessa

The CCR Model and Production Correspondence

Kielitieteellisten aineistojen käsittely

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

Kysymys 5 Compared to the workload, the number of credits awarded was (1 credits equals 27 working hours): (4)

Käytettävyyslaatumallin rakentaminen web-sivustolle. Oulun yliopisto tietojenkäsittelytieteiden laitos pro gradu -suunnitelma Timo Laapotti 28.9.

Infrastruktuurin asemoituminen kansalliseen ja kansainväliseen kenttään Outi Ala-Honkola Tiedeasiantuntija

FP3: Research task of UTA

Kutsu käännöstieteen professori Kaisa Koskisen juhlaluennolle 7. päivänä joulukuuta 2016 kello 13

Curriculum. Gym card

FIS IMATRAN KYLPYLÄHIIHDOT Team captains meeting

anna minun kertoa let me tell you

Työkaluja PRH:n peruspatenttipalvelun myymiseen

OP1. PreDP StudyPlan

Use of spatial data in the new production environment and in a data warehouse

The BaltCICA Project Climate Change: Impacts, Costs and Adaptation in the Baltic Sea Region

Increase of opioid use in Finland when is there enough key indicator data to state a trend?

16. Allocation Models

LYTH-CONS CONSISTENCY TRANSMITTER

KONEISTUSKOKOONPANON TEKEMINEN NX10-YMPÄRISTÖSSÄ

Hotel Pikku-Syöte: accommodation options and booking

Konekäännöksen laadun arviointia käännöstieteen menetelmin. KäTu-symposiumi 2010 Maarit Koponen Helsingin yliopisto Nykykielten laitos

digi.kansalliskirjasto.fi

Köyhä vai ihminen, joka elää köyhyydessä? Kielellä on väliä. Maria Ohisalo, tutkija, Y-Säätiö

Additions, deletions and changes to courses for the academic year Mitä vanhoja kursseja uusi korvaa / kommentit

BDD (behavior-driven development) suunnittelumenetelmän käyttö open source projektissa, case: SpecFlow/.NET.

Skene. Games Refueled. Muokkaa perustyyl. for Health, Kuopio

Asiakaspalautteen merkitys laboratoriovirheiden paljastamisessa. Taustaa

VUOSI 2015 / YEAR 2015

Avoimen datan liiketoimintamallit. Matti Rossi, Aalto University School of Business

Salasanan vaihto uuteen / How to change password

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

DS-tunnusten haku Outi Jäppinen CIMO

Alueellinen yhteistoiminta

Returns to Scale II. S ysteemianalyysin. Laboratorio. Esitelmä 8 Timo Salminen. Teknillinen korkeakoulu

Lakimies PDF. ==>Download: Lakimies PDF ebook

koiran omistajille ja kasvattajille 2013 for dog owners and breeders in 2013

DIGITAL MARKETING LANDSCAPE. Maatalous-metsätieteellinen tiedekunta

ProAgria. Opportunities For Success

Miten koulut voivat? Peruskoulujen eriytyminen ja tuki Helsingin metropolialueella

EU DIGITAL EUROPE MITEN SAAMME NOPEUTETTUA TAVOITELTUA MUUTOSTA? CSC Markku Markkula COR RAPPORTEUR ON DIGITAL EUROPE

Vesitehokkuus liiketoiminnan uusi ajuri. Pöyry Forest Industry Consulting oy

toukokuu 2011: Lukion kokeiden kehittämistyöryhmien suunnittelukokous

VAASAN YLIOPISTO Humanististen tieteiden kandidaatin tutkinto / Filosofian maisterin tutkinto

HITSAUKSEN TUOTTAVUUSRATKAISUT

Yritysten innovaatiotoiminnan uudet haasteet

4x4cup Rastikuvien tulkinta

ETELÄESPLANADI HELSINKI

Digitalisoituminen, verkottuminen ja koulutuksen tulevaisuus. Teemu Leinonen Medialaboratorio Taideteollinen korkeakoulu

7.4 Variability management

Sosiaali- ja terveydenhuollon kehittämisestä

Draft VAMMOJEN EHKÄISYYN. Markku Tuominen. Suomen jääkiekkoliitto. International Ice Hockey Federation

03 PYÖRIEN SIIRTÄMINEN

3 9-VUOTIAIDEN LASTEN SUORIUTUMINEN BOSTONIN NIMENTÄTESTISTÄ

Käyttökokemuksen evaluoinnista käyttökokemuksen ohjaamaan suunnitteluun. ecommunication & UX SUMMIT Eija Kaasinen, VTT

Käytön avoimuus ja datanhallintasuunnitelma. Open access and data policy. Teppo Häyrynen Tiedeasiantuntija / Science Adviser

GEENEISTÄ SOSIAALISEEN KÄYTTÄYTYMISEEN. Markus Jokela, Psykologian laitos, HY

Suomen JVT- ja Kuivausliikkeiden Liitto ry The Association of Finnish Damage Restoration Companies

THE TEHDESSÄ CONSTRUCTION OF FINNISH AND THE TYPICALITY OF ADVANCED LEARNER LANGUAGE IN THE LIGHT OF NATIVE USERS' GRAMMATICALITY JUDGEMENTS

21~--~--~r--1~~--~--~~r--1~

Osallistujaraportit Erasmus+ ammatillinen koulutus

Opintomatkat PDF. ==>Download: Opintomatkat PDF ebook By Risto Antikainen

Miehittämätön meriliikenne

Capacity utilization

Suomen 2011 osallistumiskriteerit

Vertaispalaute. Vertaispalaute, /9

TÄYTTÖAUTOMAATIT TÄYTTÖAUTOMAATIT COMPUTER INFLATORS

Voice Over LTE (VoLTE) By Miikka Poikselkä;Harri Holma;Jukka Hongisto

Pricing policy: The Finnish experience

Konekäännöksen laatu ja jälkieditointiin soveltuvien käännösten tunnistaminen

KÄYTTÄJÄKOKEMUS & KÄYTTÖLIITTYMÄSUUNNITTELU. CSE- C3800, Aalto , Eeva Raita

EUROOPAN PARLAMENTTI

Miksi Suomi on Suomi (Finnish Edition)

Transkriptio:

Konekäännöksen rooli, laatu ja odotukset Kites, Konekääntämisen teemaryhmä 23.5.2012 Maarit Koponen, HY 1

Takana loistava tulevaisuus Konekäännökseen on kohdistunut suuria odotuksia: nopea, helppo, halpa käännös nappia painamalla. 1930-luvulla Georges Artsrounin ja Petr Trojanskin käännöskonepatentit, 1949 Warren Weaverin ehdotus (kääntäminen koodin purkamisena), 1954 IBM-Georgetown. Konekääntäminen nähtiin ongelmana, jonka oletettiin olevan ratkaistu 3-5 vuoden kuluessa. ALPAC-raportti 1966: toivottuja edistysaskeleita ei oltu saavutettu. 2

Konekääntämisen toinen aalto Koneluettavassa muodossa olevan aineiston määrä ja tietokoneiden laskentatehon kasvu avasivat uusia väyliä tilastolliselle konekäännökselle. Konekääntäminen alkoi nousta suuren yleisönkin tietoisuuteen (Google) uusi innostus: nopea, helppo, ilmainen käännös internetissä nappia painamalla! 3

Konekääntämisen toinen aalto Koneluettavassa muodossa olevan aineiston määrä ja tietokoneiden laskentatehon kasvu avasivat uusia väyliä tilastolliselle konekäännökselle. Konekääntäminen alkoi nousta suuren yleisönkin tietoisuuteen (Google) uusi innostus: nopea, helppo, ilmainen käännös internetissä nappia painamalla! 4

Konekääntämisen toinen aalto Koneluettavassa muodossa olevan aineiston määrä ja tietokoneiden laskentatehon kasvu avasivat uusia väyliä tilastolliselle konekäännökselle. Konekääntäminen alkoi nousta suuren yleisönkin tietoisuuteen (Google) uusi innostus: nopea, helppo, ilmainen käännös internetissä nappia painamalla! 5

"Konekäännöksen Graalin malja" Täysautomaattinen korkealaatuinen rajoittamattoman tekstin käännin (fully automatic high-quality translation of unrestricted text) 6

"Konekäännöksen Graalin malja" täysautomaattinen korkealaatuinen rajoittamattoman tekstin käännin (fully automatic high-quality translation of unrestricted text) täysautomaattinen korkealaatuinen rajoittamaton 7

Kääntäjä ja käännin vuorovaikutuksessa Koneavusteinen ihmiskäännös: kääntäjä editoi konekääntimen tekemiä ehdotuksia käännösmuistin tapaan. Ihmisavusteinen konekäännös: kääntäjä ratkaisee moniselitteisyydet lähtötekstissä. täysautomaattinen korkealaatuinen rajoittamaton 8

Esimerkki: CAITRA (tool.statmt.org) 9

Esimerkki: CAITRA (tool.statmt.org) 10

Esimerkki: LIDIA (www-clips.imag.fr/geta/herve.blanchon/recherche/lidia/lidia.html) 11

Esimerkki: LIDIA (www-clips.imag.fr/geta/herve.blanchon/recherche/lidia/lidia.html) 12

Rajoitetun kielen sovellukset Aihealue on tarkkaan rajattu. Säätiedotus: "wind" "tuuli", ei "henki", "kiemurrella", "kelata"... täysautomaattinen Rajoitetun kielen säännöt ja lähtötekstin pre-editointi sääntöjen mukaisesti. Esim. MOLTO-hankkeessa korkealaatuinen tavoitteena museoesineiden kuvaukset, farmakologian patentit, matematiikan harjoitukset (www.molto-project.eu) rajoittamaton 13

Esimerkki: GF Phrasebook (www.grammaticalframework.org/demos/phrasebook/) 14

Esimerkki: GF Phrasebook (www.grammaticalframework.org/demos/phrasebook/) 15

Esimerkki: GF Phrasebook (www.grammaticalframework.org/demos/phrasebook/) 16

Konekäännös riittävän hyvä? Konekäännös voi tarjota lukijalle nopeasti yleiskuvan lähtötekstin sisällöstä: tiedonhaku, esim. EPO:n patentit päätös käännättämisestä. Konekäännöstä voidaan käyttää raakaversiona, jota kääntäjä edelleen editoi. täysautomaattinen korkealaatuinen rajoittamaton Hyvälaatuisen konekäännöksen editointi voi säästää aikaa, vaivaa, rahaa huonolaatuisen editointi voi olla hidasta ja turhauttavaa. 17

Laatuarviointia ja odotuksia "Laatu" käsitteenä vaikea, erilaisia kriteereitä (tarkkuus, sujuvuus, editoinnin työläys). Eri kielipareissa ja eri tekstilajeilla laatuarviointien tulokset vaihtelevat esim. suomi tunnetusti vaikea. Fiederer ja O'Brien 2009: post-editoidulla tekstillä paremmat selkeys- ja tarkkuusarviot. Koehn 2010: ilman lähtötekstiä parhaat post-editoijat lähes kaksikielisen kääntäjän tasolla (oikeellisuus). Toisaalta korjaamisen vaikeus, erityisesti ilman lähtötekstiä kriittisen virheen jääminen huomaamatta mahdollista. Hybridikääntimet: tilastollisen ja sääntöpohjaisen vahvuuksien yhdistäminen. 18

Merkitys voi hahmottua virheistä huolimatta Last year at a foodprocessing factory near Geneva, the workers revolted when the director tried to ban mobile phones from the factory floor, and he was forced to relent. Viime vuonna foodprocessing?-tehtaassa Geneven lähellä työntekijät kapinoivat, kun johtaja yritti kieltää matkapuhelimia pääsemästä tehdassaliin, ja hän oli pakotettu antamaan periksi. (Sunda) 19

Korjaaminen voi olla työlästäkin Figuring out which insects are which can be fiendishly difficult; some scientists estimate that we have managed to identify only 10% of the insect world so far. The rest, like Barclay s almondshaped mystery bug, are perfectly happy to crawl along without any christening or approval from their gargantuan neighbors. Miettiminen jotka hyönteiset, jotka voivat olla pirullisen vaikeaa, jotkut tutkijat arvioivat, että olemme onnistuneet tunnistamaan vain 10% hyönteisten maailman toistaiseksi. Loput, kuten Barclay's mantelimuotoinen mysteeri vika, on täysin tyytyväinen indeksoida pitkin ilman kaste tai hyväksyntää niiden jättiläismäinen naapureita. (Google) 20

Ilman lähtötekstiä... Hänen tutkimuksensa Sveitsissä ja Ranskassa havaitsi, että jopa silloin kun ihmisille soitetaan, ei kasva merkittävästi. 21

Ilman lähtötekstiä... Hänen tutkimuksensa Sveitsissä ja Ranskassa havaitsi, että jopa silloin kun ihmisille soitetaan, ei kasva merkittävästi. 22

Ilman lähtötekstiä... Hänen tutkimuksensa Sveitsissä ja Ranskassa havaitsi, että jopa silloin kun ihmisille soitetaan, ei kasva merkittävästi. Her research in Switzerland and France found that even when people are given unlimited cheap or free calls, the number and length of calls does not increase significantly. 23

Ilman lähtötekstiä... Hänen tutkimuksensa Sveitsissä ja Ranskassa havaitsi, että jopa silloin kun ihmisille soitetaan, ei kasva merkittävästi. Her research in Switzerland and France found that even when people are given unlimited cheap or free calls, the number and length of calls does not increase significantly. 24

Kirjallisuutta Frédéric Blain et al. 2011. Qualitative analysis of post-editing for high quality machine translation. MT Summit XIII. Michael Carl et al.2011. The process of post-editing: a pilot study. Proceedings of the 8th international NLPSC workshop. Special theme: Human-machine interaction in translation. Rebecca Fiederer & Sharon O'Brien. 2009. Quality and machine translation: A realistic objective? The Journal of Specialised Translation, 11 (January 2009). Ignacio García 2010. Is Machine Translation Ready Yet? Target, 22(1), 7-21. Ana Guerberof 2009. Productivity and quality in the post-editing of outputs from translation memories and machine translation, Localisation Focus. The International Journal of Localisation, 7(1), 11-21. Douglas Jones et al. 2007. ILR-based MT comprehension test with multi-level questions. NAACL '07. Philipp Koehn. 2010. Enabling monolingual translators: Post-editing vs. options. NAACL HLT 2010. Hans P. Krings. 2001. Repairing texts: Empirical investigations of machine translation post-editing process. The Kent State University Press, Kent, OH. Sharon O Brien 2005. Methodologies for Measuring the Correlations between PostEditing Effort and Machine Translatability. Machine Translation, 19(1):37-58. 25

Kirjallisuutta Alina Secară 2005. Translation Evaluation a State of the Art Survey. Proceedings of the ecolore/mellange Workshop. Lucia Specia et al. 2009. Estimating the Sentence-Level Quality of Machine Translation Systems. In Proceedings of the 13th Annual Conference of the EAMT. Lucia Specia. 2011. Exploiting Objective Annotations for Measuring Translation PostEditing Effort. In Proceedings of the 15th Conference of the European Association for Machine Translation. Lucia Specia et al. 2011. Predicting Machine Translation Adequacy. MT Summit XIII. Midori Tatsumi. 2009. Correlation between Automatic Evaluation Metric Scores, PostEditing Speed, and Some Other Factors. MT Summit XII. Midori Tatsumi & Johann Roturier. 2010. Source Text Characteristics and Technical and Temporal Post-Editing Effort: What is Their Relationship? Proceedings of the Second Joint EM+/CNGL Workshop Bringing MT to the User: Research on Integrating MT in the Translation Industry (JEC 10). Irina Temnikova. 2010. Cognitive Evaluation Approach for a Controlled Language PostEditing Experiment. LREC 2010. David Vilar et al. 2006. Error analysis of statistical machine translation output. LREC2006. 26

Kirjallisuutta Frédéric Blain et al. 2011. Qualitative analysis of post-editing for high quality machine translation. MT Summit XIII. Michael Carl et al.2011. The process of post-editing: a pilot study. Proceedings of the 8th international NLPSC workshop. Special theme: Human-machine interaction in translation. Rebecca Fiederer & Sharon O'Brien. 2009. Quality and machine translation: A realistic objective? The Journal of Specialised Translation, 11 (January 2009). Ignacio García 2010. Is Machine Translation Ready Yet? Target, 22(1), 7-21. Ana Guerberof 2009. Productivity and quality in the post-editing of outputs from translation memories and machine translation, Localisation Focus. The International Journal of Localisation, 7(1), 11-21. Douglas Jones et al. 2007. ILR-based MT comprehension test with multi-level questions. NAACL '07. Philipp Koehn. 2010. Enabling monolingual translators: Post-editing vs. options. NAACL HLT 2010. Hans P. Krings. 2001. Repairing texts: Empirical investigations of machine translation post-editing process. The Kent State University Press, Kent, OH. Sharon O Brien 2005. Methodologies for Measuring the Correlations between PostEditing Effort and Machine Translatability. Machine Translation, 19(1):37-58. Alina Secară 2005. Translation Evaluation a State of the Art Survey. Proceedings of the ecolore/mellange Workshop. 27

Kirjallisuutta Frédéric Blain et al. 2011. Qualitative analysis of post-editing for high quality machine translation. MT Summit XIII. Michael Carl et al.2011. The process of post-editing: a pilot study. Proceedings of the 8th international NLPSC workshop. Special theme: Human-machine interaction in translation. Rebecca Fiederer & Sharon O'Brien. 2009. Quality and machine translation: A realistic objective? The Journal of Specialised Translation, 11 (January 2009). Ignacio García 2010. Is Machine Translation Ready Yet? Target, 22(1), 7-21. Ana Guerberof 2009. Productivity and quality in the post-editing of outputs from translation memories and machine translation, Localisation Focus. The International Journal of Localisation, 7(1), 11-21. Douglas Jones et al. 2007. ILR-based MT comprehension test with multi-level questions. NAACL '07. Philipp Koehn. 2010. Enabling monolingual translators: Post-editing vs. options. NAACL HLT 2010. Hans P. Krings. 2001. Repairing texts: Empirical investigations of machine translation post-editing process. The Kent State University Press, Kent, OH. Sharon O Brien 2005. Methodologies for Measuring the Correlations between PostEditing Effort and Machine Translatability. Machine Translation, 19(1):37-58. Alina Secară 2005. Translation Evaluation a State of the Art Survey. Proceedings of the ecolore/mellange Workshop. 28