Konekäännöksen laatu ja jälkieditointiin soveltuvien käännösten tunnistaminen

Samankaltaiset tiedostot
Maarit Koponen. Kites Symposium

Konekäännöksen rooli, laatu ja odotukset

Konekäännöksen laadun arviointia käännöstieteen menetelmin. KäTu-symposiumi 2010 Maarit Koponen Helsingin yliopisto Nykykielten laitos

Käännösvirheiden vaikutus posteditoijien kykyyn muokata konekäännöstä

Estimointityökalut. Pekka Forselius, Senior Advisor Finnish Software Measurement Association FiSMA ry

VERBIHARJOITUS I. 1. Kirjoita verbi suomeksi ja vastaa kysymyksiin espanjaksi.

LYTH-CONS CONSISTENCY TRANSMITTER

Kysymys 5 Compared to the workload, the number of credits awarded was (1 credits equals 27 working hours): (4)

Maahanmuutto Opiskelu

Konekäännöksen laadun arviointi: Päätelmiä erityyppisten konekääntimien semanttisesta tarkkuudesta

Suomen 2011 osallistumiskriteerit

Toiminnan tehokkuuden mittaaminen ja arviointi yhteiskunnallisten yritysten kontekstissa

Efficiency change over time

FIS IMATRAN KYLPYLÄHIIHDOT Team captains meeting

Constructive Alignment in Specialisation Studies in Industrial Pharmacy in Finland

BDD (behavior-driven development) suunnittelumenetelmän käyttö open source projektissa, case: SpecFlow/.NET.

Aalto University School of Engineering Ongelmaperusteisen oppimisen innovatiivinen soveltaminen yliopisto-opetuksessa

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

ESITTELY. Valitse oppilas jonka haluaisit esitellä luokallesi ja täytä alla oleva kysely. Age Grade Getting to school. School day.

Erasmus-liikkuvuuden tilastoja Anni Kallio

Tarua vai totta: sähkön vähittäismarkkina ei toimi? Satu Viljainen Professori, sähkömarkkinat

Association Regulation

Information on Finnish Language Courses Spring Semester 2017 Jenni Laine

Wärtsilä Corporation. Interim Report January-September 2003 Ole Johansson President & CEO. 29 October Wärtsilä

Työelämän murros - Millaisesta työstä eläke karttuu tulevaisuudessa? Työeläkekoulu

AYYE 9/ HOUSING POLICY

Konekäännös: mitä sillä tehdään?

Capacity Utilization

Rotarypiiri 1420 Piiriapurahoista myönnettävät stipendit

Lataa Legislating the blind spot - Nikolas Sellheim. Lataa

Kehittyvien satelliittiaineistojen mahdollisuudet

Matti Sarvimäki. July /2009 Senior Researcher Government Institute for Economic Research, Helsinki

TU-C2030 Operations Management Project. Introduction lecture November 2nd, 2016 Lotta Lundell, Rinna Toikka, Timo Seppälä

Jyrki Kontio, Ph.D

RANS0002 P2. Phonetics and Pronunciation (Fonetiikka ja ääntäminen), O, 2 ECTS. RANS0010 P3. Translation Exercise (Käännösharjoitukset) s, O, 3 ECTS

Hotel Pikku-Syöte: accommodation options and booking

Master's Programme in Life Science Technologies (LifeTech) Prof. Juho Rousu Director of the Life Science Technologies programme 3.1.

General studies: Art and theory studies and language studies

Roolipeliharjoitus. - Opiskelijoiden suunni=elemat neuvo=eluvideot ja niiden vertaisarvioinnit

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

Vaihtoon lähdön motiivit ja esteet Pohjoismaissa. Siru Korkala

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Tooling ja digitaalisuus Työkalupäivät, Naantali. Kaidoc Oy tel

Matkustaminen Liikkuminen

Siirtymä maisteriohjelmiin tekniikan korkeakoulujen välillä Transfer to MSc programmes between engineering schools

Research in Chemistry Education

Väite Argument "Yhteiskunnan velvollisuus on tarjota virkistysalueita ja -palveluita." "Recreation sites and service

Infrastruktuurin asemoituminen kansalliseen ja kansainväliseen kenttään Outi Ala-Honkola Tiedeasiantuntija

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali

You can check above like this: Start->Control Panel->Programs->find if Microsoft Lync or Microsoft Lync Attendeed is listed

WP3 Decision Support Technologies

LAATUMITTARIT LÄÄKETEOLLISUUDESSA

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

Salasanan vaihto uuteen / How to change password

GAL Karhuseutu. Euroopan maaseudun kehittämisen maatalousrahasto: Eurooppa investoi maaseutualueisiin.

LANSEERAUS LÄHESTYY AIKATAULU OMINAISUUDET. Sähköinen jäsenkortti. Yksinkertainen tapa lähettää viestejä jäsenille

MEETING PEOPLE COMMUNICATIVE QUESTIONS

Expression of interest

Kokouspöytäkirja. 2. Kokous todettiin laillisesti kokoon kutsutuksi ja päätösvaltaiseksi.

Tietoa Joensuun Eliittikisoista

VÄRE premises Sari Dhima

ECVETin soveltuvuus suomalaisiin tutkinnon perusteisiin. Case:Yrittäjyyskurssi matkailualan opiskelijoille englantilaisen opettajan toteuttamana

Social and Regional Economic Impacts of Use of Bioenergy and Energy Wood Harvesting in Suomussalmi

Information on Finnish Courses Autumn Semester 2017 Jenni Laine & Päivi Paukku Centre for Language and Communication Studies

Tähtäimessä vaikuttavuus turvallisesti. - HTA terveydenhuollon laitteiden näkökulmasta. Tom Ståhlberg Johtaja, Viranomaisasiat

Vesitehokkuus liiketoiminnan uusi ajuri. Pöyry Forest Industry Consulting oy

Hakemus Ansioluettelo / CV

TIETOKANTOJEN PERUSTEET MARKKU SUNI

pitkittäisaineistoissa

Other approaches to restrict multipliers

Mikä pätevyys näytteenottoon tarvitaan? Sirpa Pohjala Aluepäällikkö PTH HUSLAB

Somaattinen sairaus nuoruudessa ja mielenterveyden häiriön puhkeamisen riski

Mobility Tool. Demo CIMO

Kokoelmien arviointi

VUOSI 2015 / YEAR 2015

Suomen Invalidien Urheiluliitto r.y. The Finnish Association of Sports for the Disabled. SARJARAPORTTI The report of series

Virheiden vaikutus konekäännöksen laatuun

Alueen asukkaiden käsitykset kampuksesta

3D-tulostus. ebusiness Forum. Jukka Tuomi Finnish Rapid Prototyping Association, FIRPA Aalto University. Linnanmäki

Aallonhuiput. Aalto University Doctoral Student Association. Lauri Kovanen, November 8th 2012

Results on the new polydrug use questions in the Finnish TDI data

Matkustaminen Yleistä

CASE POSTI: KEHITYKSEN KÄRJESSÄ TALOUDEN SUUNNITTELUSSA KETTERÄSTI PALA KERRALLAAN

Skene. Games Refueled. Muokkaa perustyyl. for Health, Kuopio

Ihmisten yksilöllisten lämpöaistimusten. vaikutukset talotekniikan suunnitteluun. Evicures,

Bachelor level exams by date in Otaniemi

Laajuus (op)/ Omfattning (sp) / Scope (cr)

MUSEOT KULTTUURIPALVELUINA

La a d u l l in en in d ik a a t t o r i

Bachelor level exams by subject in Otaniemi

Curriculum. Gym card

Ostamisen muutos muutti myynnin. Technopolis Business Breakfast

Monikielinen konekäännös ja sen laadun arviointi MOLTO-hankkeessa

Tuotekehitysverkoston läpimenoajan lyhentäminen tuotemuutostenhallinnalla ja verkoston tietojärjestelmien integroinnilla

HPV ja irtosolututkimukset, kliinikon näkökulma. Pekka Nieminen Dosentti Klinikkaylilääkäri HYKS, naistentaudit

Käytettävyyslaatumallin rakentaminen web-sivustolle. Oulun yliopisto tietojenkäsittelytieteiden laitos pro gradu -suunnitelma Timo Laapotti 28.9.

Olosuhdetieto. Metsäntutkimuksen ja päätöksenteon apuna. Metsäteho Timo Tokola. UEF // University of Eastern Finland

Copernicus, Sentinels, Finland. Erja Ämmälahti Tekes,

Prognos Julkaisusuunnitelmat

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

Transkriptio:

Konekäännöksen laatu ja jälkieditointiin soveltuvien käännösten tunnistaminen XI Kääntämisen ja tulkkauksen symposiumi 12.-13.4.2013, Turku Maarit Koponen Helsingin yliopisto 13.4.2013 1

Konekäännöksen jälkieditointi Kääntimien kehitys viime vuosina on lisännyt kiinnostusta konekäännöksen jälkieditointiin sekä käytännön työssä että tutkimuskohteena. Riittävän korkealaatuisen, tiettyyn tarkoitukseen soveltuvan konekäännöksen editoinnin on havaittu säästävän aikaa ja jopa parantavan laatua (esim. Carl ym. 2011; Plitt ja Masselot 2010). 13.4.2013 2

Konekäännöksen jälkieditointi Kääntimien kehitys viime vuosina on lisännyt kiinnostusta konekäännöksen jälkieditointiin sekä käytännön työssä että tutkimuskohteena. Riittävän korkealaatuisen, tiettyyn tarkoitukseen soveltuvan konekäännöksen editoinnin on havaittu säästävän aikaa ja jopa parantavan laatua (esim. Carl ym. 2011; Plitt ja Masselot 2010). Heikkolaatuisen konekäännöksen editointi on kuitenkin työlästä ja turhauttavaa. 13.4.2013 3

Konekäännöksen jälkieditointi Kääntimien kehitys viime vuosina on lisännyt kiinnostusta konekäännöksen jälkieditointiin sekä käytännön työssä että tutkimuskohteena. Riittävän korkealaatuisen, tiettyyn tarkoitukseen soveltuvan konekäännöksen editoinnin on havaittu säästävän aikaa ja jopa parantavan laatua (esim. Carl ym. 2011; Plitt ja Masselot 2010). Heikkolaatuisen konekäännöksen editointi on kuitenkin työlästä ja turhauttavaa. Keskeinen kysymys onkin editoinnista aiheutuvan työmäärän arviointi ja erilaatuisten käännösten erottaminen toisistaan. Laadun estimointi (Quality Estimation) 13.4.2013 4

Jälkieditoinnin työläys Työn kolme aspektia (Krings 2001) Aika-aspekti editointiin kuluva aika Tekninen aspekti muutoksiin tarvittavat tekniset operaatiot Kognitiivinen aspekti tarvittavien muutosten tunnistaminen/suunnittelu Aika koostuu sekä teknisestä että kognitiivisesta työstä. Tekninen ja kognitiivinen aspekti eivät välttämättä ole samalla tasolla! 13.4.2013 5

Työläyden arviointi Tyypillisin arviointimenetelmä on editointietäisyys: HTER - Human-targeted Translation Edit Rate (Snover ym. 2009). Tehtyjen muutosten määrä, karkea tyyppi (poisto, lisäys, korvaus, siirto). 13.4.2013 6

Työläyden arviointi Tyypillisin arviointimenetelmä on editointietäisyys: HTER - Human-targeted Translation Edit Rate (Snover ym. 2009). Tehtyjen muutosten määrä, karkea tyyppi (poisto, lisäys, korvaus, siirto). Mittaa teknistä työtä entä kognitiivinen aspekti? 13.4.2013 7

Työläyden arviointi Tyypillisin arviointimenetelmä on editointietäisyys: HTER - Human-targeted Translation Edit Rate (Snover ym. 2009). Tehtyjen muutosten määrä, karkea tyyppi (poisto, lisäys, korvaus, siirto). Mittaa teknistä työtä entä kognitiivinen aspekti? Editointietäisyyteen perustuva arvio ei välttämättä vastaa ihmisen arviota (Koponen WMT 2012). Editointietäisyys ei välttämättä myöskään ennusta editointiaikaa (Koponen ym. WPTP 2012) 13.4.2013 8

Automaattinen laadun estimointi Editoinnin edellyttämää työmäärää pyritään ennustamaan automaattisilla laadun estimointityökaluilla. Tavoitteena on aiempien esimerkkitapausten perusteella ennustaa jotakin työläyden mittaria (ihmisarvio, HTER). Tarkan arvon ennustaminen kaikille virkkeille Tietyn raja-arvon ylittävien tai alittavien virkkeiden tunnistaminen 13.4.2013 9

Laadun estimointikoe Koe WMT12-työpajan (Callison-Burch ym. 2012) laadun estimointitehtävän aineistolla: en-es konekäännös ja editoitu versio. Aineisto koostuu 2254 virkkeestä, sanomalehtikorpus. Koetta varten aineisto jaettu kahteen osaan: opetusaineisto: 1832 virkettä testiaineisto: 422 virkettä 13.4.2013 10

Laadun estimointikoe Kolmen arvioijan virkekohtainen arvio työläydestä: (1) käsittämätön, käännettävä kokonaan (2) 50...70 % virkkeestä editoitava (3) 25...50 % virkkeestä editoitava (4) 10...25 % virkkeestä editoitava (5) vain vähän tai ei lainkaan editoitavaa Automaattinen estimointi Multilizer MT Qualifier (http://mt-quality.multilizer.com/) Erilaisia tilastollisia ja lingvistisiä sääntöjä. Pyrkimyksenä erottaa käyttökelpoisiksi arvioidut virkkeet. Kolmen arvioijan painotettu keskiarvo > 3. 13.4.2013 11

Aineisto (2254 virkettä) 13.4.2013 12

Estimointi: estimaatti vs ihmisarvio työläydestä 38 214 108 62 13.4.2013 13

Hyväksytyt ja hylätyt 13.4.2013 14

Esimerkki 1 The Montreal Impact has qualified for the semi-final round of the playoffs for the first division of USL, thanks to a 3-1 victory (4-3 in total goals) at the expense of the Seattle Sounders, yesterday, during the second and decisive game of the series quarter-finals on total goals at the Saputo Stadium. El impacto de Montreal ha clasificado para la semifinal ronda de los playoffs de la primera división de USL, gracias a un 3-1 victoria (4-3 en total objetivos) a expensas de los Seattle Sounders, ayer, durante la segunda y decisivo partido de la serie cuarto de finales de objetivos total en el Estadio Saputo. Score: 2.3 A gradual easing Un alivio progresivo Score: 4.3 13.4.2013 15

Esimerkki 1 El impacto de Montreal ha clasificado para la semifinal ronda de los playoffs de la primera división de USL, gracias a un 3-1 victoria (4-3 en total objetivos) a expensas de los Seattle Sounders, ayer, durante la segunda y decisivo partido de la serie cuarto de finales de objetivos total en el Estadio Saputo. Score: 2.3 Un alivio progresivo Score: 4.3 El Montreal Impact se ha clasificado para la ronda semifinal de los playoffs de la primera división de USL, gracias a una victoria por 3-1 (4-3 en goles totales) a expensas de los Seattle Sounders, ayer, durante el segundo y decisivo partido de la serie de cuartos de final sobre goles totales en el Estadio Saputo. TER: 25.8 Concesiones progresivas TER: 150 13.4.2013 16

Esimerkki 2 The fact that the left gave extra money to the farmers and civil servants in the face of government opinion means that there might not be enough money in the budget to cover pensions, sick pay, or building society savings. El hecho de que la izquierda dio dinero adicional a los agricultores y funcionarios en el rostro de gobierno opinión significa que podría no ser suficiente dinero en el presupuesto para cubrir las pensiones, enfermos pagan, o la construcción de la sociedad ahorros. Score: 2.5 The earlier a young Roma student starts attending school, the bigger their chances will be to become a productive member of the labour market; through the income and the taxes paid by them they would contribute to the national budget. La antes un joven estudiante romaní empieza a asistir a la escuela, la mayor sus posibilidades será a convertirse en un miembro productiva del mercado laboral; a través de los ingresos y los impuestos pagados por ellos podrían contribuir al presupuesto nacional. Score: 4.0 13.4.2013 17

Esimerkki 2 El hecho de que la izquierda dio dinero adicional a los agricultores y funcionarios en el rostro de gobierno opinión significa que podría no ser suficiente dinero en el presupuesto para cubrir las pensiones, enfermos pagan, o la construcción de la sociedad ahorros. Score: 2.5 La antes un joven estudiante romaní empieza a asistir a la escuela, la mayor sus posibilidades será a convertirse en un miembro productiva del mercado laboral; a través de los ingresos y los impuestos pagados por ellos podrían contribuir al presupuesto nacional. Score: 4.0 El hecho de que la izquierda diese dinero extra a los agricultores y funcionarios en contra de la opinión del gobierno significa que podría no haber suficiente dinero en el presupuesto para cubrir las pensiones, bajas por enfermedad o la construcción de la sociedad ahorros. TER: 23.40 Cuanto antes un joven estudiante de Roma comienza a asistir al colegio, más oportunidades tendrá de convertirse en un miembro productivo del mercado laboral; a través del ingreso y de los impuestos pagos por ellos, contribuirán al presupuesto nacional. TER: 46.51 13.4.2013 18

Esimerkki 2 El hecho de que la izquierda dio dinero adicional a los agricultores y funcionarios en el rostro de gobierno opinión significa que podría no ser suficiente dinero en el presupuesto para cubrir las pensiones, enfermos pagan, o la construcción de la sociedad ahorros. Score: 2.5 La antes un joven estudiante romaní empieza a asistir a la escuela, la mayor sus posibilidades será a convertirse en un miembro productiva del mercado laboral; a través de los ingresos y los impuestos pagados por ellos podrían contribuir al presupuesto nacional. Score: 4.0 El hecho de que la izquierda diese dinero extra a los agricultores y funcionarios en contra de la opinión del gobierno significa que podría no haber suficiente dinero en el presupuesto para cubrir las pensiones, ST: in the face of MT: en el bajas rostro por de enfermedad o la construcción PE: en contra de la sociedad ahorros. TER: 23.40 Cuanto antes un joven estudiante de Roma comienza a asistir al colegio, más oportunidades tendrá de convertirse en un miembro productivo del mercado laboral; a través del ingreso y de los impuestos pagos por ellos, contribuirán al presupuesto nacional. TER: 46.51 13.4.2013 19

Esimerkki 2 El hecho de que la izquierda dio dinero El hecho de que la izquierda diese dinero adicional a los agricultores y funcionarios ST: sick pay extra a los agricultores y funcionarios en en el rostro de gobierno opinión MT: significa enfermos contra pagan de la opinión del gobierno significa que podría no ser suficiente dinero PE: bajas en el por que enfermedad podría no haber suficiente dinero en presupuesto para cubrir las pensiones, enfermos pagan, o la construcción de la el presupuesto para cubrir las pensiones, bajas por enfermedad o la construcción sociedad ahorros. Score: de la sociedad ahorros. TER: 2.5 23.40 La antes un joven estudiante romaní empieza a asistir a la escuela, la mayor sus posibilidades será a convertirse en un miembro productiva del mercado laboral; a través de los ingresos y los impuestos pagados por ellos podrían contribuir al presupuesto nacional. Score: 4.0 Cuanto antes un joven estudiante de Roma comienza a asistir al colegio, más oportunidades tendrá de convertirse en un miembro productivo del mercado laboral; a través del ingreso y de los impuestos pagos por ellos, contribuirán al presupuesto nacional. TER: 46.51 13.4.2013 20

Yhteenvetoa Työläyden mittarina tyypillisesti käytetty editointietäisyys kuvaa vain osaa todellisesta työstä. Muita tekijöitä virkkeen sanamäärä, muutosten absoluuttinen määrä, virhetyyppi. Automaattisessa estimoinnissa pystytään erottamaan käyttökelpoisia virkkeitä varsin hyvin (tarkkuus 77 %, saanti 85 %) mutta ei virheettömästi. Tulevaa ja käynnissä olevaa työtä: Tarkemmat virkkeensisäiset analyysit Editointiajan huomioon ottaminen analyysissa Kognitiivisen työn tutkiminen: tauot, silmänliike? 13.4.2013 21

Viitteet Callison-Burch C ym. (2012) Findings of the 2012 workshop on statistical machine translation. Proceedings of the Seventh Workshop on Statistical Machine Translation Carl M, Dragsted B, Elming J, Hardt D, Jakobsen AL (2011) The process of post-editing: A pilot study. Proceedings of the 8th international NLPSC workshop. Special theme: Human-machine interaction in translation Koponen M (2012) Comparing human perceptions of post-editing effort with post-editing operations. Proceedings of the Seventh Workshop on Statistical Machine Translation Koponen M, Aziz W, Ramos L, Specia L (2012) Post-editing Time as a Measure of Cognitive Effort. Proceedings of the AMTA 2012 Workshop on Post-Editing Technology and Practice (WPTP 2012) Krings HP (2001) Repairing texts: Empirical investigations of machine translation post-editing processes. Kent, Ohio, Kent State University Press Plitt M, Masselot F (2010) A productivity test of statistical machine translation post-editing in a typical localisation context. Prague Bulletin of Mathematical Linguistics 93:7-16 Snover M, Dorr BJ, Schwartz R, Micciulla L, Makhoul J (2006) A study of translation edit rate with targeted human annotation. Proceedings of Association for Statistical Machine Translation in the Americas Snover M, Madnani N, Dorr BJ, Schwartz R (2009) Fluency, adequacy, or HTER? Exploring different human judgments with a tunable MT metric. Proceedings of the Fourth Workshop on Statistical Machine Translation 13.4.2013 22