Konekäännöksen laadun arviointi: Päätelmiä erityyppisten konekääntimien semanttisesta tarkkuudesta

Samankaltaiset tiedostot
Konekäännöksen laadun arviointia käännöstieteen menetelmin. KäTu-symposiumi 2010 Maarit Koponen Helsingin yliopisto Nykykielten laitos

Virheiden vaikutus konekäännöksen laatuun

Konekäännös ja käännöskone: Korvataanko kääntäjä napin painalluksella?

Choose Finland-Helsinki Valitse Finland-Helsinki

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

Lab SBS3.FARM_Hyper-V - Navigating a SharePoint site

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Kaivostoiminnan eri vaiheiden kumulatiivisten vaikutusten huomioimisen kehittäminen suomalaisessa luonnonsuojelulainsäädännössä

OP1. PreDP StudyPlan

anna minun kertoa let me tell you

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

ATLAS-kartan esittely - Peli palveluiden yhteiskehittämisen menetelmistä Päivi Pöyry-Lassila, Aalto-yliopisto

Counting quantities 1-3

Information on Finnish Language Courses Spring Semester 2017 Jenni Laine

Alueellinen yhteistoiminta

Curriculum. Gym card

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

RANTALA SARI: Sairaanhoitajan eettisten ohjeiden tunnettavuus ja niiden käyttö hoitotyön tukena sisätautien vuodeosastolla

OSAAMMEKO KAIKEN TÄMÄN?

AYYE 9/ HOUSING POLICY

Information on Finnish Courses Autumn Semester 2017 Jenni Laine & Päivi Paukku Centre for Language and Communication Studies

EUROOPAN PARLAMENTTI

Yksilön ja yhteisön etu vastakkain? Prof. Veikko Launis Lääketieteellinen etiikka Kliininen laitos, Turun yliopisto

Siirtymä maisteriohjelmiin tekniikan korkeakoulujen välillä Transfer to MSc programmes between engineering schools

You can check above like this: Start->Control Panel->Programs->find if Microsoft Lync or Microsoft Lync Attendeed is listed

Information on preparing Presentation

C470E9AC686C

TW-LTE 4G/3G. USB-modeemi (USB 2.0)

Results on the new polydrug use questions in the Finnish TDI data

EU:n lääketutkimusasetus ja eettiset toimikunnat Suomessa Mika Scheinin

Tutkimuslääkkeiden GMP. Fimea Pirjo Hänninen

Efficiency change over time

Uusia kokeellisia töitä opiskelijoiden tutkimustaitojen kehittämiseen

Voice Over LTE (VoLTE) By Miikka Poikselkä;Harri Holma;Jukka Hongisto

Capacity Utilization

Salasanan vaihto uuteen / How to change password

Viite Komission kirje Asia Suomen vastaus komissiolle kansallisten romanistrategioiden toimeenpanon edistymisestä

HISTORIAPOLITIIKKA VTT SUVI KANSIKAS EUROOPPA-TUTKIMUKSEN KESKUS HELSINGIN YLIOPISTO

Ihmisten johtaminen asiantuntijaorganisaatiossa. Heikki Wiik

GPRS-lisäpalvelu INTERNET-ASETUKSET

Arkkitehtuuritietoisku. eli mitä aina olet halunnut tietää arkkitehtuureista, muttet ole uskaltanut kysyä

Sosiaalisen median liiketoimintamallit ja käyttöön oton suunnitelma 9/23/2012

MUSEOT KULTTUURIPALVELUINA

9/11/2015 MOBILITY TOOL+ ERASMUS+ Learning Mobility of Individuals. M a n a g e m e n t. I s s u e. T o o l

Microsoft Lync 2010 Attendee

Lab A1.FARM_Hyper-V.v3

1.3 Lohkorakenne muodostetaan käyttämällä a) puolipistettä b) aaltosulkeita c) BEGIN ja END lausekkeita d) sisennystä

Rotarypiiri 1420 Piiriapurahoista myönnettävät stipendit

Käännösvirheiden vaikutus posteditoijien kykyyn muokata konekäännöstä

Bounds on non-surjective cellular automata

Calisto USB-kaiutinpuhelin. Käyttöopas

Green Growth Sessio - Millaisilla kansainvälistymismalleilla kasvumarkkinoille?

make and make and make ThinkMath 2017

1. Liikkuvat määreet

WindPRO version joulu 2012 Printed/Page :47 / 1. SHADOW - Main Result

Väite Argument "Yhteiskunnan velvollisuus on tarjota virkistysalueita ja -palveluita." "Recreation sites and service

National Building Code of Finland, Part D1, Building Water Supply and Sewerage Systems, Regulations and guidelines 2007

Ajettavat luokat: SM: S1 (25 aika-ajon nopeinta)

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

Hankkeiden vaikuttavuus: Työkaluja hankesuunnittelun tueksi

Committee / Commission PECH. Meeting of / Réunion du 29/08/2005 BUDGETARY AMENDMENTS / AMENDEMENTS BUDGÉTAIRES. Rapporteur: Jan MULDER /577852

TM ETRS-TM35FIN-ETRS89 WTG

Uusi Ajatus Löytyy Luonnosta 3 (Finnish Edition)

Vertaispalaute. Vertaispalaute, /9

TM ETRS-TM35FIN-ETRS89 WTG

Helsinki Metropolitan Area Council

HAY GROUPIN PALKKATUTKIMUS

Metsälamminkankaan tuulivoimapuiston osayleiskaava

TM ETRS-TM35FIN-ETRS89 WTG

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

Returns to Scale II. S ysteemianalyysin. Laboratorio. Esitelmä 8 Timo Salminen. Teknillinen korkeakoulu

Asiakaspalautteen merkitys laboratoriovirheiden paljastamisessa. Taustaa

Kysymys 5 Compared to the workload, the number of credits awarded was (1 credits equals 27 working hours): (4)

,0 Yes ,0 120, ,8

TM ETRS-TM35FIN-ETRS89 WTG

Yksi elämä -hanke. Kuluttajakysely Yksi elämä -hankkeesta Marraskuu 2016

WindPRO version joulu 2012 Printed/Page :42 / 1. SHADOW - Main Result

Travel Getting Around

16. Allocation Models

Ohjelmistopatentit. Vaihtoehtoinen näkökulma. Electronic Frontier Finland EFFI ry

( ( OX2 Perkkiö. Rakennuskanta. Varjostus. 9 x N131 x HH145

CALL TO ACTION! Jos aamiaistilaisuudessa esillä olleet aiheet kiinnostavat syvemminkin niin klikkaa alta lisää ja pyydä käymään!

TW-WLAN g/n MIMO USB-sovitin Asennusohje

Hankkeen toiminnot työsuunnitelman laatiminen

Tynnyrivaara, OX2 Tuulivoimahanke. ( Layout 9 x N131 x HH145. Rakennukset Asuinrakennus Lomarakennus 9 x N131 x HH145 Varjostus 1 h/a 8 h/a 20 h/a

Tietoturva ja johdon vastuu

( ,5 1 1,5 2 km

Small Number Counts to 100. Story transcript: English and Blackfoot

Miksi Suomi on Suomi (Finnish Edition)

Liikkujapalaute & korkeakoulujen palaute sopimuskaudelta

MEETING PEOPLE COMMUNICATIVE QUESTIONS

TM ETRS-TM35FIN-ETRS89 WTG

TM ETRS-TM35FIN-ETRS89 WTG

Innovative and responsible public procurement Urban Agenda kumppanuusryhmä. public-procurement

TM ETRS-TM35FIN-ETRS89 WTG

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

TM ETRS-TM35FIN-ETRS89 WTG

Transkriptio:

Konekäännöksen laadun arviointi: Päätelmiä erityyppisten konekääntimien semanttisesta tarkkuudesta Kielitieteen päivät 2010 Helsinki 20.-22.5.2010 Maarit Koponen Helsingin yliopisto, Nykykielten laitos maarit.koponen@helsinki.fi

Arviointimenetelmät Manuaaliset mikrotekstuaalinen virheanalyysi tekstin kokonaislaadun arviointi ongelmakohtia: aikaavievää subjektiivista Automaattiset tilastolliset mittarit jäsennystä hyödyntävät menetelmät ongelmakohtia: korrelaatio ihmisten arvioiden kanssa kyseenalainen

Semanttisen tarkkuuden arviointi The Commission hopes that the consultation will encourage a wide range of responses. Komissio toivoo saavansa paljon vastauksia kuulemisprosessissa. Euroopan komission käännös Komissio toivoo, että kuuleminen edistää monenlaisia vastauksia. Komissio toivoo, että neuvottelu rohkaisee laajaa valikoimaa reaktioita. Googlen konekäännös Sundan konekäännös

Esimerkkiaineisto tekstit Euroopan komission Vihreä kirja National Geographic -lehden artikkeli Norton AntiVirus ohjelman asennusohje konekäännökset tilastollinen konekäännin: Google-käännin (translate.google.com) sääntöpohjainen konekäännin: Sunda (www.sunda.fi/online_demo.html) ihmisen tekemä käännös (julkaistu)

Konekääntimet Tilastollinen: Google tilastollinen oppiminen korpukset miljardeja sanoja kohdekielen korpukset kohdistetut käännöskorpukset Sääntöpohjainen: Sunda lingvistiset säännöt 150 000 leksikkosääntöä 60 000 kontekstuaalista leksikaalista sääntöä 2 000 kielioppisääntöä

Virheanalyysi käännösvirheen määritelmä semanttinen komponentti, joka ei ole lähtö- ja kohdetekstille yhteinen semanttiset komponentit käsitteet suhd e suhteet: pääsana määrite

Virhetyypit: käsitteet poisto, lisäys, merkitys, ei käännöstä The locale places them at one of the most important geographical intersections of prehistory, and the date puts them squarely at the center of one of the most enduring mysteries in all of human evolution. Locale henkilöllä on yksi tärkeimmistä maantieteellinen leikkauspisteistä esihistoriaan, ja päivä tuo ne reilusti keskelle yksi pysyviä salaisuuksia kaikilla inhimillisen kehityksen. (Google)

Virhetyypit: käsitteet poisto, merkitys, ei käännöstä, lisäys a) Click Next. Valitse Seuraava. (ihmiskääntäjä) korvaus b) Installing and activating Norton AntiVirus Norton AntiVirus -ohjelman asennus ja aktivointi (ihmiskääntäjä) selvennys

Virhetyypit: suhteet poissa, lisätty, vaihtunut By the time scientists finished their analysis (it took the better part of six years), Spain had its earliest cold case. Mennessä, kun tutkijat saivat valmiiksi analyysi (kesti paremmin osaa kuusi vuotta), Espanja sai pian syyllinen. (Google)

Virhetyypit: suhteet poissa, lisätty, vaihtunut In the Activation panel, wait for the progress bar to stop, and then (you) click Next. Aktivointipaneelissa odottakaa tilanneilmaisimen pysähtyvän ja sitten napsahtavan seuraavaksi. (Sunda) It (treaty) provides that "not less than one million citizens who are nationals of a significant number of Member States may take the initiative Siinä (sopimuksessa) määrätään, että vähintään miljoona unionin kansalaista merkittävästä määrästä jäsenvaltioita voi tehdä aloitteen (ihmiskääntäjä) korvattu

Tulokset: käsitteet

Kompensaatiosta The bones from El Sidrón were not Republican soldiers, but the fossilized remains of a group of Neanderthals who lived, and perhaps died violently, approximately 43,000 years ago. The locale places them at one of the most important geographical intersections of prehistory, and the date puts them squarely at the center of one of the most enduring mysteries in all of human evolution. El Sidrónin luut eivät olleetkaan tasavaltalaisten vaan neandertalilaisten, jotka elivät ja kuolivat ehkä väkivallan uhreina noin 43 000 vuotta sitten. Rikospaikan perusteella he elivät yhdessä esihistorian tärkeimmistä maantieteellisistä risteyskohdista ja ajallisesti keskellä yhtä ihmisen evoluution pitkällisimmistä mysteereistä. (ihmiskääntäjä)

Tulokset: suhteet

Yhteenvetoa: käännin ja kääntäjä Konekäännin käsitteitä jää pois ja lisääntyy käsite saa väärän merkityksen käsitteiden välinen suhde puuttuu suhde tai sen osapuolet vaihtuvat Kääntäjä korvaus, implisiittinen ja eksplisiittinen tieto korvaa säilyttäen merkityksen suhde puuttuu, koska sen jäsen puuttuu suhde tai osapuolet korvattu

Yhteenvetoa: eri konekääntimet Tilastollinen käännin suhteen puuttuminen käsitteiden poistot ja lisäykset (joitakin korvauksia) suhteen jäsenten vaihtuminen Sääntöpohjainen käännin käsitteen väärä merkitys ei poista eikä lisää käsitteitä (eikä siis korvaa) jäsenten välisen suhteen vaihtuminen

Kriittisyys? kaikki virheet eivät välttämättä vaikuta lähtötekstin (virke, kappale, koko teksti) sisällön ymmärtämiseen Bensoussan, Marsha, and Judith Rosenhouse 1990. Evaluating student translations by discourse analysis. Babel 36, 65-84. virhe on kriittinen, jos se rikkoo tekstin argumentaatiorakenteen Williams, Malcolm 2001. The Application of Argumentation Theory to Translation Quality Assessment. Meta 46:2, 326 344.

Esimerkki 1 The bones from El Sidrón were not Republican soldiers, but the fossilized remains of a group of Neanderthals who lived, and perhaps died violently, approximately 43,000 years ago. The locale places them at one of the most important geographical intersections of prehistory, and the date puts them squarely at the center of one of the most enduring mysteries in all of human evolution. Luut eivät El Sidróniltä olleet republikaaniset sotilaat vaan ryhmän kivettyneet jäännökset neandertalinihmisia, jotka elivät ja ehkä kuolivat väkivaltaisesti suunnilleen 43,000 vuotta sitten. Paikka sijoittaa ne yhdessä esihistorian tärkeimmistä maantieteellisista risteyksistä, ja päivämäärä laittaa ne suoraan yhden kestävimpien arvoituksien keskukseen kaikessa inhimillisessä kehityksessä. (Sunda) Luita El Sidrón ei republikaani sotilaita, mutta fossilized edelleen ryhmän Neanderthals jotka elivät, ja ehkä kuoli väkivaltaisesti, noin 43000 vuotta sitten. Locale henkilöllä on yksi tärkeimmistä maantieteellinen leikkauspisteistä esihistoriaan, ja päivä tuo ne reilusti keskelle yksi pysyviä salaisuuksia kaikilla inhimillisen kehityksen. (Google)

Esimerkki 2 In the Activation panel, wait for the progress bar to stop, and then click Next. If the Norton Account panel appears, do one of the following: If you currently have a Norton account, complete the Sign in to an existing Norton Account section. If you want to create a new Norton Account, complete the Create a Norton Account section. Click Next. Aktivointipaneelissa odottakaa tilanneilmaisimen pysähtyvän ja sitten napsahtavan seuraavaksi. Jos Norton Accountin paneeli ilmestyy, tehkää yksi seuraavasta: Jos teillä nykyisin on Nortonin tili, täydentäkää merkkiä sisällä olemassa olevaan Norton Accountin osuuteen. Jos te haluatte luoda uuden Norton Accountin, täydentäkää, luo Norton Accountin osuuden. Napsahtakaa seuraavaksi. (Sunda)

Tuleva tutkimus semanttisten kriteerien kehittäminen testiaineisto: erityyppiset virkkeet, virheet eri virhetyyppien kriittisyyden testaaminen luetunymmärryskoe lukijan virhesietoisuuden arviointi kriteerien ja menetelmän operationalisointi automaattinen jäsennys, WordNet vähentää ajan tarvetta, parantaa objektiivisuutta

Kieliteknologia ihmisten käännösten arvioinnissa konekäännettyjen aineistojen käyttö laadunarviointimenetelmien kehittäminen ja testaaminen koneellisten menetelmien käyttö laadunvalvonta opiskelijoiden arviointi