Automaattinen käännösalusta ja Avoimen datan portaali Mitä hyötyä niistä on?

Samankaltaiset tiedostot
Euroopan unioni ja monikielisyys Verkkojen Eurooppa Automaattinen käännösalusta. Kimmo Rossi European Commission, CNECT.G3

2010/06 Euroopan unionin virallisen lehden jäsentely Lissabonin sopimuksen voimaantulosta johtuvat mukautukset Virallisen lehden L-sarja

8. Miten EU toimii? III EU:n tavoitteet ja toiminta

EUROOPAN KOMISSIO. Bryssel SEC(2011) 1507 lopullinen. Luonnos

Perustietoa IMIstä 1. IMI-TIETOA JA -APUA PERUSTIETOA IMISTÄ... 2

PSI-direktiivin tilannekatsaus

EUROOPPA - OIKEUS JA SISÄMARKKINAT. Juha Raitio

Ehdotus NEUVOSTON PÄÄTÖS

KOMISSION TÄYTÄNTÖÖNPANOPÄÄTÖS (EU) /, annettu ,

Sanastotyön tulevaisuuden näkymiä valtionhallinnossa. Sanastokeskus TSK 35 vuotta Kaisa Kuhmonen, valtioneuvoston kanslia,

Konekäännös: mitä sillä tehdään?

VASTAAVUUSTAULUKOT (*) Euroopan unionista tehty sopimus

Ehdotus NEUVOSTON TÄYTÄNTÖÖNPANOASETUS

Euroopan unionin neuvosto Bryssel, 22. syyskuuta 2016 (OR. en)

Euroopan unionin neuvosto Bryssel, 24. marraskuuta 2016 (OR. en)

9332/15 ADD 1 vp/pm/hmu 1 DG D 2A

EU-tuomioistuinasioiden johtaja

FI Moninaisuudessaan yhtenäinen FI A8-0206/587. Tarkistus

Euroopan unionin neuvosto Bryssel, 19. heinäkuuta 2016 (OR. en) Jeppe TRANHOLM-MIKKELSEN, Euroopan unionin neuvoston pääsihteeri

LIITE. Digitaalisten sisämarkkinoiden strategian täytäntöönpano. asiakirjaan

Tietoa henkilötietojesi suojasta Yleisötiedotus

Kääntäminen ja tulkkaaminen. EU:ssa EUROPEAN UNION UNION EUROPEENNE

5581/16 ADD 1 team/sl/si 1 DGE 2B

Euroopan unionin neuvosto Bryssel, 4. toukokuuta 2017 (OR. en) Jeppe TRANHOLM-MIKKELSEN, Euroopan unionin neuvoston pääsihteeri

KOMISSION DELEGOITU PÄÄTÖS, annettu ,

Kulttuuri- ja koulutusvaliokunta LAUSUNTOLUONNOS. teollisuus-, tutkimus- ja energiavaliokunnalle

Euroopan unionin neuvosto Bryssel, 30. toukokuuta 2016 (OR. en) Jeppe TRANHOLM-MIKKELSEN, Euroopan unionin neuvoston pääsihteeri

Kansallinen digitaalinen kirjasto: katsaus kokonaisuuteen

LIITE KOMISSION TIEDONANTOON EUROOPAN PARLAMENTILLE, NEUVOSTOLLE, EUROOPAN TALOUS- JA SOSIAALIKOMITEALLE JA ALUEIDEN KOMITEALLE

JHS XXX Avointen tietoaineistojen käyttölupa. Anne Kauhanen-Simanainen

Miksi oikeustulkeille tarvitaan erikoistumiskoulutusta?

toisen maksupalveludirektiivin väitettyä rikkomista koskevista valitusmenettelyistä

1716 der Beilagen XXIV. GP - Vorlage gem. Art. 23i Abs. 4 B-VG - 07 finnischer Beschluss (Normativer Teil) 1 von 8

Hankkeet ja yhteentoimivuus. OKM:n kirjastopäivät Minna Karvonen

EUROOPAN PARLAMENTIN JA NEUVOSTON ASETUS (EU, EURATOM) 2016/, annettu päivänä kuuta,

8795/2/16 REV 2 ADD 1 team/rir/ts 1 DRI

KOMISSION TIEDONANTO EUROOPAN PARLAMENTILLE. Euroopan unionin toiminnasta tehdyn sopimuksen 294 artiklan 6 kohdan mukaisesti

Ehdotus NEUVOSTON DIREKTIIVI

Ehdotus EUROOPAN PARLAMENTIN JA NEUVOSTON PÄÄTÖS

Valtuuskunnille toimitetaan oheisena asiakirja COM(2017) 134 final LIITE 1.

56. vuosikerta 16. tammikuuta 2013 Hinta: 3 EUR

Ehdotus asetukseksi yhteisestä eurooppalaisesta kauppalaista: lakimiehen kanta

FI Moninaisuudessaan yhtenäinen FI A8-0278/2. Tarkistus. Christel Schaldemose ja muita

Euroopan unionin neuvosto Bryssel, 14. joulukuuta 2017 (OR. en)

Euroopan unionin neuvosto Bryssel, 9. maaliskuuta 2018 (OR. en)

Suomi.fi julkishallinto ja julkiset palvelut yhdessä osoitteessa Suomi.fi / VM

JHS Avoimen tietoaineiston käyttölupa

PARLAMENTIN JA NEUVOSTON DIREKTIIVIKSI

FI Moninaisuudessaan yhtenäinen FI A8-0305/4. Tarkistus. Mireille D'Ornano ENF-ryhmän puolesta

KOMISSION TÄYTÄNTÖÖNPANOPÄÄTÖS (EU) /, annettu ,

Työministeriö EDUSKUNTAKIRJELMÄ TM

Eurooppalaiset lainsäädännön ja oikeuskäytännön standardit. Aki Hietanen, oikeusministeriö

FI Moninaisuudessaan yhtenäinen FI A8-0018/105. Tarkistus

Lataa Euroopan unionin toisessa jäsenvaltiossa syntyneiden sairaanhoitokustannusten korvaaminen - Anna-Kaisa Tuovinen. Lataa

Ehdotus EUROOPAN PARLAMENTIN JA NEUVOSTON PÄÄTÖS

Kansainvälisten asiain sihteeristö EU-koordinaattori Johanna Koponen

LIITTEET. ehdotukseen. Euroopan parlamentin ja neuvoston direktiivi. julkisen sektorin hallussa olevien tietojen uudelleenkäytöstä (uudelleenlaadittu)

EUROOPAN PARLAMENTTI Talousarvion valvontavaliokunta MIETINTÖLUONNOS

Committee / Commission IMCO. Meeting of / Réunion du 30/08/2011 BUDGETARY AMENDMENTS / AMENDEMENTS BUDGÉTAIRES. Rapporteur: Edvard KOŽUŠNÍK

Valtiovarainministeriö PERUSMUISTIO VM Kallela Jari(VM), Rissanen Olli- Pekka(VM) JULKINEN

Euroopan unionin neuvosto Bryssel, 21. toukokuuta 2019 (OR. en)

Eurokoodien julkaiseminen , Hanasaari Antti Karppinen, SFS

Käännösten ostajan opas

TIETOSUOJASELOSTE. Miksi tietoja kerätään? Mikä on henkilötietojen käsittelyn oikeusperusta?

PE-CONS 22/1/16 REV 1 FI

Käännösten ostajan opas

Ohjeet. keskusvastapuolten ja kauppapaikkojen tapahtumasyötteiden antamisesta arvopaperikeskusten saataville 08/06/2017 ESMA FI

1. Virkamiestuomioistuimen toiminta Vireille tulleet asiat, ratkaistut asiat, vireillä olevat asiat ( )

Maksuja koskeva tietoasiakirja

Turvallisuus- ja kemikaalivirasto (Tukes) Katri Sihvola EU:n henkilönsuojainasetus. Markkinavalvonnan toimintaperiaatteet

Ohjeet Asetuksen (EU) N:o 909/ ja 23 artiklan mukainen viranomaisten välinen yhteistyö

Talous- ja raha-asioiden valiokunta LAUSUNTOLUONNOS. sisämarkkina- ja kuluttajansuojavaliokunnalle

Ehdotus EUROOPAN PARLAMENTIN JA NEUVOSTON PÄÄTÖS

Euroopan unionin neuvosto Bryssel, 8. joulukuuta 2016 (OR. en)

EUROOPAN PARLAMENTTI Talousarvion valvontavaliokunta MIETINTÖLUONNOS

12398/17 HG/isk DGD 1. Euroopan unionin neuvosto. Bryssel, 24. lokakuuta 2017 (OR. en) 12398/17. Toimielinten välinen asia: 2017/0173 (NLE)

EU:n tavarapaketti. Talousvaliokunta

Tiina Tuurnala Merenkulkulaitos. Paikkatietomarkkinat Helsingin Messukeskus

Ehdotus. Muutos komission ehdotukseen COM(2012) 496 EUROOPAN PARLAMENTIN JA NEUVOSTON ASETUS

Sosiaali- ja terveysministeriö PERUSMUISTIO STM TSO Vänskä Anne(STM) JULKINEN. Käsittelyvaihe ja jatkokäsittelyn aikataulu

EUROOPAN KOMISSIO OIKEUS- JA KULUTTAJA-ASIOIDEN PÄÄOSASTO TIEDONANTO

12225/16 joh/kr/jk 1 DG B 1C

EUROOPAN PARLAMENTTI

KOMISSION TÄYTÄNTÖÖNPANOASETUS (EU) /, annettu ,

YRITYS EUROOPASSA. SUB Göttlngen X 96 A * * * EU-KAUPAN TIETOPAKETTI SUOMALAISELLE LIIKKEENJOHDOLLE

Kääntäminen ja tulkkaaminen. EU:ssa EUROPEAN UNION UNION EUROPEENNE

6355/17 team/pmm/hmu 1 DG D 1 A

EUROOPAN KOMISSIO VIESTINNÄN PÄÄOSASTO EU-TALLEKIRJASTO LIITE III KUMPPANUUSSOPIMUKSEEN LIITTYVÄT OHJEET

A8-0202/160

KOMISSION TÄYTÄNTÖÖNPANOPÄÄTÖS (EU) /, annettu ,

Valtioneuvoston kanslia PERUSMUISTIO VNEUS VNEUS Hulkko Johanna(VNK) JULKINEN

Hostingpalvelujen. oikeudelliset kysymykset. Viestintäviraston Abuse-seminaari Jaakko Lindgren

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Valtuuskunnille toimitetaan oheisena asiakirja COM(2017) 228 final Liite 1.

FI Moninaisuudessaan yhtenäinen FI. Tarkistus. Julia Reda Verts/ALE-ryhmän puolesta

Yhteisen tiedon hallinta -hanke Eli YTI

Committee / Commission IMCO. Meeting of / Réunion du 06/09/2012. BUDGETARY AMENDMENTS (2013 Procedure) AMENDEMENTS BUDGÉTAIRES (Procédure 2013)

EUROOPAN ALUEELLINEN YHTEISTYÖ

Tiedotus- ja keskustelutilaisuus eidas-asetuksesta ja julkisten palveluiden kehittämisestä

Valtiovarainvaliokunta

Transkriptio:

Automaattinen käännösalusta ja Avoimen datan portaali Mitä hyötyä niistä on? Kimmo Rossi Euroopan komissio, CNECT.G3 Helsinki 19.2.2016

Julkiset palvelut ja konekääntäminen Tavoitteena tukea monikielisyyttä Konekääntämisen rooli on määriteltävä EU:n nykyinen konekäännösratkaisu: MT@EC Seuraava vaihe: CEF AT 2

5 Visio Haluan käyttää minkä tahansa EU-maan julkisia verkkopalveluja omasta maastani käsin, omalla kielelläni!

Konekääntämisen rooli Konekääntäminen voi olla oikea ratkaisu, kun: halutaan ottaa selkoa vieraskielisestä asiakirjasta tai verkkosisällöstä nopeasti ja edullisesti pitää reagoida vieraskieliseen pyyntöön nopeasti, eikä ole aikaa ihmiskäännökseen verkkosivustoja monikielistetään haetaan verkosta monikielistä aineistoa tai analysoidaan suuria aineistoja automaattisesti Verkkopalvelujen yleistyessä konekääntämisen tarve lisääntyy!

Konekäännösten käyttäjät ja käyttötavat Lukija ei ymmärrä lähdekieltä Lukija ymmärtää lähdekieltä Mitä tässä tekstissä sanotaan? Mihin toimenpiteisiin tämä teksti johtaa? Oikea päätös Julkaiseminen Kääntäjät Käyttö oman käännöksen pohjana Asiantuntijat Tekstin parantelu jatkokäyttöä varten

MT@EC on julkishallinon käytettävissä! Tuotantokäyttö alkoi : 26.6.2013 Kielet : Kaikki EU:n 24 virallista kieltä Toimintaperiaate: tilastollinen käännin, perustuu avoimeen MOSES-alustaan, joka on tulosta useasta EUteknologiahankkeesta (esim. EuroMatrix, EuroMatrix+, MosesCore) Kehittäjä: DGT vuosina 2010-2013 Rahoituslähde: ISA-ohjelma (toimenpide 2.8) http://ec.europa.eu/isa/actions/02-interoperability-architecture/2-8action_en.htm 8

MT@EC kuvaus Käyttötavat: - käyttöliittymä (käyttäjänä ihminen) - sovellusliittymä (käyttäjänä tietojärjestelmä) Ominaisuudet: Käyttöliittymä 24 kielellä asiakirjan muotoilu säilyy [ei kuitenkaan pdf-tiedoston muotoilu] Koneluettavat tiedostomuodot: tmx ja xliff Käännös voidaan toimittaa myös sähköpostitse Mahdollisuus kääntää useita asiakirjoja useille kielille Viitteellinen laatuluokitus kullekin kieliparille (BLEU) Mahdollisuus antaa palautetta (EU Survey) 9

MT@EC ja tietoturva Palvelimet ovat komission datakeskuksessa Käyttäjän tunnistustapa: ECAS (EC Authentication Service) Tiedostojen siirtotavat: - stesta* - suojattu erillisverkko tietojen siirtämiseen EU:n ja kansallisten julkishallintojen välillä - internet-yhteys (suojattu https-yhteys) * Lisätietoja: https://portal.testa.eu/jetspeed/portal/homepage/about.psml. 10

Kuka voi käyttää MT@EC:tä? Euroopan unionin toimielimet: Euroopan komissio Euroopan parlamentti EU:n neuvosto EU:n tuomioistuin tilintarkastustuomioistuin talous- ja sosiaalikomitea alueiden komitea Euroopan keskuspankki Euroopan investointipankki... Verkkopalvelut, joita EU ylläpitää tai rahoittaa EU ja ETA-maiden julkishallinto 12

MT@EC rakentuu... EU-aineistolle Euramis 940 miljoonaa virkettä [vuoden 2015 lopussa] Kasvunopeus: 2,6 miljoonaa/kk 24 EU-kieltä [eri määrä aineistoa, kielen mukaan] sisältö: "EU-tekstejä" [aihepiirit ja tekstityyli] 13

MT@EC on maksuton julkishallinnon käyttäjille! Hanki ensin ECAS-tunnukset. Anna yhteystiedoksi työsähköpostiosoitteesi. https://webgate.ec.europa.eu/cas/eim/external/register.cgi Lähetä sähköposti osoitteeseen DGT-MT@ec.europa.eu ja pyydä MT@EC-käyttäjätilisi aktivointia. DGT luo sinulle käyttäjätunnuksen ja ilmoittaa sähköpostitse. 14

MT@EC:hen liitetyt verkkopalvelut (esimerkkejä) Palvelu IMI Kuvaus Sisämarkkinoiden tietojärjestelmä hallinnon sisäinen verkkopalvelu, johon kuuluu yli 7000 julkishallintoa EU:n alueella http://ec.europa.eu/internal_market/imi-net/index_en.html Käyttäjien välisten viestien kääntäminen SOLVIT nlex Verkkopalvelu sisämarkkinasääntöjen vastaisesta menettelystä johtuvien ongelmien ratkaisuun http://ec.europa.eu/solvit/ Käyttäjien välisten viestien kääntäminen Kansallisen lainsäädännön oikeusportaali http://eur-lex.europa.eu/n-lex/ Hakutulosten kääntäminen CircaBC Virtuaalinen työtila, viestien ja asiakirjojen vaihto https://circabc.europa.eu/ Asiakirjojen kääntäminen 15

Mitä tämän jälkeen? MT@EC:stä... kohti CEF:n automaattista käännösalustaa...eli lyhyemmin: CEF AT Mikä on CEF AT: se perustuu MT@EC-palveluun ja laajentaa/kehittää sitä tavoitteena suojattu, laadukas ja muunneltava käännösalusta EU:n laajuisille verkkopalveluille (ja vähän muillekin...) monikielisyyden tukialusta enemmän kuin konekäännin 16

Palvelu Europeana Sovittaminen eri verkkopalveluihin mitä verkkopalveluja CEF AT tukee? Kuvaus Euroopan digitaalikirjasto ODP EESSI ODR e-justice SaferInternet Avoimen Datan portaali, joka verkottaa kansalliset ja alueelliset avoimen data lähteet. 32 valtion välinen järjestelmä sosiaaliturvaan liittyvän tiedon vaihtoon Verkkopalvelu esim. verkkokauppaan liittyvien kuluttajariitojen ratkaisemiseen EU:n oikeusportaali Verkkopalvelu, jonka tavoitteena on tehdä internet turvalliseksi lapsille 17

Mitä hyötyjä CEF AT tuo? Nopeampi ja paremmin suojattu käännöspalvelu Monikielisyyttä tukevat EU:n laajuiset julkiset verkkopalvelut sekä: Parempi konekäännösten laatu Ottaa huomioon käyttöalan erikoispiirteet (etusijalla CEF-ohjelman kattmat verkkopalvelut) Tämä edellyttää, että erikielisiä kieliaineistoja on käytettävissä palvelun kehittämiseen

Nykytila: MT@EC kääntää sujuvasti EUtekstejä (mutta vaihtelevasti eri kielipareja) MT@EC rakentuu EU-käännöksille (Euramis) Euramiksessa on eri määrä erikielisiä tekstejä (esim 97 miljoonaa englanninkielistä, 58 miljoonaa ranskankielistä, mutta vain 2,8 miljoonaa kroatiankielistä virkettä (tyypillisesti 22-38 miljoonaa) MT@EC soveltuu EU-aiheisiin liittyvien asiatekstien, mutta ei puhekielen, kääntämiseen MT@EC kattaa useita aihealueita, mutta sitä ei ole optimoitu mihinkään niistä erityisesti. Aineistoja tarvitaan eri aihealueilta.

Avoimen datan portaalit Oikeusperusta: direktiivi 2003/98/EY julkisen sektorin hallussa olevien tietojen uudelleenkäytöstä (+ muutosdirektiivi 2013/37/EU) Kaksi eri portaalia : 1. Euroopan avoimen datan portaali: http://www.europeandataportal.eu/ verkottaa EU:n jäsenvaltioiden, alueiden ja kaupunkien avoimen datan 2. EU:n toimielinten avoimen datan portaali: https://open-data.europa.eu/

21

22

23

Avoimen datan portaalit Soveltuvat myös kieliaineistojen julkaisuun ja levittämiseen Tavoitteena on kuvausdatan (=metadatan) harmonisointi ja (monikielisen) tiedonhaun helpottaminen Tietojen tallennus, säilytys ja ylläpito pysyvät tiedon "omistajien" tehtävänä ja vastuulla CEF AT kieliaineistojen taltiointiin tarvitaan erillisratkaisu (pilvipalvelun koekäyttö alkaa 2016)

Kiitos!