MOLTO-konekäännösprojekti ja Grammatical Framework



Samankaltaiset tiedostot
ELM GROUP 04. Teemu Laakso Henrik Talarmo

Monikielinen konekäännös ja sen laadun arviointi MOLTO-hankkeessa

4. Lausekielinen ohjelmointi 4.1

XPages käyttö ja edut Jarkko Pietikäinen toimitusjohtaja, Netwell Oy

.NET ajoympäristö. Juha Järvensivu 2007

TIE Principles of Programming Languages CEYLON

Android ohjelmointi. Mobiiliohjelmointi 2-3T5245

Malliperustainen ohjelmistokehitys - MDE Pasi Lehtimäki

Rich Web Applications in Server-side Java without Plug-ins or JavaScript

PLA Mobiiliohjelmointi. Mika Saari

Mobiilimaailma murroksessa 2011 Tommi Teräsvirta, Tieturi

Järjestelmäarkkitehtuuri (TK081702) Järjestelmäarkkitehtuuri. Järjestelmäarkkitehtuuri

Tämä ohje on laadittu Mozilla Firefoxin asetuksille versiossa

PLA Mobiiliohjelmointi. Mika Saari

Juha Peltomäki JAMK/Teknologia

Javan asennus ja ohjeita ongelmatilanteisiin

T Ohjelmistotekniikan seminaari

Osio 4: Tietovirrat. Properties- eli ominaisuustiedostot Logger: lokitietojen käsittely

ruovedellä pohjois-hämeessä. lepounit.com (yritys) lepo.net (oma)

Avointen ohjelmistojen käyttö ohjelmistokehityksessä

Lab SBS3.FARM_Hyper-V - Navigating a SharePoint site

TIE Ohjelmistojen suunnittelu

4. Lausekielinen ohjelmointi 4.1

PixInsight. Tampereen Ursa Jouni Raunio

Tech Conference OneDrive for Business, kuinka maksimoin tuottavuuden? Jari Kotola Seniorikonsultti, MCT.

Prolog kielenä Periaatteet Yhteenveto. Prolog. Toni ja Laura Fadjukoff. 9. joulukuuta 2010

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

server "Ismo" $ uname -a Linux ismo #1 SMP Thu Sep 16 19:35:51 UTC 2010 i686 GNU/Linux $ cat /etc/issue Debian GNU/Linux 5.

CTRL+F Android-sovellus

Kieliversiointityökalu Java-ohjelmistoon. Ohje

Ohjelmiston asennusopas NPD FI

Visma Fivaldi. Ohjeet Java web startin ja HTML5-työkalun aktivointiin

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

Information on Finnish Language Courses Spring Semester 2017 Jenni Laine

Paikkatietorajapinnat IT arkkitehtuurin näkökulmasta

Ohjelmointi 1 / syksy /20: IDE

BDD (behavior-driven development) suunnittelumenetelmän käyttö open source projektissa, case: SpecFlow/.NET.

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Using the QGIS Browser

Mitä uutta ConfigMgr 2012 SP2 ja 2016? Panu Saukko ProTrainIT Oy

You can check above like this: Start->Control Panel->Programs->find if Microsoft Lync or Microsoft Lync Attendeed is listed

Security server v6 installation requirements

Skannaaminen RightFaxiin. Pääkäyttäjän opas

Ohjelmistopohjaisen lisenssin käyttö

Lumon tuotekirjaston asennusohje. Asennus- ja rekisteröintiohje

Power BI Tech Conference Power BI. #TechConfFI. Johdanto

Qt kaikkialla?

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

Tech Conference Visual Studio 2015, C#6,.NET4.6. Heikki Raatikainen. #TechConfFI

Katselupalvelujen INSPIRE-yhteensopivuuden testaus

Case TUHTI. Projektin tunnuslukuja. ! Suuri perusjärjestelmäuudistus! Työt alkoivat kesällä ! Java luokkia n. 5000

AS Teollisuuden tietojärjestelmät

Finnfoam tuotekirjaston asennusohje. Asennus ja rekisteröintiohje

W3C-teknologiat ja yhteensopivuus

.NET ja C# Virtuaalikone. Common Language Infrastructure (CLI) Periaate. Etuja. Haittoja. Mikä on CLI. CLI standardin merkitys (CLS, Ecma)

TAMFELT TAMELT. Tamfeltin Unicode-konversio

Object Framework - One. OF-1 is a high-productive Multi-UI OpenEdge data driven development framework. Veli-Matti Korhonen

INTERBASE 5.0 PÄIVITYS VERSIOON 5.6

HAKURATKAISUN ANATOMIA - KURKISTUS PELLIN ALLE

Backup Exec 3600 Appliance

Security server v6 installation requirements

tään painetussa ja käsin kirjoitetussa materiaalissa usein pienillä kreikkalaisilla

JOHDATUS TEKOÄLYYN TEEMU ROOS

Käyttöohje Planeetta Internet Oy

Tikon Web-sovellukset

Ohje olettaa, että Java on asennettu oletuskansioonsa sekä päivitetty uusimpaan versioonsa ja että selaimen latauskansiona on oletus.

Coolselector Asennusohje

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

1.3Lohkorakenne muodostetaan käyttämällä a) puolipistettä b) aaltosulkeita c) BEGIN ja END lausekkeita d) sisennystä

Laiteriippumaton UI Ajaxilla ja Javalla

Paavo Räisänen. WampServer palvelimen asennus ja käyttö Eclipsen kanssa, sekä ensimmäinen FTP yhteys.

Nopean asennuksen ohje

Pedacode Pikaopas. Java-kehitysympäristön pystyttäminen

Mark Summary Form. Taitaja Skill Number 205 Skill Tietokoneet ja verkot. Competitor Name

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Office ohjelmiston asennusohje

API:Hack Tournee 2014

CT50A2601 Käyttöjärjestelmät Androidin ja Symbianin vertailu Seminaarityö

TIEA341 Funktio-ohjelmointi 1, kevät 2008

Tech Conference Siirtyminen Skype for Businessiin ja case Tecnotree. Mika Seitsonen, Sovelto ja Eeli Hukkanen, Tecnotree.

TUTKI OMAT TIETOTURVA-AUKKOSI. ENNEN KUIN JOKU MUU TEKEE SEN PUOLESTASI. F-Secure Radar Ville Korhonen

Sisällys. Ratkaisumallien historia. Ratkaisumalli. Ratkaisumalli [2] Esimerkki: Composite [2] Esimerkki: Composite. Jaakko Vuolasto 25.1.

Office 2013 ja SQL Server 2012 SP1 uudet BI toiminnallisuudet Marko Somppi/Invenco Oy

Mathcad Prime asennus

Mobiili ennen desktoppia!

OLS for refugees webinaari

TIE PRINCIPLES OF PROGRAMMING LANGUAGES Eiffel-ohjelmointikieli

Domain spesifinen mallinnus ja generointi käytännössä. Petri Savolainen

P-touch Transfer Managerin käyttäminen

Uudessa Excel-2007 on muutettuja / uusia ominaisuuksia jotka tulee huomioida kun Excel-2003 tehtyjä sovelluksia otetaan käyttöön Excel-2007:ssä.

Mitä Piilaaksossa & globaalisti tapahtuu ja mitä Tekes voi tarjota yrityksille

TIETOKONEYLIASENTAJAN ERIKOISAMMATTITUTKINTO

M. Merikanto 2012 XML. Merkkauskieli, osa 2

Viestit-palvelun viranomaisliittymän ohjelmointiohje. Java-esimerkki

Soveltuvuustutkimus Lifebelt-ohjelman ideologian käytettävyydestä olioorientoituneeseen

ADM Arkkitehtuuritason automaatio #tdarc

SQLite selvitysraportti. Juha Veijonen, Ari Laukkanen, Matti Eronen. Maaliskuu 2010

Ohjelmointileirin järjestäminen

Transkriptio:

MOLTO-konekäännösprojekti ja Grammatical Framework monikielisissä sovelluksissa KITES-aamiaisseminaari 29. marraskuuta 2012 Seppo. Nyrkko (ät) helsinki.fi

Grammatical Framework Haskell-pohjainen, funktionaalinen ohjelmointikieli erityisesti NLP-ohjelmointiin Jäsennin + Generoija = Konekäännösympäristö Resurssikirjasto (Resource Grammar Library) 26 kieltä (myös kiina) Taivutusparadigmat, syntaktisia sääntöjä Mallileksikko (sanasto) Joitakin lauserakenteita

GF: Kielimalli

Työkaluja Eclipse plugin kielimallin kehitykseen Portable Grammar Format ajonaikaiseen käyttöön Haskell Java, in particular the Android platform JavaScript PGF runtime API for C (vrt <> Gettext-kirjasto) Binäärikääntäjä

GF: Saatavuus ja yhteensopivuus GF is open-source, licensed under GPL(the program) and LGPLand BSD(the libraries). It is available for Linux Mac OS X Windows Android mobile platform (via Java; runtime) via compilation to JavaScript / web browser (runtime)

Sovelluskohteita GF-kielimalleille Luonnollinen kieli (teksti) käyttöliittymässä Tiedon syöttö luonnollisella kielellä Puheentunnistuksen kielimallin tuottaminen Kannettavat low cpu laitteet Upotettavat gadgetit Kielen validointi

Luonnollinen kieli käyttöliittymässä Lähetetty henkilö(i)lle Sami Päivänä 29. marraskuuta Liitetiedostoja 1 Siirrä kohde Ladattu kansio kohteeseen Väliaikaiset tiedostot Lähetetty Samille Marraskuun 29:na Yksi liitetiedosto Siirrä ladattu kansio väliaikaisiin tiedostoihin

GF: Resource Language demo snyrkko@ws992:~/gf$ gf * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * This is GF version 3.3.3-darcs. 11 recorded changes since SNAPSHOT-20121022 Last recorded change: Thu Oct 25 01:40:18 EEST 2012 hallgren@chalmers.se Built on linux/x86_64 with ghc-7.4, flags: interrupt server License: see help -license. Bug reports: http://code.google.com/p/grammatical-framework/issues/list Languages: > i present/langeng.gfo linking... OK Languages: LangEng 404 msec Lang> i present/langswe.gfo linking... OK Languages: LangEng LangSwe 708 msec

GF: Resource Language demo Parsing Lang> p -lang=eng "there are cats in the boat" PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (ExistNP (AdvNP (DetCN (DetQuant IndefArt NumPl) (UseN cat_n)) (PrepNP in_prep (DetCN (DetQuant DefArt NumSg) (UseN boat_n))))))) NoVoc Parsing and linearizing Lang> p -lang=eng "there are cats in the boat" l there are cats in the boat det finns katter i båten

GF: Kielimallin kehittäminen Työmäärän parametrit Syvä jäsennys, konekäännös, vapaampi kielimalli kompleksisuus UI-tekstit, oikoluku, fragmenttikäännös, rajoitettu kieli 1 yksikkö 2 yksikköä Kielten lukumäärä

GF: Kielimallin kehittäminen Design pattern Domain-spesifi kielimalli, abstrakti osa incomplete concrete DomainI interface LexDomain abstract Domain interface Syntax * * valmiina saatava osa/ helppo toteuttaa Käsin kirjoitettava osuus

GF: Kielimallin kehittäminen Design pattern Kielispesifi osa: L={Fin, Swe, Eng,...} concrete DomainL* Leksikko LexDomainL Syntaksi SyntaxL* * valmiina saatava osa/ helppo toteuttaa Käsin kirjoitettava osuus

MOLTO-project.eu

MOLTO EU-rahoitteinen tutkimusprojekti, 2010-2013 Kattaa 12 Euroopan virallista kieltä lisäksi 3 lähialueen kieltä (Cat, Rus, Nor) 4 yliopistoa: Göteborg, Helsinki, UPC (Barcelona), UZH (Zürich) Yhteistyökumppanit: Ontotext AD (Sofia, Bulgaria) Be Informed (Apeldoorn, Alankomaat)

MOLTO Useita konekäännösmalleja Matematiikka (ongelmien ja vastausten sanallistaminen) Patentit (lääketiede, kemia) Kulttuuriperintö (museokielioppi) Tiedon sanallistaminen (ontologiahaku, semanttinen wiki) Matkaopas (Q&A, paikkoja, aikoja, lukumääriä, nimiä, laatuja)

MOLTO Työvälineitä konekäännökseen Käännössovellukset (mobiili, web, javascript) Kääntäjän työvälineet Kielimallin kehittäjän apuvälineet Hybridimallien kehittäminen Robusti jäsennys (avoimempi kielimalli)

MOLTO: Demoja ja sovelluksia Turistin monikieliopas Kääntäjän työkalut Tiedonhaku (Knowledge Retrieval) Semantic Wiki Leksikon tallennus ontologiamallissa Robusti jäsennin Hybridi käännösmalli ( Soft & Hard )

Kiitos Seppo. Nyrkko (ät) helsinki.fi www.grammaticalframework.org www.molto-project.eu