Department of Media Technology EMO

Samankaltaiset tiedostot
Capacity Utilization

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

The CCR Model and Production Correspondence

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

7.4 Variability management

C++11 seminaari, kevät Johannes Koskinen

Efficiency change over time

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

16. Allocation Models

Returns to Scale II. S ysteemianalyysin. Laboratorio. Esitelmä 8 Timo Salminen. Teknillinen korkeakoulu

NAO- ja ENO-osaamisohjelmien loppuunsaattaminen ajatuksia ja visioita

Infrastruktuurin asemoituminen kansalliseen ja kansainväliseen kenttään Outi Ala-Honkola Tiedeasiantuntija

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

anna minun kertoa let me tell you

National Building Code of Finland, Part D1, Building Water Supply and Sewerage Systems, Regulations and guidelines 2007

Use of spatial data in the new production environment and in a data warehouse

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Information on preparing Presentation

Other approaches to restrict multipliers

Curriculum. Gym card

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Sisällysluettelo Table of contents

1. Liikkuvat määreet

HARJOITUS- PAKETTI A

Results on the new polydrug use questions in the Finnish TDI data

1.3 Lohkorakenne muodostetaan käyttämällä a) puolipistettä b) aaltosulkeita c) BEGIN ja END lausekkeita d) sisennystä

Security server v6 installation requirements

Guidebook for Multicultural TUT Users

KONEISTUSKOKOONPANON TEKEMINEN NX10-YMPÄRISTÖSSÄ

Security server v6 installation requirements

BDD (behavior-driven development) suunnittelumenetelmän käyttö open source projektissa, case: SpecFlow/.NET.

AYYE 9/ HOUSING POLICY

MUSEOT KULTTUURIPALVELUINA

BLOCKCHAINS AND ODR: SMART CONTRACTS AS AN ALTERNATIVE TO ENFORCEMENT

Voice Over LTE (VoLTE) By Miikka Poikselkä;Harri Holma;Jukka Hongisto

Microsoft Lync 2010 Attendee

Choose Finland-Helsinki Valitse Finland-Helsinki

OP1. PreDP StudyPlan

make and make and make ThinkMath 2017

TIETEEN PÄIVÄT OULUSSA

Alternative DEA Models

4x4cup Rastikuvien tulkinta

ATLAS-kartan esittely - Peli palveluiden yhteiskehittämisen menetelmistä Päivi Pöyry-Lassila, Aalto-yliopisto

Semanttinen Finlex Visio ja sen toteutus

MEETING PEOPLE COMMUNICATIVE QUESTIONS

LX 70. Ominaisuuksien mittaustulokset 1-kerroksinen 2-kerroksinen. Fyysiset ominaisuudet, nimellisarvot. Kalvon ominaisuudet

TÄYTTÖAUTOMAATIT TÄYTTÖAUTOMAATIT COMPUTER INFLATORS

Land-Use Model for the Helsinki Metropolitan Area

Suihkukoneet 1:73 ja pienemmät. Potkurikoneet 1:72-1:49. Suihkukoneet 1:72-1:49. Potkurikoneet 1:35 ja suuremmat. Suihkukoneet 1:35 ja suuremmat

ECVETin soveltuvuus suomalaisiin tutkinnon perusteisiin. Case:Yrittäjyyskurssi matkailualan opiskelijoille englantilaisen opettajan toteuttamana

EVALUATION FOR THE ERASMUS+-PROJECT, STUDENTSE

Tarua vai totta: sähkön vähittäismarkkina ei toimi? Satu Viljainen Professori, sähkömarkkinat

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

E U R O O P P A L A I N E N

Tietorakenteet ja algoritmit

FinFamily Installation and importing data ( ) FinFamily Asennus / Installation

LUONNOS RT EN AGREEMENT ON BUILDING WORKS 1 THE PARTIES. May (10)

FIS IMATRAN KYLPYLÄHIIHDOT Team captains meeting


Uusia kokeellisia töitä opiskelijoiden tutkimustaitojen kehittämiseen

RANTALA SARI: Sairaanhoitajan eettisten ohjeiden tunnettavuus ja niiden käyttö hoitotyön tukena sisätautien vuodeosastolla

Olet vastuussa osaamisestasi

koiran omistajille ja kasvattajille 2013 for dog owners and breeders in 2013

LYTH-CONS CONSISTENCY TRANSMITTER

toukokuu 2011: Lukion kokeiden kehittämistyöryhmien suunnittelukokous

Arkkitehtuuritietoisku. eli mitä aina olet halunnut tietää arkkitehtuureista, muttet ole uskaltanut kysyä

Tilausvahvistus. Anttolan Urheilijat HENNA-RIIKKA HAIKONEN KUMMANNIEMENTIE 5 B RAHULA. Anttolan Urheilijat

Julkaisun laji Opinnäytetyö. Sivumäärä 43

Venttiilit ja Automaatio

Information on Finnish Courses Autumn Semester 2017 Jenni Laine & Päivi Paukku Centre for Language and Communication Studies

Liikenneverkot-tietotuote

Encapsulation. Imperative programming abstraction via subprograms Modular programming data abstraction. TTY Ohjelmistotekniikka

Basic Flute Technique

Exercise 1. (session: )

While we compile backlinks report, You can visit following handy links. Music download

Käyttöliittymät II. Käyttöliittymät I Kertaus peruskurssilta. Keskeisin kälikurssilla opittu asia?

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

Reliable diagnostic support Ultra-light design

Karkaavatko ylläpitokustannukset miten kustannukset ja tuotot johdetaan hallitusti?

Miehittämätön meriliikenne

1.3Lohkorakenne muodostetaan käyttämällä a) puolipistettä b) aaltosulkeita c) BEGIN ja END lausekkeita d) sisennystä

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

I. Principles of Pointer Year Analysis

Kysymys 5 Compared to the workload, the number of credits awarded was (1 credits equals 27 working hours): (4)

Integration of Finnish web services in WebLicht Presentation in Freudenstadt by Jussi Piitulainen

Group 2 - Dentego PTH Korvake. Peer Testing Report

SSTY:n EMC-seminaari. EMC ja sähköisten lääkintälaitteiden standardit. Ari Honkala SESKO ry

Missä mennään BI? Mikko Kontio

Lataa Legislating the blind spot - Nikolas Sellheim. Lataa

Kaivostoiminnan eri vaiheiden kumulatiivisten vaikutusten huomioimisen kehittäminen suomalaisessa luonnonsuojelulainsäädännössä

Oma sininen meresi (Finnish Edition)

You can check above like this: Start->Control Panel->Programs->find if Microsoft Lync or Microsoft Lync Attendeed is listed

VAASAN YLIOPISTO Humanististen tieteiden kandidaatin tutkinto / Filosofian maisterin tutkinto

No Problem TARJOTTIMET

Rekisteröiminen - FAQ

Travel Getting Around

Opiskelijat valtaan! TOPIC MASTER menetelmä lukion englannin opetuksessa. Tuija Kae, englannin kielen lehtori Sotungin lukio ja etälukio

812336A C++ -kielen perusteet,

Huom. tämä kulma on yhtä suuri kuin ohjauskulman muutos. lasketaan ajoneuvon keskipisteen ympyräkaaren jänteen pituus

Transkriptio:

EMO Eetu Mäkelä

EMO SLDREAI Purpose: scalable linked data repository with extensible advanced indexing Originally created for view-based & text search purposes in the massively heterogeneous environment of CultureSampo Scalable: should scale to billions of triples and allow clustering Extensible advanced indexing: should allow for efficient search using e.g. text patterns, transitive inferencing, geo-coordinates, temporal constraints, numeric ranges, etc..

Choice of EMO SLDREAI Architecture While most RDF store data structures base on B-trees originating from ER database indexing, EMO is based on the vector space model from IR (built on Lucene) This is a tradeoff: 1) EMO may lose on simple triple matching 2) Writes to the store may be slower But: 1) Supports easy implementation and efficient integration of specialized indices 2) Scaling and clustering is easy

EMO SLDREAI Specialized Indices Geocoordinate search (both of objects and triples) Temporal search (both of objects and triples) Object baseform search Numeric range search Search based on transitive inference Transitive text search (general and on a particular field) Unified view In massively heterogeneous LD environments, there are usually multiple URIs for a single thing. These are unified using sameas statements In a global search situation, its usually bad to show these as multiple objects, so EMO provides a unified view to the index, where all equivalent URIs are replaced with one of them Special indices are kept up to date as the store is modified

EMO Specialized Indices: Geo-Coordinate Search: The distribution of churches in Southern Finland

EMO Specialized Indices: Geo-Coordinate Search of 17 million objects with coordinates

EMO Specialized Indices: Temporal Entity Search: Changes in beard fashion in the late 19th century

EMO Specialized Indices: Transitive Object Search: Changes in imports from Japan to Finland in the middle 20th century

EMO Specialized Indices: Text Search: What is the position of Lemminkäinen in Finnish culture? (A search for everything related to Lemminkäinen with explanations)

EMO Specialized Indices: Transitive Text Search:

EMO SLDREAI Scalability Tested on a single machine with 2,4 billion triples, 282 million URIs, 266 million literals and 27,5 million blank nodes In theory ready for clustering, but not tested

Using EMO SLDREAI Own API Wrapper for use as a Jena Model / GraphStore Wrapper for use as a Sesame Repository

EMO SPARQL Functionality Uses Jena wrapper & ARQ ARQ allows defining custom functions but also custom property functions These are used to expose the advanced functionality of EMO SLDREAI Text search / baseform search Geo-coordinate search Transitive search URI unification Also some other functions have been added Random sampling Robust label extraction Literal mangling

EMO HTTP RDF Server SPARQL/SPARUL Uses Jena wrapper & Fuseki SPARQL Graph Store protocol Uses EMO RDFIO library picking best bits from both Jena & Sesame URILookup EMO usually cannot control the URIs stored in the repository Yet it would be nice to support the Follow Your Nose principle of Linked Data URILookup is given an URI as a parameter and returns the description of that URI as RDF, but also tags each new URI in the description with an rdfs:seealso -link back to URILookup This way, Follow Your Nose can be bootstrapped with just a single link inside EMO Search Custom search API allowing for both simple queries as well as certain forms of complex queries that would be hard or inefficient to do in pure SPARQL Mapping queries (text search finds the genre of an artist, which is mapped using a SPARQL mapping query through an event to a location) Grouping queries (with optional algorithmic group reduction) Support for view-based search (each view being defined by a SPARQL query) What's made possible by the EMO HTTP RDF Server? DEMO

Mahdollistaa lisätietojen haun sekä näytettävien tietojen valinnan tarpeen mukaan

Mahdollistaa valittavan käsiteavaruuden valinnan tarpeen mukaan (tässä 10km etäisyydellä Helsingin keskustasta olevat paikat)

Mahdollistaa käsitteiden lisäyksen omiin laajennussanastoihin Tab Lisättyä sanastoa voi myöhemmin editoida vaikkapa SAHAssa:

EMO ARPA EMO Maui integration allows an EMO repository to be used as a vocabulary for Maui (with dynamic constraining of the vocabulary by SPARQL) Uses EMO baseform index EMO SPARQL ARPA integration allows querying ARPA for automatic annotations from SPARQL Can be hooked using SPARUL back to the repository EMO VMSAAC

EMO VMSAAC DEMO

EMO VMSAAC Automaattinen asiasanoitin/nimettyjen entiteettien tunnistin ARPA kytketty takaisin EMO-palvelimeen Sekä annotointi että opetus Annotaatiot syötteenä EMO:n SAHA-editorin epävarmojen annotaatioiden arviointitoiminnallisuuteen Mahdollistaa luontevan syklin, jossa käsin tehdyn ydinopetusaineiston muodostamisen jälkeen aina uutta tekstiaineistoa indeksoidessa saadaan automaattiset ehdotukset asiasanoiksi JA nämä ehdotukset paranevat jatkuvasti työn edetessä