CIRI Ontologiaperustainen tiedonhakuliittymä



Samankaltaiset tiedostot
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Työkalu ontologioiden editointiin ja ontologiapohjaiseen tiedonhakuun

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

PubMed lääketieteellinen kokoteksti- ja viitetietokanta

Finna ja ontologiat tms.

TIEDONHAKU INTERNETISTÄ

Ovid Medline käyttöohjeita (10/2010)

Tiedonhaku korkeakouluopinnoissa

1. Johdanto. Näkökulma dokumentti kohteena on yksinkertaistettu: - www-sivu tai -sivujoukko - monimutkainen tiedontarve

Suomen kielen substantiivilla on noin 2000 erilaista muotoa vai onko sittenkään? Kimmo Kettunen, Tampereen yliopisto, informaatiotutkimuksen laitos

PIKAOHJE Web of Science tietokantojen käyttöön

Julian graafinen annotointityökalu ja erityisontologioiden editori. Jaason Haapakoski P Kansanterveyslaitos , 28.3.

Infopankin kävijäkysely tulokset

CINAHL(EBSCO) käyttöohjeita (10/2010)

Finna ja korkeakoulukirjastojen e-aineistot käyttäjätutkimusten tuloksia

Testausraportti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

ARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN

TIEDONHANKINNAN PERUSTEET (1 op) harjoitus 3 (TaY Pori syksy 2013)

TIEDONHANKINNAN PERUSTEET (1 op) harjoitus 3 (TaY Pori syksy 2014)

Web of ScienceTM Core Collection (1987-present)

NELLI PORTAALIN KÄYTTÖOPAS

aloita kirjautumalla Nelliin Diakin verkkotunnuksilla Diak kirjasto MF/2010 DIAKIN NELLI-PORTAALIN KÄYTTÖOHJE

Ilmiöprojektin tiedonhankinta

Kohti Yleistä suomalaista ontologiaa (YSO)

ONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Ilmiöprojektin tiedonhankinta

8 Tiedonhaun apuvälineet

Finton hyödyntäminen ministeriöiden palveluissa. erityisasiantuntija Pilkkuniina Brandt, VNK

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

Lappeenrannan tiedekirjasto Nelli-tiedonhakuportaalin käyttöopas

NELLI Kansallinen tiedonhakujärjestelmä

Finto-tilannekatsaus. Asiantuntijaseminaari KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Ontologiaperustaisen WebExplorer-tiedonhakujärjestelmän käyttäjätestaus eduskunnan sisäisessä tietopalvelussa ja kirjastossa.

Tiedonhaun perusteet kandityötä varten Maria Söderholm tietoasiantuntija

Iltalehti Kauppalehti Aamulehti Lapin Kansa Satakunnan Kansa Kainuun Sanomat Pohjolan Sanomat

Written by Administrator Monday, 05 September :14 - Last Updated Thursday, 23 February :36

Monihaku ja sähköiset aineistot tutuksi. Jyväskylän kaupunginkirjaston tiedonhaun koulutus

Liikkujan polku tiedonlähteille. Tutkimustietoa liikunnasta kun Google ei riitä Informaatikko Birgitta Järvinen, UKK-instituutti

Porin tiedekirjasto ja TTY:n verkkoaineistot

Tiedonhakua kandityötä varten Maria Söderholm tietoasiantuntija

Kirjastoinfo TaY Pori Porin tiedekirjasto

Uudet EU-asetukset. EUR-Lexin tarkennetun haun käyttöohje

Tauon jälkeen tutkijaksi. Informaatikko Marja Kokko

Lumme-verkkokirjaston tiedonhaun opas Pieksämäen kaupunginkirjasto

Tiedonhaku Nelli-portaalissa

PUBMED-TEHOKÄYTTÖ Työpaja

Summon tehokas monihaku

Sanomalehtien yhdenmukaisuus sananvalinnassa samoista uutisaiheista kirjoitettaessa

Tietokanta löytyy kirjaston sähköisistä aineistoista ja NELLI-portaalin kautta.

Helsingin yliopisto/tktl DO Tietokantojen perusteet, s 2000 Johdanto & yleistä Harri Laine 1. Tietokanta. Tiedosto

Sisällön automaattinen moniluokittelu. Määrittelydokumentti Versio 1.2

Visual Case 2. Miika Kasnio (C9767)

Ilmiöprojektin tiedonhankinta

Tiedonlähteille NELLIn kautta -

Kysy kirjastonhoitajalta. Linkkikirjasto. Tiedonhaun portti. Frank-monihaku. kirjastot.fi>

Nelli-portaalin käytettävyys. Saija Lukkarila Pro gradu, kevät 2005 Informaatiotutkimus, OY

TIEDONHALLINTA - SYKSY Luento 11. Hannu Markkanen /10/12 Helsinki Metropolia University of Applied Sciences

TYÖKALUT HAKUKONEOPTIMOINTIIN

Felix hakuohjeen sisältö

Algoritmit 1. Luento 5 Ti Timo Männikkö

Kyselyn tuloksia. Kysely Europassin käyttäjille

Tiedonhaun perusteet kandityötä varten Maria Söderholm tietoasiantuntija

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Ruotsin kielen yhdyssanat ja niiden morfologinen käsittely tiedonhaussa

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Hyvin toimivien hakulausekkeiden muotoilu ja hakujen onnistumiseen vaikuttavat tekijät täys- ja osittaistäsmäyttävässä hakujärjestelmässä

TIEDONHANKINNAN PERUSTEET (1 op) harjoitus 1 (TaY Pori syksy 2014)

JulkICT portaalin käyttöohje

Semanttisen tietämyksenhallinnan mahdollisuudet sosiaalityön tiedonmuodostuksessa

Käyttöliittymä. Ihmisen ja tuotteen välinen rajapinta. ei rajoitu pelkästään tietokoneisiin

-hakupalvelun käyttöohje

PubMed-opas. Itä-Suomen yliopiston kirjasto KYSin tieteellinen kirjasto helmikuu

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Kysely kirjastoille kirjastojärjestelmähankinnasta

LAADUKAS SISÄLLÖNKUVAILU -SUOSITUS

TIEDONHANKINNAN PERUSTEET (1 op) harjoitus 2 (TaY Pori syksy 2014)

Tieto- ja viestintätekniikan taitotavoitteet nivelvaiheittain

OIKEUDELLISEN TIEDONHAUN HARJOITUKSIA 5/2004

Graafinen käyttöliittymä lintujen rengastusjärjestelmään

Sisällön automaattinen moniluokittelu

Mendeley-viitteidenhallinta

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

PubMed-opas. kesäkuu 2012

Diakonia ammattikorkeakoulu Päihdetyön historia > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Kangasniemen yrityshakemisto KÄYTTÖOHJE YRITTÄJÄLLE. KANGASNIEMEN KUNTA yrityshakemisto.kangasniemi.fi

Tietojärjestelmä tuotantoympäristössä. Sovellusohjelmat Helsingin ammattikorkeakoulu Stadia / Tekniikka ja liikenne Vesa Ollikainen

VERKKOTIEDONLÄHTEET JA HAKUPALVELUT. Päivitetty: Jari Tyrväinen Pirkanmaan ammattikorkeakoulu

Porin tiedekirjasto ja TTY:n verkkoaineistot

Ryhmä tarttui toimeen päättäväisesti, täynnä ideoita. KDK:n kaltaiset aineistohakupalvelut ovat kaavamaisia, värittömiä ja puuduttavia.

Lataa Lääketieteen termit 1-2. Lataa

Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki

MINÄ OSAAN MITTARISTO INFORMAATIOLUKUTAIDON OPETUKSEEN JA ARVIOINTIIN

Aihe: Kannattaako korkeaa verenpainetta hoitaa ace-estäjillä? Löytyykö aiheesta näyttöön perustuvia tutkimuksia (EBM)?

VirtuaaliAMK Miten osallistun ryhmäkeskusteluun? > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Tiedonhakumenetelmät Tiedonhakumenetelmät, Helsingin yliopisto, tktk, k2014. H.Laine 1. Tiedonhaku Boolen haku Indeksit. Tiedonhaku?

Automaattitilausten hallinta

Transkriptio:

CIRI Ontologiaperustainen tiedonhakuliittymä Eija Airio, Kalervo Järvelin, Sari Suomela, Pirkko Saatsi ja Jaana Kekäläinen Tampereen yliopisto Informaatiotutkimuksen laitos

Ontologian kolmitasomalli kehitetty tiedonhaun tarkoituksiin tasot käsitetaso (conceptual level) hierarkkisesti järjestetty ilmaisutaso (expression level) synonyymeja luonnollista tai synteettistä kieltä jokaista käsitettä vastaa 0, 1 tai useampia ilmaisuja esiintymätaso (occurrence level) indeksiä vastaava täsmäytysmalli jokaista ilmaisua vastaa 1 tai useampi esiintymä

CIRI (Concept-based Information Retrieval Interface) perustuu kolmitasomalliin Java-servletit, SQL-kanta käytetään www-selaimen kautta graafinen ontologiaesitys käyttäjä voi selata avaamaansa ontologiaa ja valita käsitteitä hakua varten käyttäjä valitsee hakukoneen ja tietokannan valikosta

CIRI CIRI muodostaa kyselyn käyttäjän valitsemista käsitteistä, käyttäjän valitseman hakukoneen syntaksin mukaisesti käyttäjä määrää, kuinka monta tasoa hakua laajennetaan (oletuksena kolme) assosiatiivisuhteita laajennetaan vain yksi taso lähettää hakulausekkeen hakukoneelle, joka tekee haun käyttäjän valitsemasta tietokannasta

CIRI:n käyttöliittymä

CIRI:n ontologianäkymä

CIRI:n toiminta

Esiintymätason lisääminen ontologiaan ei tarvitse annotoida kunkin uuden tietokannan jokaista dokumenttia, vaan ontologian esiintymätason päivitys riittää samantyyppisille tietokannoille tarvitsee lisätä esiintymät vain kerran erilaisia tietokantatyyppejä - kutakin varten luodaan esiintymä tekstitietokannat perusmuotoindeksi stemmattu indeksi taivutusmuotoindeksi kuvatietokannat äänitietokannat

Esiintymätason lisääminen ontologiaan tekstitietokantaa varten NLP (natural language processing) työkalut parasta käyttää samaa välinettä kuin tietokannan indeksoinnissa NLP-työkalujen liittäminen ontologiaeditoriin perusmuotoindeksi normalisointityökalut yhdyssanan pilkkominen stemmattu indeksi sama stemmeri kuin indeksoinnissa taivutusmuotoindeksi, katkaisu mahdollista sanavartalogeneraattori taivutusmuotoindeksi, ei katkaisua sanavartalogeneraattori grepataan indeksiä sanavartaloilla mahdollisesti tarkistetaan normalisointityökaluilla tulos, koska indeksin greppaus tuottaa yleensä paljon roskaa

Käyttäjätestit elokuussa 2004 elintarvikealan ontologia 479 käsitettä 689 ilmaisua 2087 esiintymää 603 käsitteiden välistä suhdetta Tähän mennessä 12 testihenkilöä, jotka edustivat elintarviketeollisuuden yrityksiä ravintoloita elintarvikealaan liittyvää tietojärjestelmäyritystä elintarvikealan opiskelijoita

Käyttäjätestien taustaa osittaistäsmäyttävä INQUERY Aamulehti ja Kauppalehti artikkeleita v. 2000-2004 jokainen henkilö sai neljä testiaihetta kahdessa sai käyttää ontologiaa kaksi ilman ontologiaa aihe-järjestelmä-yhdistelmiä kierrätettiin jokainen aihe tuli tehtyä yhtä monta kertaa ontologian kanssa ja ilman tehtävien suoritusjärjestystä vaihdettiin

Käyttäjätestit tuloksia I käyttäjiltä kysyttiin, kumpaa järjestelmää oli helpompi käyttää 8 käyttäjää oli sitä mieltä, että järjestelmää oli helpompi käyttää ilman ontologiaa kahden mielestä ontologiahaku oli helpompi käyttäjiltä tiedusteltiin, kummasta järjestelmästä he pitivät enemmän 7 piti enemmän järjestelmästä ilman ontologiaa 3 piti enemmän ontologiahausta

Käyttäjätestit tuloksia II Sanastosta löytyi helposti tehtävissä tarvittavat hakusanat täysin tai melko samaa mieltä oli 8 käyttäjää Sanasto auttoi hakusanojen ideoinnissa täysin tai melko samaa mieltä oli 8 käyttäjää Sanasto auttoi jäsentämään aihetta 9 käyttäjää oli täysin tai melko samaa mieltä Sanaston käyttäminen oli työlästä 4 käyttäjää oli melko samaa mieltä 6 oli vähän tai täysin eri mieltä

Käyttäjätestien yhteenvetoa kokeessa käytetty ontologia vastasi käyttäjien sanastoa useimmat käyttäjät löysivät ontologiasta samat termit, joita itse käyttävät samoista käsitteistä ontologian rakenne oli käyttäjien mielestä looginen haku ilman ontologiaa tuotti tulosjoukon kärjessä parempia tuloksia kuin ontologiahaku käyttäjät pitivät käyttöliittymää ilman ontologiaa helpompana käyttää käyttäjien kommenteista kävi ilmi, että uuteen järjestelmään täytyisi tottua mutta hakujärjestelmän käyttö ontologian kautta oli myös helppoa useimpien käyttäjien mielestä ontologia auttoi jäsentämään hakuaihetta