Sisällön automaattinen moniluokittelu. Määrittelydokumentti Versio 1.2
|
|
- Topi Mäkelä
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 Sisällön automaattinen moniluokittelu Määrittelydokumentti Versio 1.2 Helsingin yliopisto Tietojenkäsittelytieteen laitos Ohjelmistotuotantoprojektiryhmä 5. Sisällön automaattinen moniluokittelu (Samo) Marko Konttinen Tarmo Pellikka Pia Rantalahti Kari Silén Markku Vahter Pirkko Wahlström
2 VERSIOHISTORIA Versio Pvm Kommentti Tekijä ensimmäinen versio ryhmän kommentoitavaksi Pirkko Wahlström Pia Rantalahti päivitetty ryhmän selvät kommentit, epäselvät käsitellään Pirkko Wahlström Pia Rantalahti päivitetty ryhmän kommenttien mukaan Pia Rantalahti luokkakaavio ja sekvenssikaaviot lisätty Tarmo Pellikka Päivitetty asiakkaan kommenttien mukaan. Lisätty kuvat lukuihin 1 ja 2. Valmis katselmoitavaksi Päivitetty ryhmän kommentit: korjaus kuvaan 2 ja lukuun Katselmoinnissa esiin tulleet korjaukset tehty. Hyväksytty versio. Hyväksyjät: Eero Hyvönen ja Turjo Tuohiniemi Lisätty esimerkki RDF-muotoisesta luettelokortista liitteeksi Lisätty samo- ryhmäläisten nimet kansilehdelle. Pirkko Wahlström Pia Rantalahti Pirkko Wahlström Pirkko Wahlström Pia Rantalahti Pia Rantalahti Pia Rantalahti
3 SISÄLTÖ 1 JOHDANTO PROJEKTIN ESITTELY DOKUMENTIN SISÄLTÖ SANASTO JÄRJESTELMÄN RAJAUS YLEISKUVA JÄRJESTELMÄN TOIMINTAYMPÄRISTÖSTÄ TUTKIMUKSELLINEN TAVOITE JÄRJESTELMÄN SIDOSRYHMÄT JA LIITTYMÄT TEKNINEN TOTEUTUSYMPÄRISTÖ LOPPUKÄYTTÄJÄT RAJOITUKSET JÄRJESTELMÄN TARJOAMAT PALVELUT JÄRJESTELMÄN TOIMINNALLISUUDEN KUVAUS: KÄYTTÖTAPAUKSET INDEKSOIJA MUSEOAINEISTON HAKU JÄRJESTELMÄN TIETOSISÄLLÖN KUVAUS LUOKKAKAAVIO SEKVENSSIKAAVIOT Indeksoija Museoaineiston haku YKSITYISKOHTAISET VAATIMUKSET KOKO JÄRJESTELMÄ INDEKSOIJA HAKUKONE ONTOLOGIA KÄYTTÖLIITTYMÄ...11 LIITE: ESIMERKKI RDF-MUOTOISESTA LUETTELOKORTISTA...12
4 1 1 Johdanto Tässä luvussa esitellään Samo-ohjelmistotuotantoprojekti ja sen jäsenet, tämän dokumentin sisältö ja muutamia tässä dokumentissa esiintyviä termejä. 1.1 Projektin esittely Tämä dokumentti määrittelee järjestelmän, joka toteutetaan Helsingin yliopiston tietojenkäsittelytieteen laitoksen (TKTL) sisällön automaattinen moniluokittelu (Samo) ohjelmistotuotantoprojektissa syksyllä Ohjelmistotuotantoprojektissa toteutettava järjestelmä on osa TKTL:n Semantic Computing tutkimusryhmässä kehitteillä olevaa Finnish Museums On-line (FMO) konseptia. FMO -hankkeen tarkoitus on kehittää museoille yhteiskäyttöinen www-ratkaisu Semantic Web teknologioiden pohjalta. Tässä ohjelmistotuotantoprojektissa toteutetaan FMO-ympäristöön suomen kielen ontologinen hakukone. Samo-ohjelmistotuotantoprojektiin kuuluvat projektipäällikkö Tarmo Pellikan lisäksi Marko Konttinen, Pia Rantalahti, Kari Silén, Markku Vahter ja Pirkko Wahlström. Projektin asiakas on professori Eero Hyvönen. Projektia ohjaa Jenni Valorinta ja projektin vastuuhenkilönä toimii Turjo Tuohiniemi. 1.2 Dokumentin sisältö Tämä dokumentti kuvaa toteutettavan järjestelmän toimintaympäristön ja sen rajaukset (luku 2) sekä järjestelmän tarjoamat palvelut (luku 3). Dokumentissa kuvataan sekä järjestelmän suunniteltu toiminnallisuus (luku 4) että sen tietosisältö (luku 5). Luvussa 6 on yksityiskohtainen lista järjestelmälle asetetuista vaatimuksista. 1.3 Sanasto FMO Finnish Museums On-line on konsepti, joka liittyy museoiden kokoelmien yhteiskäyttöön. Jena Jena on Java-API RDF-mallien käsittelyyn. Laventaminen Hakutermeille etsitään ontologiasta rinnakkaisia termejä ja termejä, jotka sijaitsevat käsitehierarkiassa alempana ja otetaan hakutulokseen mukaan myös näillä termeillä löydetyt luettelokortit. Ontologia Ontologia on formaali, eksplisiittinen määrittely yhteisestä käsitteistöstä. RDF Resource Description Framework on yleinen verkkoresurssien kuvauskieli. RDF:llä kuvataan URI-viittausten avulla osoitettujen verkkosisältöjen (resurssien) ja symbolien merkityksiä. RDF(S) Resource Description Framework (Schema) on kieli, jonka avulla voidaan kuvata RDF-sovelluksessa käytettävät termit ja asettaa tyyppirajoituksia olioille ja arvoille eri ominaisuuksiin liittyen. Schema Schema on malli, joka määrittelee yhtenäisen rakenteen ja sisällön. Semantic Web Semantic Web on on konsepti, jonka avulla on tarkoitus saada nykyinen tiedon visualisointiin (HTML) keskittyvä www älykkäämmäksi lisäämällä siihen erilaisia sisällöllisiä kuvauksia, semantiikkaa. Semantic Web, merkitysten Internet, konkretisoituu ontologia- ja XML-perusteisiksi semanttisiksi standardeiksi ja välineiksi, joiden avulla www:stä voidaan esittää sisältöjä.
5 2 Termi URI URL VESA XML YSA Indeksoijan tuottamia hakusanoja kutsutaan termeiksi. Uniform Resource Identifier on tunniste, jolla voidaan yksikäsitteisesti viitata mihin tahansa maailman verkon resurssiin. Uniform Resource Locator on www-linkeissä käytettävä tunniste, joilla voidaan viitata verkon tiedostoihin annetulla protokollalla. Vesa verkkosanasto on apuväline sekä painetun että elektronisen aineiston asiasanoitukseen ja aiheenmukaiseen tiedonhakuun. Extensible Markup Language on kieli, joka kuvaa tiedon rakenteen. Yleinen suomalainen asiasanasto, jota käytetään esimerkiksi Suomen yleisissä kirjastoissa aineiston sisällönkuvailussa ja tiedonhaussa. 2 Järjestelmän rajaus Tässä luvussa kerrotaan lyhyesti Samo-projektissa toteuttavan ohjelmiston liittymistä FMOympäristöön, ohjelmiston teknisestä toteutusympäristöstä, sekä ohjelmiston loppukäyttäjistä ja ohjelmiston rajoituksista. 2.1 Yleiskuva järjestelmän toimintaympäristöstä FMO hanke (katso kuva 1) pyrkii yhdistämään suomalaisten museoiden kokoelmatiedot loppukäyttäjän kannalta yhtenäiseksi selailtavaksi kokonaisuudeksi Internetiin. Kokoelmatietoja ei kuitenkaan haluta vain julkaista sellaisenaan Internetissä mielivaltaisena selailtavana linkkikokoelmana. Sen sijaan eri museoiden tiedot halutaan yhdistää kokonaisuudeksi, joka näyttäytyisi loppukäyttäjälle paitsi yhtenäisenä myös sisällöllisesti linkitettynä www-avaruutena. Helsingin yliopiston tietojenkäsittelytieteen laitoksen Semantic Computing tutkimusryhmä kehittää museoiden kokoelmatietojen yhteiskäyttöön ratkaisua Semantic Web teknologioiden pohjalta. Hankkeen testimateriaalina on Kansallismuseon, Espoon kaupunginmuseon ja Yliopiston museon (kuvatietokanta) XML Scheman mukaisesti yhtenäistetyt kokoelmatiedot. Ontology editor Ontologia RDF(S) Vocabulary Käyttäjä WWW-selain Ontogator server CLIENT SERVER Web crawler Metadata editor RDF instances: semantic interoperability XML repository: syntactic interoperability Transformer I Transformer II RDF Schema XML Schema Espoo City Museum National Museum Heterogeneous Distributed Databases Kuva 1 FMO-ympäristö
6 3 Jokaista museoesinettä vastaa sähköisessä muodossa oleva luettelokortti. Eri museoiden luettelokortit yhdistetään ensin rakenteen tasolla eli ne muunnetaan XML-muotoon (Transformer 1 ja Transformer 2) ja talletetaan yhteiseen tietokantaan (XML repository). XML Schema määrittele XML-muotoisille luettelokorteille yhtenäisen rakenteen ja sisällön. Yhtenäisen XML-rakenteen omaavat luettelokortit yhdistetään edelleen myös semanttisen tietosisällön tasolla: luettelokortit yhdistetään yhtenäiseen käsitehierarkiaan eli ontologiaan metadataeditorin avulla. RDF Schema määrittelee ontologian. Rakenteellisesti ja semanttisesti yhtenäistettyjen luettelokorttien esittämä metadata kootaan edelleen yhteiseen RDFperusteiseen semanttiseen järjestelmään (ontogator server). Sisällön automaattinen moniluokittelu ohjelmistotuotantoprojektin tavoitteena on kehittää ontologiaperustainen hakutoiminto FMO-ympäristöön. 2.2 Tutkimuksellinen tavoite Järjestelmän tarkoituksena on selvittää, miten ontologista tietoa voitaisiin hyödyntää hakukoneen toteutuksessa. Ontologia käsitetään tässä yhteydessä käsitehierarkiaksi tai luokittelujärjestelmäksi, jonka perusteella maailma jakautuu eri näkökulmiin. Esimerkiksi museokokoelman näkymiä voisivat olla esinetyyppi, materiaali, esineen ikä, valmistaja tai käyttöpaikka. Monia näistä näkymistä vastaa suoraan RDF-muotoisten luettelokorttien rakenne-elementin sisältö (katso tämän dokuementin liitteestä esimerkki RDF-muotoisesta luettelokortista). Luettelokorteissa on myös kontekstitietoa, joka on talletettu kolmella eri tavalla: luokittelu, asiasanoitus ja vapaa kuvailu. Perinteisessä hakukonetoteutuksessa laadittaisiin käänteisindeksi museo-objektin kuvailussa käytetyistä termeistä luetteloituihin tietueisiin. Haun tulokset tuotettaisiin indeksistä annettujen hakusanojen perusteella. Tällöin ei välttämättä käytetä hyväksi kaikkia luokittelun, asiasanoituksen ja vapaan kuvailun tarjoamia mahdollisuuksia. Erityisesti seuraavat perinteiseen lähestymistapaan liittyvät ongelmat pyritään ratkaisemaan Samo-projektissa ontologiatekniikoiden avulla: Semanttisten suhteiden hyödyntäminen: ontologioita voidaan käyttää suoraan hakujen laventamiseen ja leikkaamiseen semanttisten suhteiden avulla. Taivutusmuodot ja sanajohdot: Indeksoinnissa ja haussa sovelletaan Connexor Oy:n morfologista analysaattoria sanamuotojen yhteismitallistamiseksi perusmuotoon. Asiasanoituksen ja luokittelun epäyhtenäisyys: Laaja ontologia sallii joustoa erilaisiin käytäntöihin. Riittää, että nämä käytännöt tunnistetaan ja kirjataan kerran ontologiaan yhteisesti sovitulla tavalla. Yksinkertaisimmillaan ontologiassa voidaan esimerkiksi luetella eri tahojen käyttämät synonyymit. Tämän jälkeen mikä tahansa synonyymeistä tuottaa hakusanana saman tuloksen.
7 4 2.3 Järjestelmän sidosryhmät ja liittymät Kuva 2 esittää sidosryhmäkaaviota, josta ilmenee tässä projektissa toteutettavat komponentit sekä liittymät jo toteutettuihin FMO-komponentteihin. Indeksi Termejä indeksiin Indeksoija Jena-rajapinta Haun mukaiset termit Haun tulokset Kyselyt RDFtiedostoihin Hakukone Ontologia FMO-hanke Konfiguraatiotiedosto Haku sana(t) Haun tulokset Esinetiedot RDFmuodossa Tiedostoja Järjestelmän ylläpitäjä wwwkäyttöliittymä Kuva 2 Sidosryhmäkaavio Samo-projektissa toteutettavat järjestelmän osat on kuvassa erotettu harmaalla taustavärillä. 2.4 Tekninen toteutusympäristö Indeksoija on komentorivityökalu, joka hyödyntää Connexor Oy:n morfologista analysaattoria. Indeksitermit talletetaan indeksitietokantaan, jonka tyyppi määritellään tarkemmin myöhemmin. Ontologioiden käsittelyyn käytetään Jenaa. Hakukone ja www-käyttöliittymä toteutetaan Javalla TKTL:n ympäristössä käytössä olevalla versiolla Käyttöliittymä toimii ainakin Mozilla 6 ja Internet Explorer 5.5 selaimilla. 2.5 Loppukäyttäjät Kuka tahansa www-käyttäjä, samoin kuin museohenkilökunta itse, voi ohjelmiston avulla hakea aineistoa museoiden kokoelmista. WWW-käyttäjät voivat tiedoiltaan ja taidoiltaan poiketa toisistaan paljonkin.
8 5 Indeksin tekijä tuottaa toteutettavan ohjelmiston avulla RDF-muotoisista luettelokorteista indeksin. 2.6 Rajoitukset Indeksoija indeksoi RDF-muotoisia tietueita. Testiaineistona käytetään Tietojenkäsittelytieteen laitoksella tehtyä tekstiilialan testiontologiaa ja YSAn RDF(S) versiota. Järjestelmän toimivuus osoitetaan kahdella aineistolla: Kansallismuseon esinetietokanta Ateneumin kuvatietokanta 3 Järjestelmän tarjoamat palvelut Järjestelmä tarjoaa hakukoneen (tiedon etsiminen hakusanan tai -sanojen perusteella) Järjestelmä osaa tehdä haun käyttäjän antaman hakusanan, sanaliiton tai Boolen logiikan mukaisen haun. Hakukone osaa lukea ontologioita ja indeksiä. Järjestelmä osaa lukea ontologian RDF(S)-muotoisena tiedostona ja käyttää ontologioita hakusanojen laventamiseen. Hakukone osaa hakea käyttäjän antamaa Boolen logiikan mukaista hakua vastaavat termit indeksistä, esimerkiksi t1 & -t2, t3&t2, t4, jossa t1-t4 vastaavat hakusanoja ja merkit & ja - Boolen operaattoreita JA ja EI. Katso esimerkkejä Boolen operaattoreista ja niiden käytöstä luvussa 4.2 esitetystä käyttötapauksesta. Hakukone osaa tulostaa haun tulokset käyttäjälle niiden relevanssin mukaan järjestettynä. Relevanssin laskemiseen käytettävä metriikka määritellään myöhemmin. Virhetilanteessa järjestelmä tulostaa virheilmoituksen. WWW-käyttöliittymä tiedon etsimiseen hakusanan tai -sanojen avulla Järjestelmä tarjoaa www-pohjaisen käyttöliittymän tietojen etsimiseen ja haun tuloksen näyttämiseen. Järjestelmä tulostaa käyttäjälle haun tulokset URL-listana. Lista muodostuu RDFkorteista. Järjestelmä osaa avata käyttäjän valitseman hakutuloksen helposti luettavassa muodossa mahdollisen korttiin liittyvän kuvan kanssa. Järjestelmä osaa muodostaa indeksin Indeksointiin käytetään Connexor Oy:n valmista työkalua. Tällöin indeksi saadaan automaattisesti. Syötteeksi indeksoijalle annetaan konfiguraatiotiedosto, indeksi ja indeksoitavat RDFtiedostot. Konfiguraatiotiedosto määrittelee, mitä elementtejä RDF-tiedostosta indeksoidaan. Tuloksena saadaan valmis indeksi, jossa indeksin hakusanoilla on valmiiksi laskettu painoarvo väliltä
9 6 4 Järjestelmän toiminnallisuuden kuvaus: käyttötapaukset Tässä luvussa esitellään toteutettavan ohjelmiston toiminnallisuus kahtena käyttötapauksena, jotka ovat indeksoija ja museoaineiston haku. 4.1 Indeksoija Käyttäjä: Museotyöntekijät päivittävät museoesineitä kuvaavia RDF-muotoisia luettelokortteja ja luovat uusia kortteja. Ohjelmiston ylläpitäjä voi käynnistää indeksoinnin aina halutessaan. Tällöin koko RDF-materiaali indeksoidaan kokonaisuudessaan uudelleen. Syöte: Indeksoija on komentorivityökalu, joka saa syötteenään XSL-muotoisen konfiguraatiotiedoston, indeksoitavien RDF-muotoisten luettelokorttien osoitteet sekä indeksitietokannan osoitteen. Indeksoija lukee konfiguraatiotiedostosta tiedon siitä, mitkä RDF-tiedoston kentät indeksoidaan. Toiminta: Indeksoija lukee konfiguraatiotiedostosta indeksoitavat elementit ja poimii syötteenä saaduista RDF-muotoisista luettelokorteista vastaavien kenttien sisällöt indeksoitavaksi. Tämän jälkeen indeksoija palauttaa termit morfologisen analyysin perusteella perusmuotoon. Indeksoija poimii indeksitermeiksi vain substantiivit. Jokaisesta termistä talletetaan myös tieto siitä, mistä RDF-kortin kentästä termi on poimittu. Tämän jälkeen termit, niiden kenttätieto ja viittaukset RDF-korttiin, jossa termi esiintyy, talletetaan indeksiin. Sijaintiviittaus voi olla esimerkiksi URI. Katso myös käyttötapausta vastaava sekvenssikaavio luvussa Tuloste: Termistä talletetaan indeksiin itse termi, luettelokortin kenttä, josta termi löytyi sekä viittaus RDF-kortin sijaintiin. Päivityksen jälkeen indeksitietokannan sisältö vastaa luettelokorttien sisältöä. Virhetilanteet ja niistä toipuminen: Konfiguraatiotiedostoa ei ole tai se on korruptoitunut: virheilmoitus käyttäjälle. RDF-kortteja ei ole tai niistä ei löydy indeksoitavia kenttiä: virheilmoitus käyttäjälle. Indeksitietokantaa ei voida päivittää: virheilmoitus käyttäjälle. Virheilmoitukset tulostetaan stderriin. 4.2 Museoaineiston haku Käyttäjä: Kuka tahansa www-käyttäjä voi samoilun eli www-sivujen ja linkkien selailun lisäksi käyttää hakutoimintoa löytääkseen haluamaansa aineistoa museoiden kokoelmista. Syöte: Hakukone saa syötteen sekä käyttäjältä www-käyttöliittymän kautta että konfiguraatiotiedostosta. Hakukone lukee konfiguraatiotiedostosta tiedon siitä, mistä RDF-tiedoston kentistä löytyneille hakusanoille annetaan suurin painoarvo ja järjestelee hakutuloksen painoarvon mukaiseen järjestykseen. Käyttäjä antaa www-käyttöliittymässä yhden tai useampia hakusanoja. Hakusanojen muotoa ei ole rajoitettu. Lisäksi käyttäjä voi yhdistellä hakusanoja Boolen operaattoreilla. Hakukone hyväksyy syötteekseen JA-, TAI- sekä EI- operaattoreilla muodostetut hakulauseet, joista
10 7 seuraavassa annetaan esimerkit. Boolen operaattorit syötetään hakulauseessa suuraakkosin ja suomen kielellä. JA-operaattori (looginen konjunktio) kaventaa hakua. JA-operaattoria käytetään silloin, kun halutaan JA-operaattorilla yhdistettyjen hakusanojen esiintyvän samassa dokumentissa. Esimerkiksi hakulause kissat JA koirat antaa hakutulokseksi vain ne dokumentit, joissa esiintyy molemmat hakusanat. TAI-operaattori (looginen disjunktio) laajentaa hakua. TAI-operaattoria voidaan käyttää laajentamaan hakua koskemaan hakutermien synonyymeja tai muita läheisiä sanoja. Esimerkiksi hakulause kissat TAI katit antaa tulokseksi ne dokumentit, joissa esiintyy molemmat hakusanat tai toinen niistä. EI-operaattori (looginen negaatio) karsii hakutulosta. EI-operaattori sulkee pois sanat ja käsitteet, joiden ei haluta esiintyvän hakutuloksessa. Esimerkiksi hakulause koirat EI lelukoirat rajaa lelukoirat hakutuloksen ulkopuolelle. Sulkeita voidaan käyttää hakusanojen ryhmittelyssä. Sanaliitot tai fraasit erotetaan lainausmerkeillä, esimerkiksi Suomen lippu. Lisäksi käyttäjä voi määritellä, haluaako hän hakutulokseen sisältyvän vain hakulauseessa olevat sanat tai kuinka monta hierarkiatasoa hakusanoja laajennetaan ontologiahierarkiassa. Toiminta: Hakukone vastaanottaa käyttöliittymään syötetyn hakulauseen. Jos hakulause sisältää Boolen operaattoreita, hakukone ratkaisee niiden merkityksen. Hakukone käyttää morfologista analysaattoria palauttamaan hakusanat perusmuotoon. Hakusanat lavennetaan ontologian perusteella eli käsitehierarkiasta etsitään hakusanojen suppeammat termit hierarkiassa alaspäin. Oletusarvoisesti hakusanat laajennetaan yksi hierarkiataso alaspäin. Myös hakutermien mahdolliset synonyymit etsitään ontologiasta. Löydetyt hakusanat, tieto siitä, missä RDF-tiedoston kentässä sana on esiintynyt ja sanoja vastaavien RDF-tiedostojen sijaintitiedot etsitään indeksistä. Hakukone lukee konfiguraatiotiedostosta tiedon siitä, missä RDF-tiedoston kentässä esiintyneet sanat saavat suuremman painoarvon ja järjestelee hakutuloksen painoarvon mukaiseen järjestykseen. Esimerkiksi asiasanakentässä esiintynyt sana voi saada suuremman painoarvon kuin vapaatekstikentässä esiintynyt sana. Hakutulos tulostetaan käyttöliittymään käyttäjän selattavaksi. Katso myös käyttötapausta vastaava sekvenssikaavio luvussa Tuloste: WWW-käyttöliittymään tulostuu käyttäjän selailtavaksi painoarvon mukaisesti järjestetty linkkilista hakutuloksista. Linkkiä klikkaamalla käyttäjä pääsee lukemaan HTML-muotoon konvertoitua RDF-tiedostoa. Myös tiedostoon mahdollisesti liittyvät kuvat tulostetaan wwwkäyttöliittymään. Virhetilanteet ja niistä toipuminen: Tietokanta tai ontologia ei ole käytössä: käyttöliittymään tulostetaan virheilmoitus käyttäjälle.
11 8 5 Järjestelmän tietosisällön kuvaus Tässä luvussa kuvataan toteutettavan ohjemiston tietosisältö luokkakaaviona sekä esitetään luvussa 4 kuvattuja käyttötapauksia vastaavat sekvenssikaaviot. 5.1 Luokkakaavio Järjestelmä voidaan jakaa neljään toteutettavaan osajärjestelmään: indeksoija, hakukone, ontologia ja käyttöliittymä. Seuraavassa kuvassa esitetään järjestelmää vastaava luokkakaavio. IndexMain Indexer Term + main (args : String[]) - index (index : Index, urls : File, xslconfig : file) + createindexer () : Indexer 1 + feedtext (text : String) + getterms () : Term[] produces # Term (keyword : String) + getname () : string + getdocuments () : DocumentRef[] + setdocumentlocations (loc : URL) 0..* javax.servlet.http.httpservlet SearchServlet 1 Index + add (t : Term) + getterm (keyword : String) : 1 0..* DocumentRef - weight : float - location : + doget (request : HttpServletRequest, response : Http 0..* Ontology 1 + gethyponyms (keyword : String) : string[] uses -> <- uses 0..* SearchEngine 1 + search (str : String) : Document Ref[] + setontology (o : Ontology) : void 1..* + parse () : void Kuva 3 Luokkakaavio DocumentRef Termiin liittyy painoarvo ja sijainti. Index (Indeksi) Indeksi on tietokanta, johon termit on tallennettu. Indexer (Indeksoija) Indeksoija tuottaa RDF-korteista termit ja tallettaa ne indeksitietokantaan. IndexMain Indeksoija saa syötteenä RDF-kortit, XSL-muotoisen konfiguraatiotiedoston ja indeksitietokannan sijainnin. Konfiguraatiotiedostossa kerrotaan, mitkä elementit RDF-korteista on tarkoitus indeksoida. Ontology (Ontologia) Haun perustana käytettävät sanastot ja luokittelut ovat RDF(S)-muodossa olevia ontologioita. Periaatteessa mikä tahansa RDF(S)-sanastojen joukko voi olla haun perustana.
12 9 SearchEngine (Hakukone) Hakukone käyttää RDF-tietovarastoa, indeksiä ja ontologioita. Hakulauseessa voidaan käyttää Boolen operaattoreita. SearchServlet Vastaanottaa käyttäjän hakuja ja välittää hakukoneen tulokset käyttäjälle. Term Sisältää indeksiin lisättävän termin tiedot. 5.2 Sekvenssikaaviot Indeksoija Kuva 4 esittää luvussa 4.1 kuvatun käyttötapauksen, indeksoija, sekvenssikaaviona. : IndexMain : Index : Indexer : Term : indeksoija main (String[]) createindexer ( ) createindex ( ) index (Index, File, file) feedtext (String) getterms ( ) setdocumentlocations (URL) add (Term) for each URL in the list Kuva 4. Indeksin päivittäminen käyttötapaus sekvenssikaaviona.
13 Museoaineiston haku Kuva 5 esittää luvussa 4.2 kuvatun käyttötapauksen, museoaineiston haku, sekvenssikaaviona. : SearchServlet : SearchEngine : Index : Ontology : HTML-sivu doget (HttpServletRequest, HttpServletResponse) search (String) parse ( ) gethyponyms (String) getterm (String) calc ( ) Kuva 5. Museoaineiston haku käyttötapaus sekvenssikaaviona 6 Yksityiskohtaiset vaatimukset Tässä luvussa luetellaan tärkeimmät vaatimukset paitsi koko järjestelmälle myös erikseen indeksoijalle, hakukoneelle, ontologialle ja käyttöliittymälle. 6.1 Koko järjestelmä Yleiskäyttöisyys Järjestelmä ei ota kantaa ontologian tai RDF-tietovaraston sisältöön vaan on tässä suhteessa yleiskäyttöinen. Järjestelmän toimivuus osoitetaan kahdella aineistolla: Kansallismuseon esinetietokanta Ateneumin kuvatietokanta Käytettävyys Järjestelmän tulee olla helppokäyttöinen ja intuitiivinen. Käyttöliittymän tulee neuvoa käyttäjää. Ylläpidettävyys Järjestelmä toteutetaan niin, että sen ylläpitäjän on helppo vaihtaa konfiguraatiotietoja. Dokumentointi Järjestelmän mukana asiakkaalle toimitetaan järjestelmän käyttöohje (Help-valintana hakukoneen käyttoliittymässä) sekä ohje indeksin tekemiseen. 6.2 Indeksoija RDF-kortilta on voitava valita ne elementit, jotka otetaan mukaan indeksiin.
14 11 Indeksoija tuottaa termejä, jotka voidaan tallettaa tietokantamuotoisen indeksiin. Indeksiin talletetaan termien lisäksi tieto, missä RDF-kortin kentässä termi on sijainnut sekä viittaus RDF-korttiin. 6.3 Hakukone Ottaa syötteekseen hakulauseen ja konfiguraatiotiedoston ja käyttää RDF-tietovarastoa, indeksitietokantaa ja ontologiaa. Hakulause voi olla yksittäinen sanaliitto, hakutermi tai monta termiä yhdistettynä Boolen operaattoreilla. Hakukone analysoi hakulauseen eli palauttaa hakusanat perusmuotoon Connexorin työkalua käyttäen sekä analysoi mahdollisten Boolen operaattorien merkitykset. Hakukone antaa uudelleenmuotoillun hakulauseen ontologia-osiolle lavennettavaksi. Hakukone etsii indeksistä ontologiasta löytyneet termit. Hakutulos esitetään konfiguraatiotiedoston osoittamassa järjestyksessä. 6.4 Ontologia Ontologiaosajärjestelmä käyttää Jenaa ontologioiden käsittelyyn. Ontologiaosajärjestelmä saa hakukoneelta hakulauseen. Ontologiaosajärjestelmä etsii ontologiasta hakutermien synonyymit. Ontologiaosajärjestelmä etsii ontologiasta hakusanojen alakäsitteet niin monesta hierarkiatasosta kuin hakulauseessa määritellään. 6.5 Käyttöliittymä Indeksoija on komentorivityökalu. Hakukoneen www-käyttöliittymä toimii Internetissä yleisimmillä selaimilla. Hakukoneen www-käyttöliittymään siihen sisältyy lyhyt ohjedokumentti.
15 12 LIITE: Esimerkki RDF-muotoisesta luettelokortista <rdf:rdf xmlns:rdf=' xmlns:ns0=' > <rdf:description rdf:about=' yijyt_1'> <rdf:type rdf:resource=' <NS0:synonyyminimi>RÄtti</NS0:synonyyminimi> <NS0:MASA_asiasanoitus> _asiasanoitus> <NS0:tekstiilikuidun_nimi> t_eli_puuvilla</ns0:tekstiilikuidun_nimi> <NS0:objektin_nimi>ryijy</NS0:objektin_nimi> <NS0:omistajat> 13_Yhdistys_2</NS0:omistajat> <NS0:valmistajat> </NS0:valmistajat> </rdf:description> <rdf:description rdf:about=' hdistys_2'> <rdf:type rdf:resource=' <NS0:osoite>Helsinki</NS0:osoite> <NS0:tunniste>Museovirasto</NS0:tunniste> </rdf:description> </rdf:rdf>
Sisällön automaattinen moniluokittelu
Sisällön automaattinen moniluokittelu Käyttöohje v0.2 Helsinki 3. joulukuuta 2002 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Ohjelmistotuotantoprojekti samo Marko Konttinen Tarmo Pellikka Pia
LisätiedotVisio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä
Semantic Web - kohti uutta merkitysten Internetiä Prof. Eero Hyvönen Helsingin yliopisto Helsinki Institute for Information Technology 1-marras-01 1 Visio tulevaisuuden Webistä Mitä hyötyä on Webistä?
LisätiedotONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa
ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa Sisällönkuvailun koulutuspäivä erikoiskirjastoille 14.5.2014 Ontologiat Ontologia Tunnisteet Koneluettavat suhteet Termeistä käsitteisiin Monikielisyys
LisätiedotSisällön automaattinen moniluokittelu Suunnitteludokumentti v1.01
Sisällön automaattinen moniluokittelu Suunnitteludokumentti v1.01 Helsinki 4. marraskuuta 2002 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Ohjelmistotuotantoprojekti samo Marko Konttinen Tarmo
LisätiedotEero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja
Eero Hyvönen Semanttinen web Linkitetyn avoimen datan käsikirja WSOY:n kirjallisuussäätiö on tukenut teoksen kirjoittamista Copyright 2018 Eero Hyvönen & Gaudeamus Gaudeamus Oy www.gaudeamus.fi Kansi:
LisätiedotTestausraportti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
Testausraportti Orava Helsinki 5.5.2005 Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Kurssi 581260 Ohjelmistotuotantoprojekti (6 ov) Projektiryhmä Juhani Bergström Peter
LisätiedotCIRI Ontologiaperustainen tiedonhakuliittymä
CIRI Ontologiaperustainen tiedonhakuliittymä Eija Airio, Kalervo Järvelin, Sari Suomela, Pirkko Saatsi ja Jaana Kekäläinen Tampereen yliopisto Informaatiotutkimuksen laitos Ontologian kolmitasomalli kehitetty
LisätiedotSisällön automaattinen moniluokittelu Toteutusdokumentti v0.6
Sisällön automaattinen moniluokittelu Toteutusdokumentti v0.6 Helsinki 29. marraskuuta 2002 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Ohjelmistotuotantoprojekti Samo Marko Konttinen Tarmo Pellikka
LisätiedotVinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa
Vinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa Katja Pietilä / Musiikkiosasto 23.9.2017 Sisältö Verkkokirjaston aloitussivu Tarkan haun aloitussivu Hakutuloksen lukeminen Kokonaisten julkaisujen
LisätiedotOntologiat merkitysten mallintamisessa: OWL. Eeva Ahonen
Ontologiat merkitysten mallintamisessa: OWL Eeva Ahonen 1.11.2004 Semanttinen tieto käsitemallit ihmisillä sisäiset mallit maailmantieto tarvitaan tekstin tulkitsemiseen tietokoneelle esim. sanat vain
LisätiedotTIEDONHAKU INTERNETISTÄ
TIEDONHAKU INTERNETISTÄ Internetistä löytyy hyvin paljon tietoa. Tietoa ei ole mitenkään järjestetty, joten tiedonhaku voi olla hankalaa. Tieto myös muuttuu jatkuvasti. Tänään tehty tiedonhaku ei anna
LisätiedotCINAHL(EBSCO) käyttöohjeita (10/2010)
CINAHL(EBSCO) käyttöohjeita (10/2010) Sisältö 1. Katkaisumerkki, sanojen yhdistely, fraasihaku... - 1-2. Advanced Search haku vapailla hakusanoilla... - 1-3. Haku asiasanoilla (CINAHL Headings)... - 2-4.
LisätiedotONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA
ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA ONKI julkistustilaisuus 12.9.2008 Jouni Tuominen, Matias Frosterus Semantic Computing Research
LisätiedotWeb of ScienceTM Core Collection (1987-present)
Tampereen yliopiston kirjasto 2014 Web of ScienceTM Core Collection (1987-present) Science Citation Index Expanded (1987-present): Monitieteinen tietokanta, joka sisältää 8,500 tieteellistä lehteä luonnontieteiden,
LisätiedotTiedonlouhinta rakenteisista dokumenteista (seminaarityö)
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/
LisätiedotSemantic Web Sisältötuotannon ja palveluiden tulevaisuus
Semantic Web Sisältötuotannon ja palveluiden tulevaisuus Prof. Eero Hyvönen Helsingin yliopisto ja Helsinki Institute for Information Technology (HIIT) Semantic Computing Research Group http://cs.helsinki.fi/group/seco/
LisätiedotPubMed lääketieteellinen kokoteksti- ja viitetietokanta
PubMed lääketieteellinen kokoteksti- ja viitetietokanta Linkki: http://www.ncbi.nlm.nih.gov/entrez PubMed-tietokanta on internetissä vapaasti käytettävissä. Tietokanta sisältää yli 16 miljoonaa viitettä
LisätiedotVaatimusdokumentti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
Vaatimusdokumentti Orava Helsinki 5.5.2005 Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Kurssi 581260 Ohjelmistotuotantoprojekti (6 ov) Projektiryhmä Juhani Bergström
LisätiedotYlläpitodokumentti. Boa Open Access. Helsinki 2.5.2006 Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
Ylläpitodokumentti Boa Open Access Helsinki 2.5.2006 Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Kurssi 581260 Ohjelmistotuotantoprojekti (6 ov) Projektiryhmä Ilmari
LisätiedotLuento 12: XML ja metatieto
Luento 12: XML ja metatieto AS-0.110 XML-kuvauskielten perusteet Janne Kalliola XML ja metatieto Metatieto rakenne sanasto Resource Description Framework graafikuvaus XML Semanttinen Web agentit 2 1 Metatieto
LisätiedotTiedonhaku. Esim. kymenlaakso muutosjohtami* Laila Hirvisaari Tuntematon sotilas Ruksi tyhjentää hakukentän.
Tiedonhaku Kirjoita hakukenttään teoksen nimi, tekijä, aihe tai muita asiaan liittyviä hakusanoja. Tarvittaessa katkaise hakusana tähdellä *. Tällöin haku löytää kaikki niin alkavat sanat. Esim. hakusana
Lisätiedotstandardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu kim.viljanen@tkk.fi
Semanttisen webin standardit (W3C, ISO) ja teknologiat Kim Viljanen Kim Viljanen Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu kim.viljanen@tkk.fi SeCon Semantic web -patteristo XML Finland
LisätiedotW3C-teknologiat ja yhteensopivuus
W3C-teknologiat ja yhteensopivuus Ossi Nykänen Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto Esitelmä Hyvin lyhyt versio: W3C asettaa
LisätiedotFinna ja ontologiat tms.
Finna ja ontologiat tms. Erkki Tolonen 3.9.2014 Finna.fi - taustaa FINNA on osa Kansallinen digitaalinen kirjasto hanketta, sen asiakasliittymä, joka on toteutettu avoimen lähdekoodin ohjelmistojen päälle.
LisätiedotAutomaattinen semanttinen annotointi
Automaattinen semanttinen annotointi Matias Frosterus, Reetta Sinkkilä, Katariina Nyberg Semantic Computing Research Group (SeCo) School of Science and Technology, Department of Media Technology and University
LisätiedotToiminnalliset ja ei-toiminnalliset vaatimukset Tunnus (ID) Vaatimus Vaatimuksen
Vaatimusluettelo versio 0.17 Toiminnalliset ja ei-toiminnalliset vaatimukset Tunnus (ID) Vaatimus Vaatimuksen Yleiset vaatimukset 1 Koodistopalvelujärjestelmä on selainkäyttöinen 2 Käyttöliittymän tulee
LisätiedotOvid Medline käyttöohjeita (10/2010)
Ovid Medline käyttöohjeita (10/2010) Sisältö 1. Pikahaku - Basic Search:... - 1-2. Tarkennettu haku asiasanoilla - Advanced Ovid Search... - 1-3. Tulosjoukkojen yhdistely... - 5-4. Vapaasanahaku yksittäisellä
LisätiedotSemanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen
Semanttisen webin käyttöliittymäratkaisut Tiedonhallinta semanttisessa webissä Osma Suominen 21.11.2005 Käyttäjän näkökulma semanttinen web ei yleisty, ennen kuin sille on kysyntää ja käyttöä semanttisen
Lisätiedot8 Tiedonhaun apuvälineet
8 Tiedonhaun apuvälineet Tämän luentokerran tavoitteena on perehtyä erilaisiin tiedonhaun apuvälineisiin. Tiedonhaun ja hypermedian asiantuntijat katsovat maailmaa eri näkökulmista; pian tullaan huomaamaan,
LisätiedotKohti kansallista semanttisen webin sisältöinfrastruktuuria
Kohti kansallista semanttisen webin sisältöinfrastruktuuria Prof. Eero Hyvönen TKK Viestintätekniikan laboratorio Helsingin yliopisto, tietojenkäsittelytieteen laitos Tietotekniikan tutkimuslaitos HIIT
LisätiedotMiten ja miksi asiasanastoista kehitetään ontologioita
Miten ja miksi asiasanastoista kehitetään ontologioita Katri Seppälä Semanttisen laskennan tutkimusryhmä (SeCo) Teknillinen korkeakoulu, mediatekniikan laitos; Helsingin yliopisto, tietojenkäsittelytieteen
LisätiedotSisällönkuvailun tulevaisuus: YSA vai YSO?
Sisällönkuvailun tulevaisuus: YSA vai YSO? Eeva Kärki Kansalliskirjasto 22.1.2009 YSA YSO YSA YSO: eroja Selvitettävää Osoitteita Agenda 1 Tesaurukset ja ontologiat molemmat ovat käsitejärjestelmän kuvauksia
LisätiedotPIKAOHJE Web of Science tietokantojen käyttöön
PIKAOHJE Web of Science tietokantojen käyttöön SCIENCE CITATION INDEX Monitieteinen tietokanta, joka sisältää biologian, lääketieteen ja psykiatrian alalta n. 7100 lehteä SOCIAL SCIENCES CITATION INDEX
LisätiedotEsityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet
Semantic Computing Research Group University of Helsinki Kokoelmatietojen siirto MuseoSuomi-järjestelmään Mirva Salminen mirva.salminen@cs.helsinki.fi Semantic Computing Research Group (seco) University
LisätiedotSuvi Junes/Pauliina Munter Tietohallinto/Opetusteknologiapalvelut 2014
Tietokanta Tietokanta on työkalu, jolla opettaja ja opiskelijat voivat julkaista tiedostoja, tekstejä, kuvia ja linkkejä alueella. Opettaja määrittelee lomakkeen muotoon kentät, joiden kautta opiskelijat
LisätiedotTiedonhaku ja varaaminen
Tiedonhaku ja varaaminen Kyytin verkkokirjasto kyyti.finna.fi 20.11.2018 Tiedonhaku Kirjoita hakukenttään teoksen nimi, tekijä, aihe tai muita asiaan liittyviä hakusanoja. Tarvittaessa katkaise hakusana
LisätiedotPaikannimirekisteri linkitettynä tietona
Paikannimirekisteri linkitettynä tietona URI-tunnukset paikkatietokohteille, (JHS 193 paikkatiedon yksilöivät tunnisteet) Linkitetty tieto eli webin yleiset teknologiat: RDF, OWL, SPARQL jne. Saavutettavuus
Lisätiedot3 Verkkosaavutettavuuden tekniset perusteet
3 Verkkosaavutettavuuden tekniset perusteet Saavutettavuuden toteuttaminen edellyttää lähtökohtaisesti tietoa laitteista ja sovelluksista, käyttäjistä ja käyttötavoista, sekä tekniikasta. Tekniikasta on
LisätiedotOnko luettelointitermillä. väliä? Kokoelmaseminaari 14.-15.4.2008 Suvi Kettula Espoon kaupunginmuseo suvi.kettula@espoo.fi suvi.kettula@helsinki.
Onko luettelointitermillä väliä? Kokoelmaseminaari 14.-15.4.2008 Suvi Kettula Espoon kaupunginmuseo suvi.kettula@espoo.fi suvi.kettula@helsinki.fi Sisältö Mikä on luettelointitermi Luettelointitermi ja
LisätiedotYleinen suomalainen ontologia YSO
Yleinen suomalainen ontologia YSO Katri Seppälä Semanttisen laskennan tutkimusryhmä (SeCo) Teknillinen korkeakoulu, mediatekniikan laitos; Helsingin yliopisto, tietojenkäsittelytieteen laitos; Sanastokeskus
LisätiedotVinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa
Vinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa Katja Pietilä / Musiikkiosasto 16.1.2017 Sisältö Verkkokirjaston aloitussivu Tarkan haun aloitussivu Hakutuloksen lukeminen Kokonaisten julkaisujen
LisätiedotKäyttöohje. KotKot. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
Käyttöohje KotKot Helsinki 14.12.2008 Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Kurssi 581260 Ohjelmistotuotantoprojekti (9 + 1 op) Projektiryhmä Tuomas Puikkonen Matti
LisätiedotIlmiöprojektin tiedonhankinta
Ilmiöprojektin tiedonhankinta Aiheena Euroopan unioni Urheilupuiston 9b 10.5.2017 Mikkelin kaupunginkirjasto s. 1 Tervetuloa kirjastotunnille! Avaa sivu https://oppilaidenkirjastopolku.wordpress.com/ Viimeisimmät
LisätiedotSeitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)
Seitsemän syytä semanttiseen webiin Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo) 1 Sisältö WWW tänään (30 min) Palvelut ja tiedonhaku: ongelmia Tiedon esitys: merkkauskielet
LisätiedotArkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14
Arkkitehtuurikuvaus Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy Ryhmä 14 Muutoshistoria Versio Pvm Päivittäjä Muutos 1.0 19.10.2007 Suanto 0.3 18.10.2007 Matti Eerola 0.2 17.10.2007
LisätiedotMonihaku ja sähköiset aineistot tutuksi. Jyväskylän kaupunginkirjaston tiedonhaun koulutus
Monihaku ja sähköiset aineistot tutuksi Jyväskylän kaupunginkirjaston tiedonhaun koulutus Miksi monihaku? Sähköistä aineistoa valtavat määrät Laadukasta ja ei-niin-laadukasta Ilmaista ja maksullista Monihakuun
LisätiedotKohti Yleistä suomalaista ontologiaa (YSO)
Kohti Yleistä suomalaista ontologiaa (YSO) Katri Seppälä, TKK Viestintätekniikan laboratorio Helsingin yliopisto, tietojenkäsittelytieteen laitos Sanastokeskus TSK 1 Sisältö Yleinen suomalainen asiasanasto
LisätiedotMiksi asiasanastot eivät riitä vaan tarvitaan ontologioita?
Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita? Prof. Eero Hyvönen TKK Viestintätekniikka ja Helsingin yliopisto Semantic Computing Research Group (SeCo) Lähde: E. Hyvönen: Miksi asiasanastot
LisätiedotEbrary-palvelun e-kirjojen lukeminen selaimessa
Ebrary-palvelun e-kirjojen lukeminen selaimessa Palaute: nelli @uef.fi Ohje päivitetty: 1.9.2016 / KM Lukuohjeita myös Ebraryn sivuilla: New Online Reader Yliopiston käyttöön hankitussa Ebrary-palvelussa
LisätiedotTiedonhaku korkeakouluopinnoissa
Kun Google ei riitä Tiedonhaku korkeakouluopinnoissa Googlesta tiedon ja julkaisujen saatavuus parantunut hyvä paikantamaan jo tiedettyä lähdettä tulosten relevanssilajittelu tiedon laatu ja taso vaihtelevat
LisätiedotSemanttinen Web Mitä se on käytännössä?
ATK Tietotekniikkaa yliopistoille, Helsingin yliopisto, tietotekniikkaosasto, no. 2/2004, ss. 38-42. Semanttinen Web Mitä se on käytännössä? Eero Hyvönen Helsingin yliopisto, tietojenkäsittelytieteen laitos
LisätiedotHakuohjeet Haku Tiedonhaun tulokset
06/2010 Hakuohjeet 1. Haku 1.1. Hakutermien yhdistely Boolen operaattorit 1.2. Haun rajaus 1.3. Haun kohdistaminen tiettyyn kenttään 1.4 Hakuhistoria 1.5. Asiasanat -toiminto 1.6 Lehdet -toiminto 2. Tiedonhaun
LisätiedotRakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke
Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke Rakenteisuus kahdella tasolla Oppimisaihiot ( Learning Objects
LisätiedotUutisjärjestelmä. Vaatimusmäärittely. Web-palvelujen kehittäminen. Versio 1.3
Uutisjärjestelmä Vaatimusmäärittely Versio 1.3 Sisällys 1 Muutoshistoria... 4 2 Viitteet... 4 3 Sanasto... 4 3.1 Lyhenteet... 4 3.2 Määritelmät... 4 4 Johdanto...5 4.1 Järjestelmän yleiskuvaus... 5 4.2
LisätiedotSemanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto
Semanttinen Web Ossi Nykänen Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto Esitelmä Hyvin lyhyt versio: Semanttinen Web (SW) on
LisätiedotPubMed-opas. kesäkuu 2012
PubMed-opas kesäkuu 2012 Tämän ohjeen päivittämisessä on osittain käytetty apuna Turun yliopiston kirjaston Tieteenalakirjasto Protoksen Lääketieteen kirjaston opasta, joka puolestaan pohjautuu osittain
LisätiedotSisällön automaattinen moniluokittelu. Testausdokumentti versio
Sisällön automaattinen moniluokittelu Testausdokumentti versio Helsingin yliopisto Tietojenkäsittelytieteen laitos Ohjelmistotuotantoprojektiryhmä 5. Sisällön automaattinen moniluokittelu (Samo) Marko
LisätiedotYhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?
Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin? Avoin verkkoalusta ihmisen ja koneen ymmärtämien tietomääritysten tekemiseen Riitta Alkula 20.3.2019 Esityksen sisältö
Lisätiedotkäyttötapaukset mod. testaus
käyttötapaukset Jari Ojasti Nokia email : jari.ojasti@nokia.com puh : 040 5926 312 Kartta hyväksyntä määrittely suunnittelu suunnittelu mod. testaus integrointi sys. testaus Ylläpito koodaus (toteutus)
LisätiedotMetatiedot organisaatioiden sisällönhallinnassa
Metatiedot organisaatioiden sisällönhallinnassa Airi Salminen Jyväskylän yliopisto http://www.cs.jyu.fi/~airi/ Lainsäädäntöprosessin tiedonhallinnan kehittäminen Metatiedot suomalaisen lainsäädäntöprosessin
LisätiedotPubMed-opas. Itä-Suomen yliopiston kirjasto KYSin tieteellinen kirjasto helmikuu 2011. tuulevi.ovaska@uef.fi
PubMed-opas Itä-Suomen yliopiston kirjasto KYSin tieteellinen kirjasto helmikuu 2011 Aloitus Osoitteesta http://www.ncbi.nlm.nih.gov/sites/entrez?otool=ifikuplib Nelli-portaalista (Tietokannat) UEF:n kirjaston
LisätiedotArkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14
Arkkitehtuurikuvaus Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy Ryhmä 14 Muutoshistoria Versio Pvm Päivittäjä Muutos 0.4 1.11.2007 Matti Eerola 0.3 18.10.2007 Matti Eerola 0.2
LisätiedotAsko Ikävalko, k0201291 22.2.2004 TP02S-D. Ohjelmointi (C-kieli) Projektityö. Työn valvoja: Olli Hämäläinen
Asko Ikävalko, k0201291 22.2.2004 TP02S-D Ohjelmointi (C-kieli) Projektityö Työn valvoja: Olli Hämäläinen Asko Ikävalko LOPPURAPORTTI 1(11) Ratkaisun kuvaus Käytetyt tiedostot Tietuerakenteet Onnistuin
LisätiedotONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua
ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua Matias Frosterus (Osma Suominen) Kirjastoverkkopäivät 24.10.2013 Matiaksen saatesanat Olo on kuin olisi mennyt saunaan, heittänyt hirveästi
LisätiedotSemanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto
Semanttinen Web Ossi Nykänen Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto Esitelmä Hyvin lyhyt versio: World Wide Web Consortium (W3C) on kansainvälinen
LisätiedotTiedonhaku Nelli-portaalissa
Tiedonhaku Neli-portaalissa 1 (10) Nelli-portaali Tiedonhaku Nelli-portaalissa SISÄLTÖ Monihaku... Monihaku -sanahaku... Monihaku -tarkennettu... Monihaun tulokset... Monihaku: Lista... Monihaku: Koko
Lisätiedot582203 Tietokantasovellus (4 op) - Web-sovellukset ja niiden toteutus
582203 Tietokantasovellus (4 op) - Web-sovellukset ja niiden toteutus Sisältö Mikä on web-sovellus? Selaimen rooli web-sovelluksessa Palvelimen rooli web-sovelluksessa Aineistopyynnöt Tiedon välittäminen
LisätiedotPysyvä ja muuttuva A:sta O:hon sisällönkuvailussa. Mirja Anttila Kansalliskirjasto
Pysyvä ja muuttuva A:sta O:hon sisällönkuvailussa Mirja Anttila Kansalliskirjasto 21.5.2018 YSO rynnisti jatkoon O on uusi A! Monikielisyys: suomi, ruotsi, englanti Pysyvät tunnisteet Päätermien ja ohjaustermien
LisätiedotEpätäsmällisen tiedon esittäminen semanttisen webin ontologioissa
Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa FinnOnto, 16.11.2005 Markus Holi (markus.holi@tkk.fi) Semantic Computing Research Group http://www.seco.tkk.fi/ UNIVERSITY OF HELSINKI
LisätiedotUCOT-Sovellusprojekti. Vaatimusmäärittely
UCOT-Sovellusprojekti Vaatimusmäärittely Ilari Liukko Tuomo Pieniluoma Vesa Pikki Panu Suominen Versio: 0.04 Julkinen 28. syyskuuta 2006 Jyväskylän yliopisto Tietotekniikan laitos Jyväskylä Hyväksyjä Päivämäärä
LisätiedotKirjastoverkkopäivät 2017 Erkki Tolonen
Kirjastoverkkopäivät 2017 Erkki Tolonen 25.10. Photograph: Eeva Rista 1974, Helsinki City Museum, https://finna.fi/record/hkm.hkms000005:km0000lqgq Melinda kuvailuun Finna asiakkaille Tiedonhakija / asiakas
LisätiedotSuomi.fi-verkkopalvelu
Suomi.fi-verkkopalvelu Haun toiminta Suomi.fi-verkkopalvelussa Tuuli Krekelä, Suomi.fi-verkkotoimitus Janne Murtonen, Gofore 14.12.2018 Koulutus nauhoitetaan Agenda 1. Suomi.fi-haun periaatteet 2. Mikä
LisätiedotKansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana
Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana Linkity! Kohti yhteentoimivaa metatietoa 3.9.2014 Kuvaileva metadata Sanasto Kuvaileva metadata Sanasto Sanasto Sanasto Kuvaileva
LisätiedotONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto kim.viljanen@tkk.fi
ONKI Living Lab -ontologiapalvelut käytettävissänne Kim Viljanen Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto kim.viljanen@tkk.fi Käytiin onkimassa. Tuliko kalaa? Joo, oikea vonkale! Yhteinen
LisätiedotJohdatus rakenteisiin dokumentteihin
-RKGDWXVUDNHQWHLVLLQGRNXPHQWWHLKLQ 5DNHQWHLQHQGRNXPHQWWL= rakenteellinen dokumentti dokumentti, jossa erotetaan toisistaan dokumentin 1)VLVlOW, 2) UDNHQQHja 3) XONRDVX(tai esitystapa) jotakin systemaattista
LisätiedotFinto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa
Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa Mikko Lappalainen mikko.lappalainen@helsinki.fi Helka-kirjastojen sisällönkuvailun iltapäivä, 09.09.2015 1 Finto-projektin kuulumisia Henkilöstömuutoksia:
LisätiedotYlläpitodokumentti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
Ylläpitodokumentti Orava Helsinki 5.5.2005 Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Kurssi 581260 Ohjelmistotuotantoprojekti (6 ov) Projektiryhmä Juhani Bergström
LisätiedotKäyttäjien tunnistaminen ja käyttöoikeuksien hallinta hajautetussa ympäristössä
www.niksula.cs.hut.fi/~jjkankaa// Demosovelluksen tekninen määrittely v. 0.6 Päivitetty 11.12.2000 klo 20:26 Mickey Shroff 2 (12) Dokumentin versiohistoria Versio Päivämäärä Tekijä / muutoksen tekijä Selite
LisätiedotTieto matkaa maailmalle
Tieto matkaa maailmalle Avoimen julkaisemisen parhaat käytänteet Helsinki 31.1.2017 Ulla Ikäheimo & Tarja Mäkinen Sisältö Mitä on metatieto Kuvailusäännöt ja formaatit Sanastot ja Finto Henkilöt Tunnisteet
LisätiedotSemantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy
Semantic Web käytännön sovelluksissa TkT Janne Saarela Profium Oy 26.5.2004 Sisällysluettelo Johdanto Semanttisen Webin maailmaan Mahdollisuudet Tämän päivän käyttökohteet Haasteet 1 Johdanto Semanttisen
LisätiedotTiedonlähteille NELLIn kautta -
28.8.2009 1 Tiedonlähteille NELLIn kautta - www.nelliportaali.fi/jy NELLI-portaali on tiedonhakujärjestelmä, joka tarjoaa pääsyn Jyväskylän yliopistossa käytettävissä oleviin sähköisiin aineistoihin kuten
LisätiedotTietokannan luominen:
Moodle 2 Tietokanta: Tietokanta on työkalu, jolla opettaja ja opiskelijat voivat julkaista tiedostoja, tekstejä, kuvia, linkkejä alueella. Opettaja määrittelee lomakkeen muotoon kentät, joiden kautta opiskelijat,
LisätiedotSuomi.fi palvelutietovaranto
Suomi.fi palvelutietovaranto Metatiedot: luokitus ja ontologiakäsitteet (asiasanat) 13.12.2016 Metatiedot Metatieto on tietoa tiedosta eli kuvailevaa ja määrittävää tietoa jostain sisällöstä. Metatietojen
LisätiedotKäyttöohje. Aija. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
Käyttöohje Aija Helsinki 2.9.2005 Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Sisältö 1. Yleistä...3 2. Järjestelmän toiminnot...4 2.1 Rekisteröityminen...4 2.2 Sisäänkirjautuminen...4
LisätiedotRaporttiarkiston (RATKI) käyttöohjeet Ohjeet
Raporttiarkiston (RATKI) käyttöohjeet Ohjeet 15.11.2012 1.0 Vastuutaho TRAFI Sisällys Raporttiarkiston (RATKI) käyttöohjeet 1 1. Johdanto 3 1.1. Esitiedot 3 1.2. Käyttöoikeudet 3 1.3. Sisäänkirjautuminen
LisätiedotONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja
ONKI-PROJEKTIN ESITTELY Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja 5.11.2013 Taustaa FinnONTO -- Suomalaiset semanttisen webin ontologiat (2003-2012) Aalto-yliopiston semanttisen laskennan ryhmän
LisätiedotJulian graafinen annotointityökalu ja erityisontologioiden editori. Jaason Haapakoski P Kansanterveyslaitos , 28.3.
Julian graafinen annotointityökalu ja erityisontologioiden editori Jaason Haapakoski P. 040 7612 811 Kansanterveyslaitos 28.2.2006, 28.3.2006 Perusnäkymä Ohjelmalle on konfiguroitavissa useita eri käsitteistöjä
LisätiedotURI:n muodostamisen prosessi (suositusluonnoksen liite 1)
URI:n muodostamisen prosessi (suositusluonnoksen liite 1) Keskustelutilaisuus JHS-suositusluonnoksesta Paikkatiedon yksilöivät tunnisteet Kai Koistinen 19.11.2014 Liite 1. URI:n muodostamisen prosessi
LisätiedotOhjelmistojen mallintaminen, mallintaminen ja UML
582104 Ohjelmistojen mallintaminen, mallintaminen ja UML 1 Mallintaminen ja UML Ohjelmistojen mallintamisesta ja kuvaamisesta Oliomallinnus ja UML Käyttötapauskaaviot Luokkakaaviot Sekvenssikaaviot 2 Yleisesti
LisätiedotSemantic Web - Metadata editor
Semantic Web - Metadata editor Ohjelmistotuotantoprojekti, kesä 2002 Ohjelmistotuotantoryhmä 1, Meedio http://www.cs.helsinki.fi/group/meedio Mikko Apiola (M.A.) Ari Inkovaara (A.I.) Miikka Junnila (M.J.)
LisätiedotPaikkatiedot ja Web-standardit
Paikkatiedot ja Web-standardit Ossi Nykänen Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto Esitelmä Hyvin lyhyt versio: World Wide
LisätiedotOntologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa. Tommi Jauhiainen Helsinki
Ontologioiden huomioiminen uuden kirjastojärjestelmän suunnittelussa Tommi Jauhiainen 25.11.2011 Helsinki Uusi kirjastojärjestelmä? Kaikkien kirjastosektorien yhteinen hanke, jota tekee Uuden kirjastojärjestelmän
LisätiedotDigi-tv vastaanottimella toteutetut interaktiiviset sovellukset
Tekninen määrittely: Editori Digi-tv vastaanottimella toteutetut interaktiiviset sovellukset Sisällysluettelo 1. Johdanto...4 1.1. Tarkoitus ja kattavuus...4 1.2. Tuote ja ympäristö...4 1.3. Määritelmät,
LisätiedotSisällönhallinnan menetelmiä
Sisällönhallinnan menetelmiä Airi Salminen Jyväskylän yliopisto http://www.cs.jyu.fi/~airi/ Suomalaisen lainsäädäntötyön tiedonhallinta: suuntana semanttinen web RASKE2-projektin loppuseminaari Eduskunnassa
LisätiedotWWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys
WWW-OHJELMOINTI 1 WWW-ohjelmoinnin kokonaisuus SGML, XML, HTML WWW-selaimen sovellusohjelmointi WWW-palvelimen sovellusohjelmointi Eero Hyvönen Tietojenkäsittelytieteen laitos Helsingin yliopisto 26.10.2000
LisätiedotONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut
ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut XML Finland 2009, 20.1.2009 Jouni Tuominen Semantic Computing Research Group (SeCo) Helsinki University of Technology (TKK), Department
LisätiedotMatematiikan oppifoorumi Käyttöohje
Matematiikan oppifoorumi Käyttöohje Versio 1.0 Carl Johansson Jukka Kariola Outi Marttila Helena Venäläinen Sampsa Virtanen Ohjaaja Jukka Eskola Ohjelmistotuotantoprojekti 17.12.1999 HELSINGIN YLIOPISTO
LisätiedotONKI-projekti JUHTA KANSALLISKIRJASTO - Kirjastoverkkopalvelut
ONKI-projekti JUHTA 31.10.2013 Ontologia Jonkin aihealueen käsitteiden eksplisiittinen määrittely Käsitehierarkia, joka kuvaa käsitteiden väliset suhteet Ontologia Jos eri organisaatiot käyttävät sisällönkuvailussaan
Lisätiedot