7. luento: Verkkopalvelun informaatioarkkitehtuurin suunnittelu osa 2



Samankaltaiset tiedostot
Verkkopalvelun sisällöntuotanto

Verkkopalvelun sisällöntuotanto

Luento 12: XML ja metatieto

TIEDONHAKU INTERNETISTÄ

Ovid Medline käyttöohjeita (10/2010)

Avoin data Avoin kirjasto Kuvailupäivät

Verkkopalvelun sisällöntuotanto

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Web of ScienceTM Core Collection (1987-present)

Johdatus rakenteisiin dokumentteihin

Metatiedot organisaatioiden sisällönhallinnassa

Ilmiöprojektin tiedonhankinta

Uudet EU-asetukset. EUR-Lexin tarkennetun haun käyttöohje

6. luento: Verkkopalvelun informaatioarkkitehtuurin suunnittelu osa 1

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Ilmiöprojektin tiedonhankinta

Nelli kaukopalvelutyössä

W3C-teknologiat ja yhteensopivuus

Monihaku ja sähköiset aineistot tutuksi. Jyväskylän kaupunginkirjaston tiedonhaun koulutus

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

CINAHL(EBSCO) käyttöohjeita (10/2010)

Järjestelmäriippumattomia siivousohjeita

Tietokanta löytyy kirjaston sähköisistä aineistoista ja NELLI-portaalin kautta.

Metatietojen merkitys tiedonhallinnassa

Ensi askeleet semanttiseen webiin: tuotantoprojektin kokemuksia

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Ohje: Miten haen artikkeleita Aleksista

Metatietojen merkitys tiedonhallinnassa

ARVO - verkkomateriaalien arviointiin

HAKU LASTU-VERKKOKIRJASTOSTA LASTU-verkkokirjastosta voi toistaiseksi hakea vain Lahden aineistotietokannasta.

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

Tiedonhaku. Esim. kymenlaakso muutosjohtami* Laila Hirvisaari Tuntematon sotilas Ruksi tyhjentää hakukentän.

Suositus asiasanastojen, luokitusjärjestelmien ja ontologioiden käytöstä luetteloinnissa Suomen museoissa

PIKAOHJE Web of Science tietokantojen käyttöön

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

Tiedonlähteille NELLIn kautta -

Suomi.fi palvelutietovaranto

Verkkokirjaston hakuohjeet

Sisällönhallinnan menetelmiä

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Tiedonhaku korkeakouluopinnoissa

Tieto matkaa maailmalle

Tiedonhaku Nelli-portaalissa

Järjestelmäriippumattomia siivousohjeita

KÄYTTÖOHJE. Servia. S solutions

B U S I N E S S O U L U

1. PIKAHAKU ELI HAE TEOSTA, TEKIJÄÄ TAI ASIASANAA

Näin sisällönkuvailen. Sisällönkuvailupäivä Liisa Virtanen Kansalliskirjasto

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Asiakasystävällinen ja ylläpidettävä verkkopalvelu tarua vai totta

Vinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa

Sisällys. Valtion tietotekniikan rajapintasuosituksia. XML:n rooleja sähköisen asioinnin tavoitearkkitehtuurissa. dbroker - asiointialusta

Verkkopalvelun käyttökelpoisuus ja arviointi

Suomi.fi-verkkopalvelu

Oppijan verkkopalvelun käyttöohjeiden laatiminen

Ohjeita informaation saavutettavuuteen

Ebrary-palvelun e-kirjojen lukeminen selaimessa

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Tekijä: Pirkko Jokinen. Osaamisen arviointi

AS Automaatiotekniikan seminaarikurssi. Kevät 2008

Semantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy

8. Informaation laadukkuuden arviointi

Automaattinen semanttinen annotointi

Aleksi ja ARTO artikkeliviitetietokannat

TIEDONHAKU. Yksinkertainen tiedonhaku Googlella. Suunnitelmallinen tiedonhaku. Muita tiedonlähteitä Tero Mononen / Kumppanuuskampus

PubMed lääketieteellinen kokoteksti- ja viitetietokanta

Uudet kuvailusäännöt (RDA) tulevat. Erikoiskirjastojen neuvoston kokous Marja-Liisa Seppälä

HOIDOKKI hoitotieteellinen asiasanasto. Kristiina Junttila sanastotyöryhmän jäsen / SHKS kehittämispäällikkö / HUS

FSD3028. Julkiseen työnvälitykseen ilmoitettujen avointen työpaikkojen rekisteriaineisto Koodikirja

VINKKEJÄ CV-NETIN KÄYTTÖÖN.

<e.g. must, essential, conditional>

Ilmiöprojektin tiedonhankinta

Ajankohtaisen lakitiedon lähteitä

Etsi aineistoa, uusi lainoja, tee varauksia. Onnistuneita hetkiä Juolukan parissa!

KVANTITATIIVISEN TUTKIMUSAINEISTON KUVAILU

Kuvailun muutoksen visualisointi Marja-Liisa Seppälä / Kansalliskirjasto

Oma kartta Google Maps -palveluun

Vinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Auta asiakkaita löytämään kauppaasi! Terhi Aho/

Verkkosivun ulkonäkö mukautuu eri laitteisiin; älypuhelimeen, tablettiin tai tietokoneeseen. Hakuperiaatteet ovat samat laitteesta riippumatta.

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

83450 Internetin verkkotekniikat, kevät 2002 Tutkielma <Aihe>

Digi.kansalliskirjasto.fi:n käyttöohje

Kirjastoinfo TaY Pori Porin tiedekirjasto

Kysy kirjastonhoitajalta. Linkkikirjasto. Tiedonhaun portti. Frank-monihaku. kirjastot.fi>

Fiction searching from an enriched library web service

Valtioneuvoston tietosisältöjen semanttinen yhteentoimivuus

Paikkatiedot ja Web-standardit

Nelli Tiedonhakuportaali Kemi-Tornion ammattikorkeakoulun elektronisiin aineistoihin. Onnistuneita hetkiä Nellin parissa!

Tiedonhaku ja varaaminen

Osaamispassi ja erityisosaamistietokanta tulevaisuuden osaajille

ARVO - verkkomateriaalien arviointiin

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

ECDL Tietokannat. Copyright 2015 ECDL Foundation ECDL Tietokannat Sivu 1 / 7

HAKUKONEMARKKINOINTI KOTISIVUJEN PÄIVITYSOHJE

MOBISITE-TYÖKALUN SISÄLTÄMÄT TOIMINNOT

Projektinhallintaa paikkatiedon avulla

Transkriptio:

7. luento: Verkkopalvelun informaatioarkkitehtuurin suunnittelu osa 2 Hakutoiminnot (search systems) Käyttäjä etsivät informaatiota ensinnäkin selailemalla. Toimintoa voidaan tukea informaation luokittelulla sekä siihen perustuvalla rakenteella, navigointijärjestelmällä ja informaation visualisoinnilla. Toinen tapa etsiä informaatiota on käyttää hakutoimintoja. On kuitenkin huomioitava, että hakutoiminto ei korvaa informaation luokittelua, tarkoituksenmukaista nimeämiskäytäntöä tai toimivaa navigointijärjestelmää hakutoiminto ei ratkaise heikosti toteutetun informaatioluokittelun ja/tai navigoinnin mukanaan tuomia ongelmia Käyttäjien etsimä informaatio voi olla selkeästi ja yksiselitteisesti määriteltävissä > käyttäjä tietää tarkkaan mitä etsiä ja mistä abstrakti idea tai käsite > käyttäjä tietää mitä hän haluaa, mutta ei tiedä onko informaatiota ylipäätänsä olemassa eikä hänellä ole tietoa mistä etsiä ja mitä tarkalleen ottaen pitäisi etsiä selkeästi muotoiltavissa oleva asia, johon halutaan lisätietoa > käyttäjä ei kuitenkaan tiedä millaista informaatiota hän tarvitsee aiheeseen jollakin tavalla liittyvää > käyttäjä haluaa kaiken aiheeseen liittyvän informaation Hakutapoja Vapaasanahaku (basic search): luonnollisen kielen sanasto Asiasanahaku: yksi tai useampi asiasana Laajennettu haku (advanced search): voidaan määritellä mihin tietokannan kenttään haku kohdennetaan Rosenfeld ja Morville (2002, 132) peräänkuuluttavat harkintaa ennen hakutoimintojen toteuttamiseen ryhtymistä. Ainakin seuraavia asioita on hyvä pohtia: Verkkopalvelun tyyppi: Onko verkkopalvelu luonteeltaan sellainen, että käyttäjät etsivät sieltä informaatiota (viestinnällinen vai operatiivinen verkkopalvelu) Tarvittava osaaminen ja muut resurssit: Vaikka hakutoiminnon toteuttaminen on suhteellisen helppoa, niin sen optimoimiseen tarvitaan osaamista (ja aikaa). Muut vaihtoehdot: Toimisiko esim. sisällysluettelo tai sivustokartta riittävän hyvin? Entä ylläpito? Käyttötapa: Onko verkkopalvelu luonteeltaan sellainen, että käyttäjät etsivät informaatiota enemmänkin selailemalla kuin hakutoimintoa hyödyntämällä. Esim. valokuvagalleriat. Sisällön laajuus: Onko verkkopalvelu sisällöllisesti laaja? Muuttuuko sisältö nopeasti? Onko todennäköistä, että verkkopalvelu tulee laajenemaan tulevaisuudessa? Sisällön dynaamisuus: Muuttuuko sisältö nopeasti? Esimerkiksi verkkolehti. Alasivustot: Koostuuko verkkopalvelu useista eri alasivustoista? Hakutoiminto tapahtuu yksikertaisimmillaan seuraavasti: 1

Käyttäjä syöttää hakukenttään hakulausekkeen: luonnollinen kieli tai kyselykieli Hakulauseketta vertaillaan "hakemistoon" (index), joka kuvaa jollakin tavalla sivuston sisältöä. Hakulauseketta vastaavat dokumentit tunnistetaan, järjestetään ja esitetään käyttäjälle tietyssä järjestyksessä. Hakemisto voi muodostua listoista, jotka koostuvat sisältöön liittyvistä avainsanoista, dokumenttien tekijöistä, dokumentin nimistä, luokista jne. Yhä useammin käytetään hakemistoja, jotka muodostuvat esimerkiksi dokumenttia kuvaavaa metadataa sisältävistä tietueista. Query language Query builders Metadata Controlled vocabulary Ranking and clustering algorithms Interface design?user's Query Search Interface Search Engine Content Results User will ask, browse or search again Until they succeed or give up Kuva 1. Hakujärjestelmän perusosiot. (Lähde: Morville 2001). Hakutoimintojen suunnitteleminen 1. Hakukonesovelluksen valinta 2. Mitä haetaan ja mistä Useinkaan ei ole järkevää indeksoida hakutoimintoja varten kaikkea mahdollista sisältöä, jota verkkopalvelu pitää sisällään. Hakutoiminnot voidaan kohdentaa etsimään tarkoituksenmukaista informaatiota ensisijaisesti jostakin tietystä verkkopalvelun osiosta ns. hakualueista (search zone) ja/tai dokumenttien tietyistä osioista (content component). (Rosenfeld & Morville 2002, 137.) Hakualue (search zone) on muusta verkkopalvelun sisällöstä rajattu informaatiosisältö, johon hakutoiminto voidaan kohdentaa. Toisin sanoen valitsemalla hakualueen käyttäjä pystyy rajaamaan hakuaan ja kohdentamaan sen vain osaan sisällöstä. Hakualue tarjoaa käyttäjälle erilaisen ja eritavoin järjestetyn näkymän verkkopalvelun sisältöön. Hakualueiden määrittely voi pohjata sivuston fyysiseen rakenteeseen, sisältöjen loogiseen rakenteeseen. Hakualueiden pohjana voi em. ohella tai sijasta olla myös verkkopalvelun informaatiojärjestelmä tai jaottelu esim. sisältötyypin, kohderyhmän, aihealueen, ajankohdan, tekijän, yksikön jne. mukaan. 2

Hakualueiden määrittelyssä on kiinnitettävä huomiota siihen, että jaottelu on lisäarvoa tuottava. Esimerkiksi jos hakualueet jaotellaan kohderyhmän mukaan on myös sisältö oltava aidosti jaoteltavissa kohderyhmän mukaan. Esimerkkejä Aiheenmukainen haun rajaaminen : Yahoo Directory http://dir.yahoo.com/ Ajankohdan mukaan rajaaminen: Helsingin Sanomat - arkisto http://www.helsinginsanomat.fi/arkisto/ Haku voidaan kohdentaa myös dokumentin tiettyihin osioihin (content components). Useinkaan ei ole järkevää kohdentaa hakua kaikkeen tietyssä dokumentissa olevaan sisältöön. Haku voidaan kohdentaa ns. leipätekstiin, otsikkoon, kuvateksteihin, avainsanoihin jne. ja sivuuttaa esimerkiksi lähdeluettelo. 3. Hakualgoritmit Hakualgoritmeja on olemassa lukuisia. Kuitenkaan mikään hakualgoritmi tai hakukone ei yksinään kykene vastaaman käyttäjien erilaisiin informaatiotarpeisiin. Suuri osa hakualgoritmeista hyödyntää tavalla tai toisella vertailua. Käyttäjän kirjoittamaa hakulauseketta vertaillaan sisällöstä laadittuun hakemistoon tai koko tekstisisältöön. Kun vastaava dokumentti löytyy se lisätään hakutuloksiin. Muita hakualgoritmien käyttämiä "sääntöjä": Kattavuus (recall): haun tuloksena esitetään kaikki mahdolliset dokumentit, jotka vastaavat hakulauseketta, riippumatta niiden relevanssista. Tuloksena suuri määrä dokumentteja. Täsmällisyys (precision): haun tuloksena esitetään ainoastaan parhaat mahdolliset hakutulokset. Samankaltaisuus (similarity): hakutulokseen "kootaan" samankaltaisia dokumentteja (semanttisesti samankaltaisia dokumentteja tai metatiedoiltaan samanlaisia dokumentteja). Perusmuotojen hyödyntäminen (stemming): hakusanoista poistetaan pääteainekset yms. ja hakutuloksena esitetään dokumentit, joissa hakusana esiintyy jossakin muodossa. Esimerkiksi verkkopalvelu, verkkopalvelun, verkkopalveluiden jne. Lisäksi voidaan hyödyntää edistyneempiä "sääntöjä" perustuen esim. suosittelijajärjestelmiin ja sosiaaliseen suodatukseen (collaborative filtering and citation) : Viittaaminen: hakutuloksissa esitetään myös dokumentit, jotka viittaavat ko. dokumenttiin tai dokumentti, joihin ko. dokumentissa viitataan. Oletetaan niillä olevan jotakin yhteistä. Asiayhteys: hakutuloksissa esitetään dokumentit, jotka esiintyvät samassa asiayhteydessä. Käyttäjiin perustuva yhteys: hakutuloksissa esitetään ne dokumentit, joista ko. dokumentista kiinnostuneet käyttäjät ovat myös kiinnostuneet. Hakualgoritmien ohella voidaan hyödyntää erilaisia "Query builders". Nämä ovat työkaluja, joiden avulla hakutoimintoja voidaan tehostaa. Asiayhteys: hakutuloksissa esitetään dokumentit, jotka esiintyvät samassa asiayhteydessä. Oikeinkirjoituksen tarkistus (spell-checkers): huomioi käyttäjän tekemät mahdolliset kirjoitusvirheet ja "korjaa" ne. Hakutuloksissa esitetään myös ne dokumentit, joissa hakusana esiintyy oikeassa muodossaan. Vrt. Google. Ääntämismuodon huomioiminen (phonetic tools): Hakutuloksissa esitetään myös ne hakutulokset, jotka ovat ääntämykseltään samankaltaisia kuin hakusana. Sanojen taivutusmuotojen huomioiminen (stemming tools): ks. edellä. 3

Luonnollinen kieli: Käyttäjä voi muodostaa hakulausekkeen käyttäen luonnollista kieltä ja sen syntaksia. Esimerkiksi Ask Jeeves. Sanastot ja tesaurukset: Huomioidaan semanttisuuden mukanaan tuomat ongelmat ja pyritään sisällyttämään hakutuloksiin automaattisesti myös hakusanojen synonyymit sisältävät dokumentit. 4. Hakutulosten esittäminen Hakutoimintoja suunniteltaessa tulee kiinnittää huomiota siihen mitä hakutuloksissa esitetään käyttäjälle ja miten hakutulokset ryhmitellään tai listataan. Perussääntönä on se, että käyttäjälle joka tietää tarkalleen mitä etsii, esitetään hakutuloksissa dokumentteja yksilöivät tiedot kuten tekijä, otsikko yms. Kuvailevaa informaatiota ei juurikana tarvita. Sitä vastoin käyttäjälle, joka ei tiedä tarkalleen mitä etsii tulee esittää yksilöivän informaation ohella enemmän dokumenttia kuvailevaa informaatiota kuten avainsanoja, tiivistelmä jne. Lisäksi hakutulosten esittämiseen vaikuttaa se mitä sisältökomponentteja dokumenteista voidaan hakutuloksissa hyödyntää (miten dokumenttien asiasisältö on rakenteistettu). Onko dokumentista poimittavissa erikseen esim. dokumentin otsikko, yhteenveto sisällöstä, verkko-osoite, luokittelu, julkaisupäivä, kirjoittaja jne. Esitettävien hakutulosten määrää ei voida yksiselitteisesti määritellä. Paras ratkaisu lienee se, että käyttäjälle tarjotaan mahdollisuus itse rajata tulosten määrä. Joka tapauksessa käyttäjälle on hyvä kertoa kokonaistulos, jotta hän voi arvioida hakulausekkeensa järkevyyttä. Hakutulokset voidaan esittää eri tavoin järjestettyinä: Aakkosjärjestys, aikajärjestys, hinta tms. Relevanssin mukaan Suosituimmuuden mukaan Käyttäjien tai asiantuntijoiden asettama "paremmuusjärjestys" Maksetun hinnan mukaan (PFP pay-for-placement) Ryhmittely Esimerkkejä: Suosituimmuuden mukaan Google http://www.google.fi Maksetun hinnan mukaan Overture: http://www.content.overture.com/d/ Ryhmittelyä hyödyntävä Teoma http://www.teoma.com/ 5. Hakutulosten tallentaminen Käyttäjää voidaan tukea hakutulosten tallentamisessa. Esimerkiksi tarjotaan käyttäjälle mahdollisuus Tulostaa haluamansa dokumentit tai hakutulokset Lähettää valitut dokumentit tai hakutulokset s-postilla itselleen/ystävälleen Tallentaa valitut dokumentit omalle koneelleen Tallentaa hakulauseke ja hakutulokset omalle koneelleen. 4

6. Hakulomakkeen suunnittelu Riittääkö perushakukenttä? Hakulomaketta suunniteltaessa on hyvä miettiä mm. seuraavia tekijöitä: Onko käyttäjillä todennäköisesti kokemusta hakutoiminnoista? Esimerkiksi ovatko Boolean operaattorit tuttuja, tarvitaanko opastusta jne. Millaisiin sisällön komponentteihin haku voidaan kohdentaa? Kuinka laajoja hakutuloksia tarvitaan? Kohdistuuko haku koko tekstisisältöön? Onko mukana myös ei-tekstuaalista informaatiota? Onko todennäköistä, että hakutuloksia on lukuisia? Usein perushakulomakkeen lisäksi tarvitaan muitakin lomakkeita esim. lomake, jossa hakua voidaan rajata jollakin tavalla tai laajennetun haun lomake, missä käyttäjä voi määritellä mihin tietokannan kenttään haku kohdennetaan. Esimerkki Euroopan unionin verkkopalvelun hakutoiminnot http://europa.eu.int/geninfo/query/search_fi.html Googlen tarkennettu haku http://www.google.com/advanced_search?hl=fi Lisälukemista kiinnostuneille Luonnollisen kielen haasteet ihminen-tietokone vuorovaikutuksessa. Koskenniemi, K. Johdatus kieliteknologiaan [online]. Helsinki: Helsingin yliopisto, 2004, päivitetty 24.11.2004 [viitattu 20.2.22005]. Luku 1: Johdanto. Saatavissa www-muodossa: <URL: http://www.ling.helsinki.fi/kit/2004s/ctl190/kt-johd-yl-art/ > Informaation visualisointi ja hakutoiminnot. Hearst, M. User Interfaces and Visualization, Julkaisussa Baeza-Yates, R. & Ribeiro-Neto, B. Modern Information Retrieval [online]. Addison-Wesley-Longman Publishing Co, 1999 [viitattu 20.2.2005]. 8. Interface Support for the Search Process. Saatavissa www-muodossa: <URL: http://www.sims.berkeley.edu/~hearst/irbook/10/node9.html > A Wikimedia project. Search Algorithms [online]. St. Petersburg (FL.): Wikimedia Foundation Inc., päivitetty 18.1.2005 [viitattu 20.2.2005]. Saatavisa ww-muodossa: <URL: http://en.wikipedia.org/wiki/search_algorithm >. Etsitkö hakukoneita? Seppo Honkonen on koonnut sivuilleen aika monta sellaista http://www.saunalahti.fi/seho/hakukoneet.html 5

Metatieto, sanastot, tesaurukset Metatieto Yleensä metatiedon (metadata) määritellään olevan tietoa tiedosta (data about data) Metatiedolla on merkittävä rooli informaatioarkkitehtuurin suunnittelussa ja toteuttamisessa. Metatieto - elementtejä käytetään kuvaamaan dokumenttien, kuvien, videoleikkeiden, audioleikkeiden, sovellusten ym. sisältöelementtien merkityksellistä sisältöä, käyttöä, ominaispiirteitä, alkuperää, muutoksia jne. Metatietoa voidaan käyttää tukemaan dokumenttien hallintaa, säilytystä, navigointia ja informaation löytämistä. Tarkoituksena on siis tiedon identifiointi ja kuvaileminen ja sen myötä tiedonsaannin tehostuminen. (Vrt. Rosenfeld & Morville 2002, 176-178; Stenvall 1998.) Metatietoa on ollut olemassa jo ennen Internetiä, mutta Internetissa julkaistun kuvailemattoman tiedon määrän lisääntymisen myötä metatiedon merkitys on kasvanut. Jotta voitaisiin tehostaa erilaisten verkkotallenteiden hakua on laadittu erilaisia kuvailistandardeja kuten esim. Dublin Core. Dublin Core formaatista on laadittu suomenkielinen SFS-standardi. (Esim. Stenvall 1998.) Dublin Core sisältää 15 ydinkenttää. Kuhunkin kenttään liittyy kenttätarkenne ja merkintäjärjestelmän tarkenne. Esimerkiksi aikamääre -kenttään voidaan liittää tarkenne, joka kertoo esim. onko kyseessä luomispäivä, päivityspäivä jne. sekä merkintäjärjestelmää kuvaava tarkenne esim. missä muodossa päivämäärä on annettu. (Ibid.) Osa metatiedon kentistä liittyy sisältöön, osa tekijätietoihin ja osa tunnistukseen. Sisältö Tekijätiedot Tunniste nimeke tekijä identifiointitunnus aihe muu tekijä formaatti kuvaus julkaisija aikamääre kate oikeudet kieli laji lähde suhde Taulukko 1. Dublin Core metatietostandardin ydinkentät. Lähde: Stenvall 1998. Metatieto voi sijaita erillään dokumentista kuten kirjaston kortit tai se voi olla upotettuna dokumenttiin esim. HTML-dokumentin HEAD-osioon.Esimerkiksi hakukoneet voivat hyödyntää metatiedon kenttiin sisällytettyä informaatiota. Metatiedon sisältämä informaation tulee olla relevanttia esim. avainsanat harkittava tarkkaan, hyödyllistä ja tarpeellista sekä muodoltaan yhteneväistä kaikilla sivuston sivuilla (kaikista sivuista kootaan samat tiedot). Suurimpana ongelmana yleensä onkin metatiedon sisältämän informaation heikko laatu. Kontrolloidut sanastot (controlled vocabularies) Kontrolloitu sanasto on harkittu kokoelma sanoja, joiden avulla kuvaillaan dokumenttin sisältöä. Erityyppiset sanastot eroavat toisistaan lähinnä kompleksisuuden ja ja termien välisten suhteiden esittämisen suhteen. 6

(Vocabularies) Simple Synonym Rings Authority Files Classificati on Schemes Thesauri Equivalence Hierarchical Associative (Relationship) Complex Kuva 2. Kontrolloidut sanastotyypit. Lähde: Rosenfeld & Morville 2002, 177.) Asiasanasto Asiasanasto on harkittu kokoelma sanoja, joiden avulla kuvaillaan dokumenttin sisältöä. Tarvoitteena on helpottaa tiedonhakua ja yhtenäistää sisällönkuvailua. Eri aloilla voi olla omia erityisiä asiasanastojaan. Luokittelujärjestelmä (Classification Schemes), taksonomiat Sanasto, joka sisältää sanojen väliset hierarkkiset suhteet. Tavoitteena on luokittelun poissulkevuus. esimerkiksi eliöiden luokittelu tai kirjastojen luokittelujärjestelmä. Tesaurukset Tesaurukset ovat tiedon tallennukseen ja hakuun käytettävien asiasanojen luettelo. Luettelossa ilmaistaan asiasanojen yhteydessä niiden suhteet muihin asiasanoihin(rinnakaistermit, laajemmat ja ja suppeammat termit) sekä ohjaustermeihin. Termien keskinäiset suhteet on määritelty hierarkkisesti. Ohjaustermi ohjaa käyttämään jotakin toista asiasanaa esim. kidnappaus KÄYTÄ ihmisryöstö. Mihin tämä kaikki liittyy? Eräs keskeisin este verkkopalveluiden kehittymiselle on se, että koneet eivät ymmärrä verkkosisältöjä. Sisällöt on laadittu ihmislukijaa varten. Hyvösen (2002) mukaan ratkaisuvaihtoehtoja on kaksi: 1. Kehitetään älykkäämpiä koneita esim. tiedonlouhinta (data mining), tiedonhaku (information retrieval). Ongelmana on kielen automaattisen tulkinnan vaikeus, ei-tekstuaalinen sisältö, kontekstin merkitys ymmärtämiselle. 2. Kehitetään älykkäämmin esitettyjä sisältöjä lähtökohtana semanttinen web. Tarkoituksena verkkosisältöjen esittäminen koneiden tulkittavassa muodossa. HTML-kuvaa sisällön ulkoisen muotoilun XML kuvaa tiedon rakenteen ja erottaa sen ilmiasustaan Semanttinen Web erottaa merkityksen tiedon rakenteesta. Sisältöjen merkityksiä kuvataan RDF:llä (Resource Description Framework). RDF Scheman (RDFS) avulla määritellään RDF-sovelluksissa käytettävä sanasto ja määritellään käsitehirarkkioita. 7

o Semanttisen Webin keskeisiä käsitteitä ovat ontologiat. Ontologiat ovat käytännössä eri alojen terminologisia, formaaleja käsitehierarkkioita, joissa määritellään alalla käytettävät termit ja käsitteet sekä niiden väliset suhteet. Lisätietoa kiinnostuneille Tesaurus-sivut. Yhteiskuntatieteellinen tietoarkisto FSD [online]. Tampere: Tampereen yliopisto. Päivitetty 27.9.2004 [viitattu 21.2.2005]. Saatavissa www-muodossa <URL: http://www.fsd.uta.fi/tesaurus/index.html >. Berners-Lee, T. Primer: Getting into RDF & Semantic Web using N3 [online]. W3C, 2004 [viitattu 21.2.2005]. Saatavissa www-muodossa: <URL: http://www.w3.org/2000/10/swap/primer.html >. Informaatioarkkitehtuurin suunnittelu Informaatioarkkitehtuurin suunnittelussa on huomioitava verkkopalvelun toteutus- ja käyttöympäristö (sosio-kulttuurinen ympäristö), ihmisten toimintaa ei tule tarkastella pelkästään yksilökeskeisen (psykologia, kognitiivinen psykologia) tekijöiden valossa, vaan sitä pitäisi pystyä tarkastelemaan myös kontekstuaalisena, yhteisöllisesti ja kulttuurisesti välittyneenä toimintana (sosiaalipsykologia) verkkopalvelun käyttötarkoitus, prosessit ja tapahtumakulut, joita on sekä verkkopalvelussa että sen ohessa, käyttäjät (esim. tieto- ja taitotaso, kognitiiviset ominaisuudet/rajoitteet, fysiologiset ominaisuudet/rajoitteet), tietoaineistot, joita voidaan hyödyntää sisältöjen tuottamisessa, sisällön rakenne, metatieto, tesaurukset, joita ovat tietyn alan kattavat tiedon tallennukseen ja hakuun käytettävien sanojen luettelot. Thesauruksessa esitetään sekä haussa käytettävät sanat että sanoja, jotka haussa on korvattava nk. ohjaustermeillä.... tesauruksen asiasanat muodostavat keinotekoisen hakukielen, jossa termit eivät välttämättä tarkoita samaa kuin luonnollisessa kielessä, eikä tesaurusta sen vuoksi tulisi käyttää sanakirjana." (Tekniikan Sanastokeskus r.y. 1989, 122) (vrt. Kauhanen-Simanainen 2003) Informaatioaineksen tunnistaminen ja rakenteistaminen Informaatiosuunnittelu lähtee liikkeelle tarvittavan informaatioaineksen määrittelyllä. Tarvittava aines määräytyy käyttäjien, käyttötilanteiden ja käyttötarpeiden mukaan. Suunnittelijan tulee tutustua käyttäjien tapaan jäsentää informaatiosisältöä. Informaatioelementit ryhmitellään tavoitteiden ja käyttötarpeiden mukaan osaksi informaatioarkkitehtuuria. Suunnittelussa on huomioitava myös mm. kustannukset, käyttöliittymä, liikkumistapa, erilaiset yhteydet ja päätelaitteet (Kauhanen-Simanainen 2003). Informaatioaineiston osana kannattaa hyödyntää olemassa olevaa ainesta kuten yrityksen/organisaation ylläpitämää tietoaineistoa sekä muuta alan tunnettua ja julkista tietoaineistoa. Yleensä suurin osa informaatioaineksesta luodaan toteutusprosessin aikana tai 8

vähintäänkin muokataan verkkopalvelun kannalta oleelliseen muotoon. Informaatioaines jäsennetään ja pilkotaan tarkoituksenmukaisen kokoisiksi informaatioelementeiksi. (Kauhanen- Simanainen 2003.) Informaatioelementin ominaisuuksia ovat mm. muoto, kieli sisältö, merkitys arvo, sijainti laatu, eheys, ymmärrettävyys, oikeellisuus, luotettavuus, ajantasaisuus, kattavuus määrä, laajuus (vrt. Kauhanen-Simanainen 2003) Informaatioarkkitehtuuri ja verkkopalveluiden personointi Verkkopalveluita kehitetään lähitulevaisuudessa monikanavajulkaisemisen ja personoinnin suuntaan. personoinnin avulla voidaan tehdä uusia tietoyhdistelmiä yksilöllisten tarpeiden mukaan personointi edellyttää hyvää tiedon paloittelua, kuvailua, luokittelua ja rikasta lähdemateriaalia Mm. "Single source publishing" perustuu siihen, että tieto sijaitsee yhdessä paikassa (XMLdokumentti, tietokanta,...), josta se julkaistaan personoituna esimerkiksi käyttäjän tarpeiden mukaisesti räätälöitynä. Hyvin suunniteltu informaatioarkkitehtuuri on oleellinen osa toimivaa single source publishing julkaisemista. Erilaiset päätelaitteet, käyttötilanteet ja käyttäjät huomioiva verkkopalvelu edellyttää korkeatasoista informaatioarkkitehtuuria. hyvin suunniteltu informaatioarkkitehtuuri on oleellinen, jotta tieto voidaan yhdistää metatasolla erilaisiin näkökulmiin (vrt. Kauhanen-Simanainen 2003.) Haasteita informaatioarkkitehtuurille Informaatioarkkitehtuurin suunnittelun ja toteutuksen tekee haasteelliseksi mm. informaation ja tiedon pirstoutuneisuuden jatkuva lisääntyminen informaation järjestämiseen (luokittelu) liittyvät haasteet kuten esimerkiksi kielen monimerkityksellisyys informaation heterogeenisyys - esimerkiksi verkossa olevien informaatiolähteiden kirjavuus (granularity), mediaelementtien ja tiedostomuotojen moninaisuus eri näkökulmien merkitys informaation järjestämisessä informaation tarkoitus (käyttötarkoitus, tavoitteet) osa jäsennyksestä on yhtenevää toisten saman kulttuurin edustajien tai ammattialan edustajien kanssa, osa voi olla yksilöllistä jäsennystä liikkumisjärjestelmän luomiseen liittyvät haasteet kuten sivuston käsitteellisen mallin välittäminen käyttäjälle nimeämiskäytäntö ja sen mahdollisimman suuri yksiselitteisyys (eri käyttäjät) toiminto- ja asiointiprosessien tukeminen metadatan hyödyntäminen metadatan merkitsemisen työläys vs. hyödyllisyys 9

metadatan käyttökelpoisuus tarkoituksenmukainen informaatioelementti kuinka pieniksi itsenäisiksi paloiksi informaatio tulisi pilkkoa (Rosenfelt & Morville 1998.) Haasteena informaatioarkkitehtuurille ovat erityisesti monikanavajulkaiseminen ja laadukkaiden personoitujen ja adaptoituvien palveluiden rakentaminen. Informaatiosuunnittelijoilta vaaditaan luovuutta ja innovatiivisuutta dynaamisten ja nopeasti vaihtuvien sisältöjen informaatioarkkitehtuurin suunnittelemiseen. (Kauhanen-Simanainen 2003.) Informaatioarkkitehtuurin arviointi Arvioinnissa voidaan kiinnittää huomiota yksittäisten verkkopalveluiden informaatioarkkitehtuuriin sinällään tai vastaavasti sitä voidaan verrata kilpailijan sivustoon verrata uutta versiota vanhaan versioon verrata informaatioarkkitehtuurin jonkin osa-alueen toteutus mahdollisuuksia saman aikaisesti kuten esimerkiksi leveä mutta matala hierarkia vs. kapea mutta syvä hierarkia samalla sivustolla (Toub 2000.) Arviointi voi olla luonteeltaan kvalitatiivista (laadullista) tai kvantitatiivista (määrällistä). Määrällinen arviointi soveltuu parhaiten yksittäisten, erillisten osien (esim. nimeämiskäytännöt) tai erillisten toimintojen arviointiin. Laadullinen arviointi puolestaan soveltuu tilanteisiin, joissa useita osa-alueita arvioidaan varsinaisissa käyttötilanteissa. (Toub 2000.) Toubin (2000) mukaan eri arviointitavat soveltuvat eri suunnittelu- ja toteutusprosessin kohtiin: Vaihe Tarpeiden määrittely Kartoitus Suunnitteluvaiheen alkupuoli Suunnitteluvaiheen viimeistely Toteutusvaihe Arviointitapa Sopia perustason mittarit/mittauskriteerit, joille suunnittelu pohjautuu - hyödynnetään prosessin myöhemmssä vaiheessa (kvalitatiivinen tai kvantitatiivinen) Määrittää informaatioarkkitehtuurin tarpeet käyttäjillä (kvalitatiivinen) Informaatioarkkitehtuurin vertailu kilpailevan verkkopalvelun informaatioarkkitehtuuriin (kvalitatiivinen tai kvantitatiivinen) Käyttäjien nimeämiskäytäntöjen ja ryhmittelyn mallintaminen (kvalitatiivinen) Hyväksyttää informaatioarkkitehtuuri käyttäjillä (kvalitatiivinen) Uuden informaatioarkkitehtuurin vertaaminen aiempaan (kvalitatiivinen tai kvantitatiivinen) Hyväksyä määritelty informaatioarkkitehtuuri (kvalitatiivinen) Aiemman informaatioarkkitehtuurin vertailu nykyiseen (kvalitatiivinen tai kvantitatiivinen) Informaatioarkkitehtuurin vertailu kilpailijan vastaavaan (kvalitatiivinen tai kvantitatiivinen) 10

Lähteet Hyvönen, E. Semanttinen Web kohti seuraavan polven Internet-palveluja [online]. Tietoyhteys, 2002, vol. nro. 3 [viitattu 21.2.2005]. Saatavissa pdf-muodossa: <URL: http://www.cs.helsinki.fi/u/eahyvone/publications/ty3_2002.pdf > Kauhanen-Simanainen, A. 2003. Informaatioarkkitehtuuri. Helsinki:Edita Prima Oy McGovern, G. & Norton, R. 2002. Content critical - Gaining Competitive Advantages Through High-Quality Web Content. London: Prentice Hall. Morville, P. In Defense of Search [online]. Ann Arbor (MI.): Semantic Studios, 2001, [julkaistu] 4.12.2001 [viitattu 20.2.2005]. Saatavissa ww-muodossa: <URL: http://semanticstudios.com/publications/semantics/000004.php >. Rosenfeld, L. & Morville, P. 1998. Information Architecture. Cambridge: O Reilly & Associates Inc. Rosenfeld, L. & Morville, P. 2002. Information Architecture for World Wide Web. 2 nd ed. Sebastopol: O Reilly Media Inc. Stenvall, J. Dublin Core -formaatin käyttöopas [online]. Helsinki: Helsingin yliopiston kirjasto, julkaistu 21.9.1998, päivitetty 3.1.2002 [viitattu 20.2.2005]. Saatavissa wwwmuodossa: <URL: http://www.lib.helsinki.fi/dublin_core/dc-opas2002.html> Tekniikan Sanastokeskus r.y. 1989. Sanastotyön käsikirja. Soveltavan terminologian periaatteet ja työmenetelmät. Jyväskylä. Toub, S. Evaluating Information Architecture [online]. Argus Center for Information Architecture, 2000 [viitattu 21.2.2005]. Saatavissa www-muodossa: < http://argus-acia.com/white_papers/evaluating_ia.html> 11