Tampereen yliopisto Informaatiotutkimuksen laitos Mikko Pennanen Ongelman jäsentymisen yhteys tiedonhakutaktiikoiden muutokseen. Tutkimus opiskelijoiden tiedonhausta tutkimussuunnitelman laadinnan aikana Informaatiotutkimuksen pro gradu-tutkielma Lokakuu 1999 Tampere
TAMPEREEN YLIOPISTO Informaatiotutkimuksen laitos PENNANEN, MIKKO ILMARI Ongelman jäsentymisen yhteys tiedonhakutaktiikoiden muutokseen. Tutkimus opiskelijoiden tiedonhausta tutkimussuunnitelman laadinnan aikana Informaatiotutkimuksen pro gradu-tutkielma Informaatiotutkimus Lokakuu 1999 Tutkimuksen tehtävänä on yhdistää tiedonhankinnan ja tiedonhaun tutkimusta tarkastelemalla kompleksin tehtävän suorittamisen aikana tapahtuvaa ongelman jäsentymistä sekä sen yhteyttä tiedonhaussa tapahtuviin muutoksiin. Tiedonhaun tarkastelussa rajoitutaan hakutaktiikoiden muutoksen tarkasteluun siirtojen tasolla. Analyysin kohteena ovat tiedonhaussa käytettyjen fasettien, termien sekä niitä yhdistävien operaattoreiden muutos ongelman jäsentyneisyyden asteen kasvaessa. Tutkimuksen empiirisen aineiston kohteeksi valittiin 11 Tampereen yliopist informaatiotutkimuksen opiskelijaa jotka laativat seminaarityöskentelyn aikana tutkimussuunnitelman omaa pro gradu-tutkielmaansa varten. Opiskelijoiden tiedonhankintaa seurattiin neljän kuukauden ajan keväällä 1999. Opiskelijat haastateltiin seminaarin aloitusvaiheessa, keskivaiheilla sekä seminaarin lopussa. Näin kerättiin tietoa opiskelijoiden tiedonhankinnasta ennen tutkimuksen fokuksen muotoilua, fokuksen muotoiluhetkellä sekä fokuksen muotoilun jälkeen. Tiedonkeruumenetelminä käytettii mm. haastattelua, tiedonhakutallennetta sekä opiskelijoiden pitämää tutkimuspäiväkirjaa.
Tutkimuksen teoreettisena mallina sovellettiin Vakkarin esittämää mallia ongelman jäsentymisen ja tietotoimintojen välisestä yhteydestä. Ongelman jäsentymistä mitattiin tutkimuksessa Kuhlthaun tiedonhankinnan prosessimallin vaiheiden avulla. Tutkimuksen tulosten mukaan opiskelijoiden ongelma jäsentyi seminaarityöskentelyn aikana. Opiskelijat etenivät ongelman jäsentämisessä pääsääntöisesti Kuhlthaun esittämien vaiheiden mukaisesti. Ongelman jäsentyessä tiedonhakijoiden haut tulivat entistä monipuolisemmiksi. Hakujen monipuolistumien tuli esille niiden pituuden kasvuna sekä käsitteellisen sisällön rikastumisena. Ongelman jäsentyneisyyden asteen kasvaessa erityisesti kaventavien, konseptuaalisten siirtojen määrä kasvoi. Hakijat toivat hakuun myös entistä enemmän kaventavia ja rinnakkaisia termejä. Ongelman ollessa jäsentynyt tiedonhakijat tekivät kapeita, tarkkaa aihetta koskevia hakuja. Tutkimuksen tulokset tukevat Vakkarin mallia tietotoimintojen ja ongelman jäsentymisen välisestä yhteydestä. Tämä tutkimus on myös ensimmäinen tutkimus jossa tiedonhaussa tapahtuvia muutoksia tarkastellaan koko tehtäväprosessin perspektiivistä. ASIASANAT: tiedonhankinta: teoriat; tiedonhaku: teoriat; tiedonhaku: tutkimus; tiedonhaku: tietokannat; tiedonhaku: opiskelijat; tiedonhakututkimus; tiedonhankintatutkimus; tiedonhaku: strategiat
SISÄLLYS 1. Johdanto... 1 2. Tiedonhankinnan ja tiedonhaun tutkimus informaatiotutkimuksessa... 3 2.1. Tiedonhankinnan tutkimus...3 2.2. Tiedonhaun tutkimus... 5 2.3. Tutkimussuuntauksien integrointi... 9 3. Tutkimuksen viitekehys... 11 3.1. Tutkimuksen teoreettinen tausta... 11 3.1.1. Vakkarin malli... 11 3.1.2. Kuhlthaun malli... 13 3.1.3. Ennakkotietämys ja tiedonhankinta... 17 3.2. Keskeiset käsittee... 18 3.2.1. Hakulauseke... 19 3.2.2. Hakutermit... 20 3.2.3. Siirrot, taktiikat, stratageemat ja strategia...21 3.2.4. Operaattorit... 24 4. Tutkimustehtävä ja aikaisempi tutkimus... 27 4.1. Tutkimustehtävän täsmentäminen... 27 4.2. Aikaisempi tutkimus... 29
5. Tutkimuksen aineistonkeruu ja tutkimusaineiston analyysi... 32 5.1. Tutkimuksen aineistonkeruu... 33 5.2. Tutkimusaineiston analyysi... 38 6. Tulokset... 42 6.1. Ongelman jäsentyminen tiedonhankintaprosessin aikana... 42 6.2. Ongelman jäsentymisen vaikutus tiedonhakuihin... 46 6.2.1. Hakujen kokonaiskuva... 46 6.2.2. Hakujen kaventaminen ja laajentaminen...49 6.2.3. Haun käsitteellisen sisällön muutos... 52 6.2.3.1. Fasetit... 52 6.2.3.2. Hakutermit... 54 6.2.3.3. Termit/fasetti... 58 6.2.3.4. Operaattorit... 58 7. Tulosten tarkastelu ja diskussio... 62 7.1. Tulosten tarkastelu... 62 7.2. Diskussio... 65
1. Johdanto Informaatiotutkimus on perinteisesti jakautunut kahtia tiedonhaun ja tiedonhankinnan tutkimukseen. Näiden kahden tutkimussuuntauksen välillä ei ole juuri ollut yhteistyötä, vaikka monet tutkijat ovatkin korostaneet yhteistyön ja tutkimustulosten integroinnin tarvetta (ks. esim. Bates 1989; Belkin 1993; Ingwersen 1992; Kuhlthau 1993; Marchionini 1995). Tiedonhakututkimus on ollut perinteisesti kiinnostunut lähinnä dokumenttien esitystavoista, dokumenttien hausta ja erilaisista hakustrategioista sekä relevanssin arvioinnista. Tiedonhankinnan tutkimus on taas tutkinut lähinnä erilaisia tiedonhakukanavia, tiedonlähteitä ja niiden käyttöä. Perinteiset tiedonhakututkimukset ovat tarkastelleet yleensä ainoastaan yhtä hakua. Tiedonhakua ei ole yleensä liitetty tiedonhankintaan johtaneeseen tehtävään. Tutkimuksessa ei ole myöskään otettu huomioon tiedonhankinnan prosessiluonnetta. Tämä tutkimus on osa laajempaa tutkimushanketta Tasks, Information Searching and Relevance Assesments. Tutkimushankkeen tavoitteena on yhdistää tiedonhankinnan ja tiedonhaun tutkimusta tarkastelemalla tehtävän kompleksisuuden ja ongelman jäsentymisen yhteyttä tietotoiminnoissa tapahtuviin muutoksiin. Tietotoimintoja ovat hakijoiden hakema tietotyypit, haetun tiedon relevanssiarviot sekä tiedonhakuun käytetyt hakustrategiat. Tämän tutkimuksen aiheena on hakutaktiikoiden muutos tiedonhankintaprosessin aikana. Hakustrategioita tarkastellaan tutkimuksessa tiedonhaussa tehtävien siirtojen tasolla. Tutkimushankkeeseen kuuluvasta toisesta ongelmasta, dokumenttien ja viitteiden relevanssin arvioinnista ja sen suhteesta ongelman jäsentymiseen on valmistunut toinen pro gradu-tutkielma (ks. Hakala 1999). Tutkimukseen valittiin informaatiotutkimuksen opiskelijoita, jotka olivat aloittamassa pro gradu-tutkielman tekoa. Tutkimuksessa seurattiin heidän seminaarityöskentelyään neljän kuukauden ajan keväällä 1999. Opiskelijat haastateltiin seminaarin alussa, keskivaiheella sekä lopussa. Näin pyrittiin saamaan tietoa tiedonhauista ennen tutkimuksen fokuksen hahmottumista, fokuksen muotoiluvaiheessa sekä fokuksen muotoilun jälkeen. Aineisto 1
kerättiin haastattelulla, tiedonhakutallenteella sekä tutkittavien pitämillä tutkimus- ja tiedonhakupäiväkirjoilla. Ongelman jäsentymisen asteen arvioinnissa hyödynnettiin lisäks Kuhlthaun Process Survey-lomakkeita sekä opiskelijoiden piirtämiä miellekarttoja. Tutkimuksessa käydään aluksi lyhyesti läpi informaatiotutkimuksen eri suuntauksien kehittymistä sekä niiden keskeisiä tutkimusalueita. Luvussa kolme esitetään tutkimuksen viitekehys sekä määritellään tutkimuksen keskeiset käsitteet. Luvussa neljä esitetään tutkimustehtävä sekä tutustutaan aikaisempiin aihetta sivuaviin tutkimuksiin. Viidennessä luvussa käsitellään tutkimuksen tiedonhankintamenetelmiä sekä esitetään tutkimusaineiston analyysi. Luvussa kuusi esitetään tutkimuksen tulokset. Luvussa seitsemän esitetään yhteenveto tuloksista sekä pohditaan niiden merkitystä tiedonhaun tutkimukselle. 2
2. Tiedonhankinnan ja tiedonhaun tutkimus informaatiotutkimuksessa Informaatiotutkimus tutkii tiedon välittymistä tiedon tuottajien ja tiedon käyttäjien välillä. Informaatiotutkimuksen tarkoituksena on luoda käsitys yhteisöjen ja yksilöiden informaatioympäristöistä, tiedontarpeista ja hankintatavoista sekä tehokkaasta tietojen organisoinnista. Informaatiotutkimuksen tavoitteena on, että tietoa haluavat henkilöt saavat myös haluamansa tiedon käsiinsä mahdollisimman vaivattomasti (Järvelin 1995, x; Vakkari 1999b, 28.) Informaatiotutkimuksen kaksi keskeistä tutkimusaluetta ovat tiedonhankintatutkimus (IS, information seeking) ja tiedonhakututkimus (IR, information retrieval). 1 Tiedonhankintatutkimuksen keskeisiä tutkimuskohteita ovat olleet tiedontarpeiden syntyä tuottavat tekijä, erilaisten tiedonhankintakanavien ja tiedonlähteiden valinta ja käyttö sekä niiden käytön esteisiin ja useuteen liittyvät tekijät (Savolainen 1999, 74). Tiedonhakututkimus on puolestaan tarkastellut mm. tietokantojen sisältöä ja rakennetta sekä niiden tallennus- ja hakumenetelmiä sekä tiedonhaun käyttöliittymiä ja tiedonhakujärjestelmien evaluointia (Järvelin 1995, 36-37). 2.1. Tiedonhankinnan tutkimus Tiedonhankinnan lähtökohtana on pidetty yleensä henkilön tiedontarvetta. Tiedontarve voi virittää henkilössä tiedonhankintakäyttäytymistä (vrt. Wilson 1981). Tiedontarpeen määritteleminen yksioikoisesti ei ole mahdollista, mutta tiedontarpeista on esitetty useita erilaisia jäsennyksiä. Taylor (1968, 182-183) on jakanut tiedontarpeen sen tietoisuuden astee perusteella neljään eri luokkaan: ydintarpeeseen, tiedostettuun tarpeeseen, muotoiltuun tarpeeseen sekä kompromissitarpeeseen. Ydintarve (visceral need) voi olla osittain alitajuinen tai tiedostettu. Henkilö kokee yleistä tyytymättömyyden tunnetta, joka saattaa johtaa tiedonhankintaan. Tiedontarpeen määrittely tai käsitteellistäminen ei ole vielä mahdollista. Tiedostetussa tarpeessa (concious need) henkilö tunnistaa tiedontar- 1) Tiedonhankinnan ja -haun lisäksi muita informaatiotutkimuksen osa-alueita ovat informaatiohistoria, tietohallinto sekä tieteellisen viestinnän tutkimus omine sovelluksineen (bibliometriikka) (ks. Mäkinen 1999). 3
pee olemassaolon vaikkakin hänen tuntemuksensa asiaa kohtaan voivat olla ristiriitaisia. Muotoillussa tiedontarpeessa (formalized need) henkilö pystyy jo jäsentämään tiedontarpeensa varsinaiseksi kysymykseksi. Tässä vaiheessa tiedontarpeeseen voivat vaikuttaa käytössä olevat tiedonhankintakanavat. Neljäs luokka eli kompromissitarve (compromissed need) edustaa kaikkein jäsentyneintä tiedontarpeen ilmausta. Tiedontarve on tässä vaiheessa jo muotoiltu sellaiseksi, että se mahdollisimman hyvin vastaa tietovarantojen kuvailuun käytettävää kieltä (erilaiset dokumentaatiokielen koodit kuten asiasanat ja luokitusnotaatiot). Kompromissitarpeen mukainen jäsennys on lähellä tiedonhakujärjestelmälle esitettävää tiedontarpeen kuvausta, hakukyselyä (vrt. myöhemmin luku 3.2.). Belkinin (Belkin et al. 1982, 62-63; Belkin 1984, 114-115) mukaan tiedontarpeessa on kyse henkilön kokemasta "tiedon anomaliasta" (ASK=Anomalous State of Knowledge), puutteellisesta tilasta tietämyksessä. Henkilö tuntee, että hänen tämänhetkinen tietämyksensä ei riitä jonkin asian suorittamiseen. ASK eli tiedon anomalia estää tehokkaan ongelmanratkaisun ja toiminnan, minkä vuoksi yksilön täytyy hankkia tietoa. Tiedonhankintaan saatetaa käyttää erilaisia tiedonhakujärjestelmiä, joiden tulisi tukea henkilön tiedon anomalian hahmottamista. Anomaalisessa tilanteessa henkilö ei välttämättä pysty rakentamaan tarkkoja kyselyitä tiedonhakujärjestelmälle. Dervin pitää tiedontarvetta eräänlaisena kuiluna ("gap") henkilön tietämyksessä. Henkilö huomaa, ettei hänen aikaisempi tietämyksensä riitä jonkin asian ratkaisemiseen, jolloin hän kohtaa kuilun tietämyksessään. Henkilö pyrkii ratkaisemaan ongelman parhaalla mahdollisella tavalla, ts. rakentamaan sillan kuilun yli. Sillan rakentaminen viittaa Dervinin konseptiossa tiedonhankintaan. Tiedonhankintaan voidaan käyttää erilaisia välineitä kuten esim. muilta saatuja neuvoja. Tiedonhankkija päättää, mitkä välineet ovat oikeita kuilun ("gap") täyttämiseen. (Savolainen 1999, 96-97). Kuhlthaun (1993, 111) mukaan tiedonhankinnassa on kyse konstruktioprosessista, joka lähtee liikkeelle tiedonhakijan tuntemasta epävarmuuden tilasta ja päättyy parhaimmassa tapauksessa ongelmallisten asioiden jäsentymiseen ja ymmärtämiseen tai vaihtoehtoisesti pahimmillaan entistä vaikeampaan epävarmuuden ja ahdistuksen tunteeseen. Tiedonhan- 4
kinta on siis matka kohti jäsentyneenpää kuvaa asiasta. Tiedonhankinnan aikana koetaan erilaisia tunnetiloja, jotka vaihtelevat ahdistuksesta ja epävarmuudesta optimismiin ja varmuuden tunteeseen. Kuhlthau tarkastelee tiedonhankintaa prosessinäkökulmasta ja on erottanut prosessista erilaisia vaiheita joissa tunteet, toiminnot ja ajatukset vaihtelevat. 2.2. Tiedonhaun tutkimus Tiedonhaun tutkimus on tiedonhankinnan tutkimuksen ohella toinen keskeinen informaatiotutkimuksen alue. Tiedonhaun tutkimuksen tavoitteena on tutkia tiedonhakuun liittyvi prosesseja ja ilmiöitä ja näin helpottaa informaation välittymistä tiedon tuottajan ja tiedontarvitsijan välillä. Ingwersen jakaa tiedonhaun tutkimussuuntaukset kolmeen eri osaalueeseen: perinteiseen, käyttäjäsuuntautuneeseen ja kognitiiviseen tutkimukseen. (Ingwersen 1992, 49, 58-60.) Tiedonhaun perinteinen tutkimus kiinnittää huomion tiedonhakujärjestelmiin jättäen käyttäjät huomioonottamatta. Perinteinen suuntaus tarkastelee mm. dokumenttien ja hakutermien kuvailua, hakutekniikoita sekä tiedonlähteiden ja tiedonhakujärjestelmien piirteitä j mekaanisia komponentteja. Perinteisen tutkimussuuntauksen piiriin kuuluvat mm. luokituksen ja indeksoinnin tutkimus. (Ingwersen 1992, 62.) Dokumentit-->Dokumenttien kuvaus--> TÄSMÄYTYS <--Kysely <--Tiedontarve KUVIO 1. Tiedonhaun perinteinen malli (Bates 1989, 408; Ingwersen 1992, 49). Tiedonhaun perinteisen koulukunnan piirissä tehdyt tutkimukset ovat tarkastelleet yleensä ainoastaan yhtä yksittäistä hakua. Tiedonhakua on tarkasteltu tiedonhakujärjestelmäll 5
esitetyn kyselyn ja hakujärjestelmään tallennettujen dokumenttien välillä tapahtuvana täsmäyksenä. Tiedontarvetta on pidetty suorana hakukyselyn vastineena. Kyselyyn on pitänyt tarkasti ilmaista kaikki tiedontarpeeseen sisältyvät aspektit. Hyvin laaditun kyselyn on katsottu tuottavan tiedonhakijalle parhaan mahdollisen hakutuloksen. (ks. Ingwersen 1992, 72.) Perinteistä koulukuntaa onkin joskus kutsuttu "täydellisen täsmäytyksen paradigmaksi" ("the match paradigm") (vrt. Hert 1997, 6-10). Haun tuomia tuloksia on mitat tu mm. saannin ja tarkkuuden käsitteillä (Ingwersen 1992, 79). Perinteist paradigmaa voidaan kutsua myös järjestelmäkeskeiseksi suuntaukseksi, koska se tarkastelee ainoastaan lähinnä tietojärjestelmiä. Käyttäjiä pidetään passiivisina, järjestelmälle alisteisina objekteina. (vrt. Hert 1997, 7-8.) Perinteinen koulukunta on puutteistaan huolimatta saanut kuitenkin aikaan merkittävää edistystä tiedonhaun alueella erityisesti järjestelmäkehityksessä. Perinteisen paradigman tuottamat tutkimustulokset hyödyttävät informaatiotutkimuksen lisäksi myös muita tieteitä kuten tietojenkäsittelyoppia. (Ingwersen 1992, 80.) Tiedonhaun perinteistä mallia alettiin arvostella erityisesti 1980-luvulla. Tutkimuksessa alettiin keskittyä entistä enemmän tiedon ja tietojärjestelmien käyttäjien tutkimukseen. Käyttäjäsuuntautunut tiedonhaun tutkimus tarkastelee tiedonhakua informaation käyttäjän näkökulmasta jättäen tiedonhakujärjestelmän monimuotoisuuden ja kompleksisuuden tarkastelun ulkopuolelle. Tutkimus keskittyy tiedonhaun inhimillisiin komponentteihin ja tutkii käyttäjän hakukäyttäytymistä, tiedontarpeita ja niihin liittyvien ongelmien esittämistä, tiedonvälittäjän roolia tiedonhaussa sekä tiedontarvitsijan ja tiedonvälittäjän välistä vuorovaikutusta. (Ingwersen 1992, 83-85.) Belkin esitti ajatuksensa henkilön kokemasta "tiedon anomaliasta" (ASK) 1980-luvun alussa (ks. Belkin et. al 1982, vrt. edellä luku 2.1.). Perinteisen järjestelmäkeskeisen paradigman kritiikkiä jatkoivat Dervin & Nilan 1980-luvun puolivälissä. Heidän mukaansa tutkimuksessa tuli siirtyä entistä käyttäjälähtöisempään suuntaan. Tutkimuksessa tuli ko rostaa erityisesti käyttäjän sisäistä käsitystä tiedosta hänen ulkoisen käyttäytymisen sijaan. Tiedonhakijaa ei pitänyt enää nähdä mekaanisena ja passiivisena objektiivisen tiedon vas- 6
taanottajana, vaan tiedonhankinnassa tuli ottaa huomioon tiedonhakijan konstruktiivisuus, tavoitteellisuus ja aktiivisuus sekä tiedonhankinnan tilannekohtaisuus. (Dervin & Nilan 1986, 12-16.) Tiedonhaun perinteinen paradigma ei liittänyt tiedonhakutapahtumaa siihen ongel maan/tehtävään, joka viritti tiedonhakijassa tiedontarpeen ja käynnisti tiedonhaun. Perinteistä paradigmaa voidaan näin pitää staattisena, eikä se kuvaa kattavasti tiedonhakijan todellista käyttäytymistä. 1980-luvun lopussa perinteisen paradigman kritiikkiä jatkoi Bates esittämällä ajatuksen tiedonhankinnasta eräänlaisena "marjanpoimintana". Batesin mukaa todellisessa tiedonhakutilanteessa jokainen saatu "tiedonpalanen" vaikuttaa tiedonhaun suuntaan ja kulkuun. Tieto on kuin metsässä olevat marjat. Tieto ei tule itsestään hakijalle, vaan se täytyy poimia erikseen yksitellen "palasina" muiden joukosta. Tiedonhaku on siis eräänlainen oppimisprosessi. Jokainen saatu tiedonpalanen muokkaa ja lisää tiedonhakijan tietämystä. Tiedonhaussa käytetyt kyselyt eivät ole staattisia, vaan ne voiva muuttua henkilön keräämien "tiedonpalojen" myötä. Tietokantahakujen lisäksi tiedonhakija hakee tietoa yleensä myös muilla tavoin, kuten esim. selailemalla lehtiä ja ketjuttamall lähteitä aikaisemmista lähdeviitteistä. (Bates 1989, 409-413.) Tiedonhakujärjestelmiä tulisi kehittää siten, että ne tukisivat tiedontarpeen hahmottamista sekä hakijan ja järjestelmän välistä vuorovaikutusta. (Bates 1989, 419; Belkin et. al. 1982, 65). Järjestelmän ja hakijan välistä vuorovaikutusta korostavaa näkökantaa kutsutaan tiedonhaun interaktiiviseksi lähestymistavaksi. Tiedonhakujärjestelmän kanssa käytävä vuorovaikutus muuttaa tiedonhakijan tiedontarpeita ja näin tiedonhaussa tehtäviä kyselyitä. Belkinin (1993, 5) mukaan tiedonhakijan ja järjestelmän vuorovaikutukseen liittyy välttämättä tulkintaa, joka taas muuttaa tiedonhankintaan johtanutta anomaalisen tietämyksen tilaa sekä saa näin aikaan muutoksia sekä tiedontarpeissa että tietotoiminnoissa. Perinteisen järjestelmäkeskeisen suuntauksen ja käyttäjäsuuntautuneen tiedonhaun tutkimuksen lisäksi Ingwersen on erottanut vielä kolmannen tutkimussuuntauksen, jota hän nimittää tiedonhaun kognitiiviseksi tutkimukseksi. Tässä suuntauksessa tiedonhakua käsitellää kokonaisuutena. Kognitiivisen suuntauksen painotus on tiedonhaun vuorovaiku- 7
tuksessa ja informaation välittymisessä tietämysrakenteiden ja mallien kautta. Suuntauksen mukaan tiedonhaku on päämääräsuuntautunutta ongelmanratkaisua. Epävarmuus on osa tiedonhakuprosessia. (Ingwersen 1992, 159.) Hertin (1997, 13-16, 22-23, 33) jako tiedonhaun suuntauksista poikkeaa hieman Ingwersenin esittämästä jaosta. Hert jakaa tiedonhaun tutkimussuuntaukset järjestelmäkeskeisee ja käyttäjäsuuntautuneeseen tutkimukseen. Järjestelmäkeskeinen tutkimus tarkastelee tietojärjestelmien ominaisuuksia sekä soveltaa lähinnä kokeellista tutkimusmenetelmää. Käyttäjäkeskeinen tutkimussuuntaus voidaan Hertin mukaan jakaa edelleen kolmeen osaan. Ensimmäistä osaa Hert pitää relevanssin tutkimisena. Relevanssitutkijat ovat kiinnostuneit siitä, miten relevanssiarvioita tehdään ja minkälaisia kriteereitä niissä käytetään. Kognitiivisessa paradigmassa hyödynnetään kognitiivisen psykologian viitekehyksiä ja metodeita tiedonhakututkimuksen alueella. Kolmas, prosessiorientoitunut paradigma painottaa tiedonhaun prosessiluonnetta ja sen ymmärtämistä. Tiedonhaku nähdään prosessina, jossa tiedonhakija toimii aktiivisesti vuorovaikutuksessa tiedonhakujärjestelmän kanssa. Tiedonhakija sovittaa toimintansa yhteen hakujärjestelmän toiminnan kanssa. Tiedonhaku saattaa muuttaa hakijan tavoitteita ja hänen käyttämiään tiedonhakustrategioita. Prosessiorientoitunutta tutkimusta on Hertin mukaan hedelmällisintä tutkia naturalistisella tutkimusotteella. Naturalistisessa tutkimusotteessa tutkitaan todellisia tilanteita ja dynaamista prosessia. Tutkimuksessa pyritään rakentamaan ilmiöstä kokonaiskuvaa yksittäisten muuttujien tutkimuksen sijaan. 2.3. Tutkimussuuntauksien integrointi Tiedonhankinnan ja tiedonhaun tutkimuksen välillä on ollut niukasti yhteistyötä, vaikka monet tutkijat ovatki viime aikoina korostaneet yhteistyön ja tutkimustulosten integroinnin tarvetta (ks. mm. Bates 1989; Ingwersen 1992; Kuhlthau 1993; Marchionini 1995; vrt. Vakkari 1999a, 35). Marchioninin mukaan tiedonhaun tutkimus on osa tiedonhankinnan tutkimusta. Tiedonhaku on se osa tiedonhankintaa, joka toteutetaan käyttämällä apuna tietokonetta (Marchionini 1995, 8). Tiedonhankinnassa on kyse koko tiedonlähteiden 8
ja kanavien kirjon hyödyntämisestä. Tietokoneen avulla tehtävä tiedonhaku on siis vain osa tiedonhankintaa. Tiedonhankinnan tutkimuksessa tiedonhankinta on käsitetty sisältyväksi siihen toimintaan, joka saa sen aikaan. Tiedonhankinnan lähtökohtana on usein jonkin tehtävän suorittaminen. Tiedonhankintaan sisältyy usein tiedonhakua, jossa sovelletaan erilaisia hakustrategioita, ts. tiedonhaku on osa tiedonhankintaa. Usein tiedonhakua tehdään useaa kertaan tehtävän suorittamisen aikana (vrt. Spink et. al. 1998). Informaatiotutkimuksessa tiedonhankintaa ja -hakua on kuitenkin tarkasteltu erikseen, eikä tiedonhakua ole liitetty haun aikaansaaneeseen tehtävään. Edellä kuvattu tiedonhaun interaktiivinen tutkimussuuntaus korostaa henkilön ja tiedonhakujärjestelmän välistä vuorovaikutust ja sen merkitystä hakukyselyjen kehittymiseen. Tutkimussuuntaus on syventänyt tiedonhakua koskevaa ymmärrystä, mutta se ei ole kuitenkaan liittänyt tiedontarpeeseen johtaneita tekijöitä hakustrategioissa tapahtuneisiin muutoksiin. (Vakkari 1999a, 38-39.) Yhtä yksittäistä hakuistuntoa tutkimalla ei saada kokonaisvaltaist kuvaa hakijan toiminnasta ja hänen tavoitteidensa muuttumisesta (vrt. Hert 1996). Yksittäistä hakuistuntoa tarkastelevat tutkimukset eivät ota myöskään huomioon tiedonhankinnan prosessiluonnetta. Tiedonhankintaprosessia koskevan kokonaiskuvan saaminen edellyttää tiedonhankinnan ja tiedonhaun tutkimussuuntauksien integroimista. Yksittäisen hakuistunnon sijaan tiedonhakua tulee tarkastella osana koko tehtäväprosessia. Tehtäväprosessin tutkiminen auttaa paremmin ymmärtämään tiedonhakuun liittyviä ilmiöitä ja niissä tapahtuvia muutoksia. (Vakkari 1999a, 35-37.) Savolaisen mukaan tiedonhankinnan ja -haun välisen eron teko on usein vaikeaa (Savolainen 1999, 75). Tutkimussuuntauksien erojen korostamisen sijaan on mielekkäämpää yrittää hakea niitä yhdistäviä tekijöitä. Tässä tutkimuksessa tutkimussuuntauksia pyritään yhdistämään tarkastelemalla kompleksin työtehtävän suorittamisen aikana tehtyä tiedonhakua. Tiedonhakujen kehittymistä seurattiin koko tehtäväprosessin ajan. Prosessinäkökulman lisäksi tutkimus yhdistää tiedonhankinnan- ja tiedonhaun traditiota hyödyntämällä kummankin tutkimussuuntauksen tuottamia teoreettisia välineitä. Tiedonhakujen analyys perustuu tässä tutkimuksessa lähinnä interaktiivisen IR-paradigman piirissä tehtyyn tutki- 9
muksee ja sen tuottamiin tuloksiin. Henkilöiden tehtäväprosessin kulkua seurataan puolestaa Kuhlthaun tiedonhankinnan prosessimallin vaiheiden avulla. Kuhlthaun mallin on perinteisesti katsottu kuuluvan tiedonhankintatutkimuksen alueelle. 10
3. Tutkimuksen viitekehys Tässä luvussa esitetään aluksi tutkimuksen taustalla oleva teoreettinen malli ongelman jäsentymisen ja tietotoimintojen välisestä suhteesta sekä siihen kuuluvista elementeistä. Tämän jälkeen tarkastellaan ongelman jäsentymisen arviointia tiedonhankintaprosessin aikana. Lopuksi määritellään tutkimuksen empiirisessä osassa esille tulevat keskeiset käsittee 3.1. Tutkimuksen teoreettinen tausta 3.1.1. Vakkarin malli Tutkimuksessa sovelletaan Vakkarin (1999a) esittämää mallia ongelman jäsentymisen j tietotoimintojen välisestä yhteydestä. Vakkarin mallissa erilaiset tietotoiminnot (tiedonhakustrategiat, tietotyypit ja relevanssiarviot) kytketään tehtävän monimuotoisuuteen ja ongelman jäsentymiseen. Tiedonhankintaa pidetään mallissa dynaamisena ongelmanratkaisuprosessina, jonka aikana hyödynnetään erilaisia tietotyyppejä, sovelletaan erilaisia hakustrategioita ja tehdään saadun tiedon relevanssia koskevia arvioita. Tiedonhankintaprosessin aikana tiedonhakijan mielessä tapahtuu erilaisia tietämysrakenteiden muutoksia eli oppimista, jonka seurauksena tietotyyppejä ja hakustrategioita koskevat käsitykse muuttuvat. Vakkarin mallin keskeisiä elementtejä ovat ongelman jäsentyneisyys, tehtävän kompleksisuus, aihetta koskeva ennakkotietämys sekä tietotoiminnot. Kuvio 2. kuvaa näiden elementtien välisiä suhteita. 11
Aihetta koskeva ennakkotietämys (tietämysrakenteet Tehtävän kompleksisuus Tietotoiminnot -Hakustrategiat -Relevanssiarviot -Tietotyypit Ongelman jäsentyneisyys KUVIO 2. Vakkarin mallin peruselementit ja niiden väliset suhteet (Vakkari 1999a, 48). Tehtävän kompleksisuudella tarkoitetaan sen ennalta määräytyvyyden astetta. Tehtävän ennalta määräytyvyys koskee tehtävän tietovaatimuksia, suoritusprosessia ja tulosta. Byström & Järvelin ovat esittäneet luokituksen tehtävän kompleksisuudesta jakamalla tehtävät automaattisiin tietojenkäsittelytehtäviin, normaaleihin tietojenkäsittelytehtäviin, normaaleihin päätöksentekotehtäviin, tunnettuihin, aitoihin päätöksentekotehtäviin sekä täydellisiin, aitoihin päätöksentekotehtäviin. (Byström & Järvelin 1995, 194-195.) Tässä tutkimuksessa tehtävän kompleksisuus on vakioitu. Tutkittavien henkilöiden tehtävänä oli laatia pro gradu-työn tutkimussuunnitelma annetun ajan kuluessa. Tutkimussuunnitelman laatiminen on vaativa tehtävä, jota voidaan pitää Byströmin & Järvelinin (1995, 194-195) luokituksen mukaan tunnettuna, aitona päätöksentekotehtävänä. Niille on tyypillistä se, että henkilö tietää mistä hänen tulee tehdä päätös ja että tehtävän prosessi on kuvailtavissa, mutta päätöksenteolle ei ole olemassa vakiintuneita toimintatapoja. Tutkimussuunnitelman tietovaatimuksia ei voi määritellä tarkasti etukäteen. Tutkimussuunnitelma 12
voidaan myös laatia usealla eri tavalla. Tehtäväprosessin päätös on kuitenkin tiedossa: opiskelijan laatima tutkimussuunnitelma omaa työtä varten. Ongelman jäsentyneisyyden asteella tarkoitetaan sitä, missä määrin henkilö on tietoinen ongelmaa liittyvistä erilaisista muuttujista ja näiden välisistä suhteista. Heikosti jäsentyneille ongelmille on tyypillistä se, että ongelmanratkaisija ei ole kyennyt tunnistamaan ongelman keskeisiä elementtejä ja niiden välisiä suhteita. (vrt. Partridge & Hussain 1995, 82.) Jäsentyneillä ongelmilla on puolestaan fokus eli henkilö on muotoillut oman henkilökohtaisen näkemyksen tarkastelun kohteen olevasta asiasta. Fokuksen hahmotus on keskeinen osa ongelman jäsentymistä. Fokuksen muotoilun jälkeen henkilö tuntee ongelman keskeiset elementit ja niiden väliset suhteet. Mitä jäsentyneempi ongelma on, sitä helpompaa henkilön on määritellä se, minkälaista tietoa hän tarvitsee ongelman ratkaisemiseksi, minkälaisia tiedonhakustrategioita hänen tulee soveltaa tarvittavan tiedon hankkimiseksi ja mitä prosesseja tarvitaan ongelman ratkaisemi seksi (Vakkari 1999a, 42). 3.1.2. Kuhlthaun malli Ongelman jäsentyneisyyden astetta arvioidaan tässä tutkimuksessa Kuhlthaun (1993) esittämän tiedonhankinnan prosessimallin avulla. Malli liittää yhteen hakijan kokemat tunnetilat, ajatukset ja toiminnat. Tiedonhankintaa pidetään "järkeistämisen prosessina", jossa erilaiset ongelman jäsentyneisyyden vaiheet ja tunnetilat vaihtelevat. Tiedonhankinnassa on kyse konstruktioprosessista, joka lähtee liikkeelle tiedonhakijan tuntemasta epävarmuuden tilasta ja päättyy parhaimmassa tapauksessa ongelmallisten asioiden jäsentymiseen ja ymmärtämiseen tai vaihtoehtoisesti pahimmillaanentistä vaikeampaan epävarmuuden ja ahdistuksen tunteeseen. Tiedonhankinta on siis matka kohti jäsentyneenpää kuvaa ongelmasta. Kuhlthau (1993, 41-52) jakaa mallissaan tiedonhankintaprosessin kuuteen eri vaiheeseen (ks. kuvio 3). Aloitusvaiheessa (initiation) henkilö tulee tietoiseksi puuttuvasta tiedosta e 13
hänen tiedontarpeensa viriää. Henkilö kokee erilaisia epävarmuuden ja ahdistuksen tunteita. Ajatukset ovat epämääräisiä ja epätäsmällisiä ja ne kohdistuvat lähinnä ongelma-alueeseen yleensä tai siihen, mistä ollaan epävarmoja. Henkilö yrittää liittää uuden tilanteen aikaisempiin kokemuksiinsa ja tietoihinsa. Vaiheeseen kuuluu ongelman aiheen ja eri lähestymistapojen pohtiminen sekä siitä keskusteleminen. Aloitusvaihetta seuraavassa valintavaiheessa (selection) henkilö pyrkii täsmentämään ja valitsemaan tutkittavan aiheen, teeman tai lähestymistavan. Epävarmuuden tunteet väistyvät ja henkilö tuntee optimismia aihetta kohtaan. Henkilö on valmis hakemaan aihetta koskevaa tietoa. Jos valintavaihe jostain syystä viivästyy, henkilön kokemat huolestuneisuuden tuntemukset syvenevät kunnes jokin valinta on tehty. Henkilö punnitsee aihetta oman henkilökohtaisen kiinnostuksensa, tehtävän asettamien vaatimusten, saatavilla olevan tiedon ja käytettävissä olevan ajan puitteissa. Henkilö keskustelee aiheesta muiden kanssa ja tekee alustavia tiedonhakuja. Haettava tieto on lähinnä aihetta koskevaa taustatietoa. Valintavaihetta seuraava tunnusteluvaihe (exploration) on useille tiedonhakijoille vaikein. Henkilön kokemat epävarmuuden j epäilyn tunteet vahvistuvat. Henkilö pyrkii muodostamaa henkilökohtaisen näkökulman asiaan, mikä saattaa kuitenkin olla vaikeaa. Tiedonhakija pyrkii lisäämään omaa asiaa koskevaa ymmärtämystään hakemalla aihetta koskevaa yleistä tietoa. Henkilö ei pysty välttämättä ilmaisemaan täsmällisesti, minkä tyyppistä informaatiota hän tarvitsee. Tämä voi vaikeuttaa henkilön tiedonhakua siten, että hän ei ehkä pysty muotoilemaan täsmällisiä kyselyjä tiedonhakujärjestelmälle. (Kuhlthau 1993, 41-52.) 14
Tiedonhankinta- Tunteet Ajatukset Toiminnot prosessin vaiheet 1. Aloitusvaihe Epävarmuus Yleiset/ Tiedontarpeen epäselvät tunnistus 2. Valintavaihe Optimismi Aiheen valinta 3. Tunnusteluvaihe Hämmennys/ Kirjallisuuden turhautuminen/ tutkiminen epäilys 4. Muotoiluvaihe Ajatusten Selkeät Aiheen tarkennus selkeytyminen 5. Keruuvaihe Suunnan Lisääntynyt mielen- Tiedonhankinta löytäminen/ kiint jäsentyneeseen luottamus tiedontarpeeseen 6. Esitysvaihe Helpottunut/ Selkiintyneet Tulosten esitys tyytyväisyys tai pettymys KUVIO 3. Tiedonhankinnan prosessimallin vaiheet (mukaillen Kuhlthau 1991, 367; Kuhlthau 1993, 43). Neljäs vaihe eli muotoiluvaihe (formulation) on ratkaiseva tiedonhankinnan kannalta. Tässä vaiheessa tutkimuksen fokus hahmottuu eli tiedonhakija laatii ongelmaa koskevan täsmällisen kuvauksen tunnusteluvaiheessa saadun informaation perusteella. Tutkimuksen 15
aihe tarkentuu. Henkilön epävarmuuden tuntemukset haihtuvat ja hänen itseluottamuksensa lisääntyy. Fokus hahmottuu yleensä vähitellen asteittaisesti henkilön tarkastellessa tutkimuksen kohteena olevaa asiaa, mutta se voi muotoutua myös äkillisenä oivalluksena. Usein erilaisten välipapereiden kirjoittaminen sekä aihetta koskevien avaindokumenttien lukeminen auttaa fokuksen hahmottamisessa. (vrt. Fister 1992, 164-166). Muotoiluvaihetta seuraavassa keruuvaiheessa (collection) tiedonhakijan ja tietojärjestelmien välinen vuorovaikutus ovat tehokkaimmillaan. Henkilö kerää fokusta valottavaa merkityksellistä informaatiota ja tekee aihetta koskevia yksityiskohtaisia muistiinpanoja. Tiedonhakijalla on entistä selkeämpi kuva suunnasta, johon hänen tulee edetä ja hän pystyy selkeästi arvioimaan, minkä tyyppistä tietoa hän erityisesti tarvitsee. Henkilön itseluottamus syvenee ja epävarmuuden tunteet vähenevät. Henkilön kiinnostus aihetta kohtaan kasvaa. Esittämisvaiheessa (presentation/search closure) henkilö saattaa tiedonhankinnan loppuun ja hän esittää saamansa tulokset. Henkilö tuntee helpotuksen tunteita ja tyytyväisyyttä, jos tiedonhankinta on sujunut hyvin. Mikäli tehtävä on epäonnistunut, henkilö tuntee erilaisi pettymyksen tunteita. (Kuhlthau 1993, 41-52.) Kuhlthaun esittämistä vaiheista neljä ensimmäistä vaihetta liittyvät ongelman hahmottamiseen ja kaksi viimeistä varsinaisen ongelman ratkaisuun (Byströmin & Järvelinin 1995, 194; Byström 1999, 36-37). Näitä vaiheita voidaan nimittää pre-fokus ja post-fokus -vaiheiksi. Ennen ongelman fokuksen hahmottumista tiedonhakijat pyrkivät etsimään lähinnä yleistä ongelmaa koskevaa tietoa. Hakija ei osaa kunnolla jäsentää ongelmaa, eikä hän ole täysin tietoinen siitä, minkälaisia tietotyyppejä hänen tulisi hakea ja millaisia tiedonhakustrategioita hänen tulisi soveltaa. Fokuksen löytymisen jälkeen tiedontarve täsmentyy ja tietoa aletaan hakea spesifimmistä lähteistä. Fokuksen löytäminen lisää ongelman jäsentyneisyyttä ja henkilön käsitys siitä, minkälaista tietoa hän tarvitsee ongelman ratkaisemi seksi muuttuu. 16
Käytännössä tiedonhankintaprosessi ei yleensä etene mallin mukaan suoraviivaisesti. Henkilö saattaa olla eri vaiheissa samanaikaisesti tai niiden järjestys voi vaihdella. Usein tiedonhankinta etenee lähinnä syklisesti (ks. esim. Swain 1996). 3.1.3. Ennakkotietämys ja tiedonhankinta Aihetta koskeva aikaisempi tietämys vaikuttaa siihen, kuinka henkilö hankkii tietoa kohteesta. Mitä enemmän henkilö tietää kohteesta, sitä enemmän henkilö pystyy ennakoimaan tehtävää ja sen asettamia vaatimuksia. (Vakkari 1999a, 43.) Kognitiivisessa psykologiassa ja kasvatustieteessä tehtyjen tutkimusten mukaan uusien kategorioiden oppiminen riippuu henkilön aikaisemmasta tietämyksestä. Henkilöt pyrkivät integroimaan uudet havaintonsa aikaisempiin kognitiivisiin rakenteisiinsa. Kognitiivisia rakenteita kutsutaan usein skeemoiksi tai mentaaleiksi malleiksi. Von Wrightin (1992, 17) mukaan skeemoilla on useit erilaisia tehtäviä: ne toimivat ensinnäkin uuden tiedon tulkinnan ja ymmärtämisen perustana, niiden avulla ennakoidaan tapahtumia ja ohjataan toimintaa sekä palautetaan aikaisempaa tietoa muistiin. Uutta tietoa tulkitaan aikaisempien skeemojen avulla ja se suhteutetaa aikaisempiin skeemoihin. Kun uusi tieto on helposti suhteutettavissa vanhaan tietoon, on kyse assimilaatiosta. Jos uusi tieto muuttaa aikaisempia käsitteitä, rakenteita ja malleja tapahtuu skeeman muuttuminen eli akkomodaatio. Assimilaatio ja akkomodaatio ova toistensa rinnakkaistoimintoja. Jos ne ovat epätasapainossa kuten ongelmatilanteissa, henkilö pyrkii tasapainotilaan liittämällä vanhan tiedon uuteen vanhaa samalla muuttaen. Aikaisemmat skeemat ohjaavat tiedonhankintaa vaikuttamalla siihen, mihin seikkoihin ihmiset kiinnittävät huomiota. (vrt. Bransdorf 1979, 215.) 17
3.2. Keskeiset käsitteet Edellisessä alaluvussa tarkasteltiin tutkimuksen teoreettista mallia ja siihen liittyviä käsitteitä. Tässä luvussa esitetään puolestaan empiirisen aineiston analyysiin liittyvät käsitteet, tiedonhaun peruselementit. Hakijan tulee haun suorittamiseksi esittää hakutehtävänsä hakujärjestelmälle suunnattuna kyselynä. Kysely laaditaan hakujärjestelmän kyselykielen avulla. (Järvelin & Sormunen 1999, 126.) Hakukysely koostuu hakukomennosta, hakulausekkeesta sekä hakulausekkeisiin kuuluvista termeistä ja niitä yhdistävistä operaattoreista (ks. kuvio 4). Hakutermit edustavat kyselyssä haussa mukana olevaa fasettia eli käsitteellistä aihetta koskevaa näkökulmaa. 18
HAKUISTUNTO (HAKULOKI) Kysely (Query) koostuu Hakukomennot -->Järjestelmän tarjoamat mahdollisuudet, esim. tekijähaku, asiasana ym. Hakukäsitteet Hakutermit BT, NT, RT Hakulausekkeet Operaattorit AND, OR, NOT Kuviossa BT= laajemmat termit, NT= kapeammat termit, RT= rinnakkaiset termit KUVIO 4. Tiedonhaun peruselementit 3.2.1. Hakulauseke Hakulausekkeesta ei ole esitetty vakiintunutta määritelmää tiedonhakua koskevassa kirjallisuudessa. Usein hakulauseketta ja hakustrategiaa on pidetty toistensa synonyymeinä (ks. esim. Chamis 1984 91-92). Tässä tutkimuksessa hakulausekkeena pidetään tiedonhakijan kokemaa tiedontarvetta koskevaa kuvausta, joka koostuu sekä hakukäsitteitä kuvaavista hakutermeistä että tarvittaessa niitä yhdistävistä operaattoreista (vrt. Fidel & Soerge 1983, 168; Bates 1987, 47-54). Hakulauseke sisältää lyhyimmillään ainoastaan yhden ha- 19
kutermin, mutta usein hakulausekkeessa on useita hakutermejä, jotka on yhdistetty toi siinsa erilaisilla operaattoreilla (vrt. Iivonen 1995, 9). 3.2.2. Hakutermit Hakutermillä tarkoitetaan hakulausekkeessa esiintyvää merkkijonoa, joka voi sisältää katkaisumerkin (esim. LISA-tietokannassa?) ja joka on erotettu hakulausekkeessa esiintyvistä muista merkkijonoista operaattorilla ja/tai joka joko aloittaa tai päättää hakulausekkeen. Hakutermit voivat olla joko luonnollisesta kielestä valittuja vapaita avainsanoja, dokumentaatiokieleen kuuluvia asiasanoja tai koodimuotoisia ilmaisuja (esim. UDK). Hakutermeinä voidaan käyttää myös erilaisia muodollisia rajoitteita, kuten vuosi- tai kielirajausta. Luonnollisest kielestä valitut avainsanat voivat esiintyä useassa erilaisessa muodossa (esim. game, games). Dokumentaatiokieleen kuuluvat termit esiintyvät puolestaan ainoastaan dokumentaatiokielen määräämissä muodoissa. (Järvelin 1995, 175, 177.) Asiasana on standardoidussa ja vahvistetussa muodossa kontrolloidussa sanastossa oleva käsitteellinen nimitys, jota tiedon tallentaja voi käyttää dokumentin sisällönkuvailuun. Asiasanasta on käytetty tiedonhaun kirjallisuudessa usein deskriptorin, indeksitermin, kuvailutermin tai kontrolloidun termin nimitystä. Hakutermit kuvaavat tiedonhakun käsitteitä. Yhtä käsitettä voidaan kuvata joko yhdellä tai usealla eri hakutermillä. (Iivonen 1995, 10). Tässä tutkimuksessa sekä luonnollisesta kielestä valittuja vapaita avainsanoja että dokumentaatiokieleen kuuluvia asiasanoja ja muita koodimuotoisia ilmaisuja kutsutaan yleisesti hakutermeiksi. Tiedonhakulokista ei voitu erikseen erottaa sitä, käyttikö tiedonhakija luonnollisest kielestä valittua avainsanaa, vai ajatteliko hän käyttävänsä dokumentaatiokielee kuuluvaa asiasanaa. Tiedonhakijoilla ei ollut käytössään asiasanastoa, joten haussa esiintyvät asiasanat pohjautuvat tiedonhakijoiden aikaisempaan kokemukseen ja muistiin 20
LISA-tietokannan käytöstä.tiedonhakijat tekivät hakujen aikana rajauksia asiasanakenttään, mutta rajauksessa mukanaolevaa hakutermiä ei ole kuitenkaan valittu kontrolloidusta sanastosta (asiasanastosta). 3.2.3. Siirrot, taktiikat, stratageemat ja strategiat Tiedonhaun tutkimuksessa ei ole esitetty vakiintunutta määritelmää tiedonhaussa tehtävistä siirroista, taktiikoista ja strategioista. Hakustrategialla on tarkoitettu suppeimmillaan tiedonhakujärjestelmälle annettuja komentoja eli kyselyä (esim. Boolen lauseke). Hakustrategialla voidaan tarkoittaa myös haun kuluessa tehtäviä päätöksiä siitä, mikä on paras tapa jatkaa hakua. Laajasti määriteltynä hakustrategiaa voidaan pitää koko hakua koskevana suunnitelmana tai lähestymistapana. Järvelinin mukaan hakustrategia on kokonaissuunnitelma tai lähestymistapa haun suorittamiseen. Haun käytännön toteutuksessa hyö dynnetää erilaisia hakutaktiikoita, joita voidaan vaihdella haun aikana. Haulla voi olla vain yksi strategia, mutta siinä voidaan hyödyntää useita erilaisia taktiikoita. (Järvelin 1995, 159.) Bates (1987, 47) on määritellyt hakustrategian laajasti koko hakua koskevaksi suunnitelmaksi tai lähestymistavaksi. Hakustrategia koostuu Batesin mukaan erilaisista tasoista: siirroista, taktiikoista, stratageemoista ja strategioista (ks. kuvio 5). Strategia voidaan Batesin mukaan kuvata tarkasti erittelemällä ja kuvaamalla siihen kuuluvat siirrot yksityiskohtaisesti 21
Taso Tyyppi Keskeiset piirteet 1. Siirt Tunnistettavissa oleva ajatus tai toiminto, joka on osa tiedonhakutapahtumaa. 2. Taktiikka Joukko siirtoja, joiden tavoitteena on tiedonhaun edistäminen. 3. Stratageema Laaja joukko siirtoja/taktiikoita, joiden tavoitteena on edistää tiedonhakua jossain tietyssä kohteessa. 4. Strategia Kokonaissuunnitelma haun suorittamiseksi, koostuu erilaisista siirroista, taktiikoista ja stratageemoista. KUVIO 5. Hakustrategian tasot Batesin mukaan (Bates 1990, 578). Bates määrittää siirron "tunnistettavaksi olevaksi ajatukseksi tai toiminnaksi, joka on osa tiedonhakutapahtumaa". Siirron käsitettä voidaan Batesin mukaan soveltaa useaan erilaiseen tiedonhakua koskevaan ilmiöön. Siirrot voivat olla tarkasti harkittuja tai toisaalta pikaisesti tehtyjä toimintoja. Siirto on tiedonhaun tutkimisen peruselementti. Siirto voi daa operationalisoida eri tavoin riippuen siitä ympäristöstä, missä se esiintyy. (Bates 1990, 578.) Esim. Fidel on määritellyt siirrot hakulausekkeissa tapahtuviksi muutoksiks (vrt. Fidel 1982, 102). Taktiikka koostuu siirroista, joiden tarkoituksena on edistää haun suorittamista. Taktiikkaa käytetään jonkin tiedonhakua koskevan ongelman ratkaisemiseen. Useat taktiika muodostavat puolestaan stratageeman, jonka tavoitteena on tiedonhakijan kokeman ongelman ratkaiseminen jossain tietyssä kohteessa tai järjestelmässä. Strategia on puolestaan tiedonhakua koskeva kokonaissuunnitelma, joka voi pitää sisällään useita erilaisia stratageemoja, taktiikoita ja siirtoja. (Bates 1990, 578-580.) Marchionini mukaan siirrot ovat hakutaktiikan ilmentymiä. Marchionini tarkoittaa siirrolla jotain tiettyä tiedonhakijan tekemää toimintaa, kuten hiiren klikkausta, kävelyä tietylle kirjahyllylle ym. Siirrot eivät merkitse paljoa yksittäiselle tiedonhakijalle, mutta niitä 22
tarkastelemalla voidaan saada tietoa tiedonhakijan käyttäytymisestä ja niistä tavoista, joilla hän hakee tietoa. Näin siirrot ovat kiinteästi yhteydessä ylemmän tason kognitiivisiin ilmiöihin. (Marchionini 1995, 56, 74) Fidel (1982, 102; 1985, 61) jakaa siirrot eli hakulausekkeessa tapahtuvat muutokset konseptuaalisiin ja operationaalisiin siirtoihin. Konseptuaaliset siirrot vaikuttavat haun sisältöön muuttamalla hakukäsitteiden sisältöä (hakutermejä). Siirrot voidaan jakaa edelleen siirtoihin, joiden tarkoituksena on kasvattaa hakujoukkoa tai vaihtoehtoisesti supistaa sitä. Operationaaliset siirrot ovat puolestaan toimia, jotka eivä muuta hakupyynnön käsitteitä. Operationaalisissa siirroissa tiedonhakija hyödyntää hakujärjestelmän antamia mahdollisuuksia kuten erilaisia hakukomentoja. Konseptuaaliset siirrot tulevat esille haussa lähinnä sinne valittuina käsitteinä ja operaattoreina sekä käsitteiden vaihtamisena. Muita konseptuaalisia siirtoja ovat mm. hakusanojen katkaisu. (vrt. Sormunen 1989, 43.) Konseptuaaliset siirrot voidaan tehdä joko fasettien välillä tai fasettien sisällä. Kahden fasetin yhdistäminen on yksi yleisimmistä konseptuaali sista siirroista. Kaikissa tilanteissa kahden eri fasetin yhdistäminen toisiinsa ei ole mahdollista. Tällöin tiedonhakija voi yrittää parantaa tulosta tekemällä konseptuaalisia siirtoj yhden fasetin sisällä. Tässä tutkimuksessa siirto määritellään Batesiin (1990, 578) pohjautuen "tunnistettavissa olevaksi ajatukseksi tai toiminnoksi, joka on osa laajempaa tiedonhakutapahtumaa". Siirrot tulevat hakulokissa esille erilaisina tiedonhakijan tekeminä toimintoina kuten hakulausekkeiden supistamisina tai laajentamisina tai hakijan tekeminä välitulostuksina. Siirto kuvaa siis hakijan ja tiedonhakujärjestelmän välistä vuorovaikutusta. 23
3.2.4. Operaattorit Hakulausekkeessa on usein useita hakutermejä, jotka tulee yhdistää toisiinsa. Hakutermien yhdistämiseen käytetään useimmissa tiedonhakujärjestelmissä (ml. LISA-tietokanta) Boolen logiikkaan kuuluvia operaattoreita tai vaihtoehtoisesti läheisyysoperaattoreita. Boolen logiikkaan kuuluva haku kuuluu ns. täydellisen täsmäytyksen menetelmään. Täydellisessä täsmäytyksessä dokumentin tulee sisältää kaikki ne ominaisuudet, jotka on määritelty hakulausekkeessa. Osittain täsmäävät dokumentit jäävät haussa löytämättä. Boolen logiikkaa onkin kritisoitu siitä, että sen avulla tiedonhakija ei välttämättä saa tietoonsa kaikkia hakuaiheen kannalta relevantteja dokumentteja. Boolen logiikkaan perustuvaa hakua pidetään myös vaikeana. (vrt. Järvelin 1995, 107-108.) Tenopirin mukaan kokemattomat tiedonhakijat kokevat vaikeuksia erityisesti operaattorien valinnassa. Vaikeutta tuottaa yleensä AND ja OR-operaattorien välisen eron tunnistaminen. (Tenopir 1984, 635). Boolen logiikkaan kuuluvia operaattoreita ova AND, OR ja NOT. Operaattoreista AND ja NOT ovat kaventavia operaattoreita OR-operaattorin ollessa hakujoukkoa laajentava operaattori. AND-operaattoria käytetään kahden tai useamman eri käsitteen yhdistämiseen. Hakutulokseen kuuluvat ne dokumentit, jotka kuuluvat hakutermien leikkaukseen. Esim jos haussa ovat hakutermit A ja B, tulevat hakutulokseen mukaan ne dokumentit, jotka sisältävät sekä joukon A ja B. Dokumenteissa voi olla myös muita määrittelemättömiä hakutermejä. AND-operaattoria käytetään tiedonhaussa yleensä fasettien välillä niiden yhdistämiseen. (vrt. Harter & Peters 1985, 419; Harter 1986, 173). OR-operaattoria käytetään haun laajentamiseen. Esim. hakulausekkeessa voivat olla hakutermit X ja Y. Hakuun tulevat mukaan ne dokumentit, jotka sisältävät hakutermin X ta Y tai molemmat sekä mahdollisesti myös muita tässä määrittelemättömiä hakutermejä. OR-operaattoria käytetään yleensä fasetin sisällä. OR-operaattorin käyttö fasettien välillä on harvinaista. (vrt. Harter 1986, 173.) Kuvio 6. havainnollistaa AND- ja OR-operaattorien käyttöä tiedonhaussa. 24
FASETTI (F1) Termi a1 OR Termi a2 OR Termi a3 FASETTI (F2) Termi b1 OR Termi b2 FASETTI (F3) Termi c1 OR Termi c2 OR Termi c3 OR Termi c4 FASETTIEN YHDISTYS F1 AND F2 AND F3 HAKUTULOS KUVIO 6. Esimerkk fasettien ja termien yhdistämisestä tiedonhaussa (mukaillen Harter 1986, 173) Aikaisemman tutkimuksen mukaan aloittelevat tiedonhakijat kokevat OR-operaattorin käytön vaikeaksi, eikä sitä juuri käytetä haun laajentamiseen (ks. esim. Wildemuth et. al. 1991, 319; Ennis & Sutcliffe & Watkinson 1999, 111.) NOT-operaattor sulkee hausta pois jonkin hakutermin. Operaattori on näin rajoittava ja kaventaa hakua. Esim. haussa on voitu määrittää hakuavaimiksi C not D. Hakuun tulevat dokumentit, joissa esiintyy hakutermi C mutta ei hakutermiä D. (vrt. Harter 1986, 76; Järvelin 1995, 114-117.) Haussa mukana oleva hakutermit kuvaavat haussa mukana olevia käsitteitä, jotka kuuluvat johonkin fasettiin. Meriläisen mukaan fasetti muodostuu "aihealueen sisällä samaan 25
aspektiin kuuluvista elementaarisista luokista" (Meriläinen 1984, 48). Soergelin mukaan fasetit ovat tiedonhaussa esiintyviä näkökulmia (Soergel 1985, 258). Järvelinin mukaan fasetti on hakuaiheeseen liittyvä näkökulma, joka on suhteena väljempi kuin käsitteiden hierarkkinen suhde (Järvelin 1995, 143). Tässä tutkimuksessa fasettina on pidetty haussa esiintyvää aspektia, näkökulmaa aiheeseen. Hakukomennot ovat tiedonhakujärjestelmälle annettuja käskyjä jonkin tietyn tehtävän suorittamiseksi. Hakukomennot ovat tiedonhakujärjestelmäsidonnaisia. Hakukysely toteutetaa hakukomentojen avulla. Kysely alkaa hakukomennolla, jota seuraa varsinainen hakulauseke. DIALOG-ympäristössä käytetyin hakukomento on ss (select steps). Tässä tutkimuksessa ei ole kiinnitetty varsinaista huomiota hakukomentojen käyttöön, koska lähes kaikki kyselyt jouduttiin järjestelmän luonteen vuoksi toteuttamaan samalla ss-komennolla. Komentoja on kuitenkin sivuttu operationaalisten siirtojen analyysin kohdalla. Operationaaliset siirrot toteutettiin hakujärjestelmän antamilla rajausmahdollisuuksilla e komennoilla. 26
4. Tutkimustehtävä ja aikaisempi tutkimus Tämä tutkimus on osa tutkimushanketta "Task, information searching and relenvance assessments", jonka lähtökohtana on yhdistää tiedonhaku- ja tiedonhankintatutkimuksen traditioita liittämällä ne tiedonhankintaprosessin tarkasteluun. Tutkimuksen teoreettisena taustana hyödynnetään edellisessä luvussa esiteltyä Vakkarin (1999a) laatimaa mallia, jossa erilaiset tietotoiminnot (kuten hakustrategiat, relevanssiarviot) kytketään tehtävän monimuotoisuuteen ja ongelman jäsentymiseen. Tiedonhankinta nähdään prosessina, jonka aikana hyödynnetään erilaisia tietotyyppejä, sovelletaan erilaisia hakustrategioita ja arvioidaan saatujen tietojen relevanssia. Prosessin aikana tapahtuu tietämysrakenteiden muutoksia, ts. oppimista, jonka seurauksena nämä toiminnot muuttuvat. Tietotoimintojen osalta tämä tutkimus rajoittuu tarkastelemaan ainoastaan yhtä osaa henkilön tiedonhankintakäyttäytymisestä. Tarkastelun kohteena ovat tietokannoissa sovellettavat tiedonhakustrategiat ja niissä tapahtuvat muutokset ongelman jäsentymisen asteen kasvaessa. Ongelman jäsentymisen suhteesta tiedonhaussa tehtäviin relevanssiarvioihin ja tehtäväprosessin aikana käytettäviin tietotyyppeihin on valmistunut toinen pro gradu-tutkielma Tampereen yliopiston informaatiotutkimuksen laitoksella (ks. Hakala 1999). 4.1. Tutkimustehtävän täsmentäminen Tässä tutkimuksessa tiedonhakua tarkastellaan siirtojen tasolla. Siirtoja analysoimalla henkilön vuorovaikutus hakujärjestelmän kanssa voidaan jakaa osiin, mikä antaa monipuolisen kuvan haun kokonaisuudesta. Haut kytketään ongelman jäsentymiseen tutkimalla niiden kehittymistä kompleksin tehtäväprosessin aikana. Empiirisen analyysin kohteena ovat tiedonhaun peruselementit: hakulausekkeet, siirrot, fasetit ja termit sekä fasetteja ja termejä yhdistävät operaattorit. Tutkimuksen ongelma muodostuu seuraavasta kysymyksestä: Kuinka ongelman jäsentyminen vaikuttaa henkilön tiedonhakuihin? 27
Pääongelmaa ratkaistaan tutkimalla seuraavaa alaongelmaa: Miten ongelman jäsentyminen tulee esille 1) hakulausekkeissa, 2) tiedonhaussa tehdyissä siirroissa, 3) tiedonhaussa mukana olleissa faseteissa ja termeissä 4) sekä termejä ja fasetteja yhdistävissä operaattoreissa Kyselyä laatiessa hakijan tulee tunnistaa aihetta koskevat keskeiset fasetit ja niihin kuuluvat termit sekä operaattorit (vrt. Marchionini 1995, 53). Hakukyselyssä mukana oleva fasetit ja termit kertovat henkilön tietämysrakenteista eli henkilön tuntemista käsitteistä. Operaattorien käyttö kertoo puolestaan käsitteiden välisistä yhteyksistä. Tutkimuksen hypoteesina on, että heikosti jäsentyneet ongelmat johtavat heikosti jäsentyneisiin tiedonhakuihin. Ongelman ollessa heikosti jäsentynyt hakija kokee vaikeuksia sopivien hakutermien ja operaattoreiden valinnassa. Ongelman jäsentyneisyyden kasvaessa henkilön pystyy tekemään parempia tiedonhakuja, mikä näkyy haussa mukana olevien fasettien ja termien määrän kasvuna sekä operaattoreiden monipuolisempana käyttönä. (vrt. Vakkari 1999a, 48-49.) Tutkimuksen hypoteesi on asetettu aikaisemman tiedonhakua ja tiedonhankintaa koskevan kirjallisuuden ja tutkimuksen perusteella. Aikaisempien tutkimusten mukaan (ks. Chen & Dhar 1991; Kuhlthau 1993; Yang 1997; vrt. myös Marchionini 1995, 35-36, 54) tiedonhakijat kokevat vaikeuksia hakupyynnön esittämisessä ja hakukyselyn muotoilussa jos he eivät tunne aihetta koskevia keskeisiä käsitteitä ja niiden välisiä suhteita. Näitä tutkimuksia tarkastellaan tarkemmin seuraavassa alaluvussa. 4.2. Aikaisempi tutkimus Tiedonhankinnan ja tiedonhaun tutkimustraditiossa ei ole tehty juurikaan tehtäväprosessia koskevia pitkittäistutkimuksia. Käyttäjäsuuntautuneessa tiedonhaun tutkimuksessa on 28