Marjo Markkula Page 1 14.11.2001 KUVAMATERIAALIN HAKU, KÄYTTÖ JA DOKUMENTOINTI YLEISRADIOSSA - TUTKIMUSSUUNNITELMA Marjo Markkula ja Eero Sormunen {marjo.markkula, eero.sormunen}@uta.fi puh. 03-215 8840 (Markkula), 03-215 6972 (Sormunen) Tampereen yliopisto, Informaatiotutkimuksen laitos Tutkimus on osa Suomen Akatemian rahoittamaa Digitaalinen Media -tutkimushanketta. Tutkimuksesta vastaa Tampereen yliopiston Informaatiotutkimuksen laitos. Hankkeessa on aiemmin tutkittu still-kuvien käyttöä ja arkistointia sanomalehden toimituksessa (Markkula & Sormunen 1998, 2000) sekä kuvan sisältöperusteisten hakumenetelmien soveltuvuutta käytännön kuvatiedonhakuun (Sormunen & al. 1999, Markkula & al. 2001). 1 Johdanto Digitaalisen kuvamateriaalin (termillä viitataan tässä paperissa liikkuvaan kuvaan) siirto-, käsittely- ja pakkausmenetelmät ovat kehittyneet nopeasti viime vuosina. Tämä kehitys tulee muuttamaan radikaalisti aineiston tuotantoa, tallennusta ja organisointia sekä sen hakumahdollisuuksia ja uudelleenkäyttöä. Kehitys tulee vaikuttamaan myös työprosesseihin sekä toimituksessa että tietopalvelussa. Perinteiset TV-arkistot ovat muodostuneet analogisista tallenteista (kuvanauhat). Aineiston haku on tapahtunut esimerkiksi viitetietokannan kautta, johon on tallennettu kuvadokumenttia kuvailevia tietoja. Näiden avulla hakija arvioi mitkä dokumentit ovat
Marjo Markkula Page 2 14.11.2001 mahdollisesti sopivia ja halutut tallenteet on haettu erillisestä arkistosta katsottaviksi. Digitaalinen TV-arkisto mahdollistaa aineiston esikatselun suoraan omalta päätteellä. Haku perustuu aineistoon liitettyihin tekstitietoihin, mutta myös itse kuvan piirteiden (esim. värit), tekstityksen ja äänen hyödyntäminen haussa tulee tulevaisuudessa mahdolliseksi. Digitaalisen kuvan automaattiset käsittelymenetelmät voivat tukea kuvailutyötä ja dokumenttien hakua ja selailua. Itse kuvailua tai aineiston valintaa nämä menetelmät eivät korvaa. Automaattisten menetelmien tutkimus ja kehitystyö kohdistuu karkeasti jaoteltuna seuraaviin alueisiin (esim. Brunelli & al. 1999, Mills & al. 2000): 1. Kuvadokumentin sisältämien ottojen tunnistaminen. Tällä pyritään jakamaan dokumentti pienempiin osiin esimerkiksi kuvailun ja selailun helpottamiseksi. 2. Automaattisten sisältöön perustuvien hakumenetelmien kehittäminen. Menetelmät voivat perustua kuvaan (hahmopohjainen kuvatiedonhaku, kohteiden ja kameran liikkeen tunnistaminen ja analysointi), ääneen (puheentunnistus, musiikin ja äänitiedonhaku) sekä kuvateksteihin (tekstitiedonhaku). Kuvan sisältöön ja liikkeeseen perustuvat hakumenetelmät ovat vielä melko kehittymättömiä, samoin puheentunnistus heterogeenisessa aineistosta. 3. Tiivistelmien tuottaminen kuvainformaatiosta pyrkii palauttamaan osan ohjelman rakenteesta, esimerkiksi uutislähetyksen yksittäiset uutisaiheet, jotta kuvadokumentti voitaisiin esittää nopeasti selattavana tiivistelmänä. TV:n kuvamateriaali tarjoaa sekä suuria haasteita että mahdollisuuksia kuvailu-, haku- ja selailumenetelmien kehittämiselle, koska se sisältää sekä liikkuvaa kuvaa, ääntä että tekstiä. Tämä monipuolisuus tarkoittaa myös sitä, että yksi dokumentti voi sisältää erittäin paljon informaatiota, jolloin on olennaista määritellä mikä tästä informaatiosta on
Marjo Markkula Page 3 14.11.2001 tärkeää käyttäjille ja tulisi olla haettavissa tai nähtävillä aineiston käyttäkelpoisuuden arvioimiseksi. Arkistojärjestelmän (hakumenetelmät, toiminnot ja käyttöliittymät) suunnittelun tulisi perustua käyttäjien ja aineistotyypin (esim. elokuvilla ja uutislähetyksillä on erillainen rakenne) tarpeisiin ja vaatimuksiin. Järjestelmän tulee olla helposti käytettävissä ja tukea erilaisia aineiston katselua, käsittelyä ja käyttöä vaativia tehtäviä. (Esim. Pejtersen & Rasmussen 1997). Myös teknistä kehitystyötä on järkevää suunnata käyttäjistä lähtevien vaatimusten mukaisesti. Tämän vuoksi on olennaista kartoittaa käyttäjien tarpeita ja työprosesseja sekä toimituksessa että tietopalvelussa. 2 Tutkimuksen tavoitteet Tutkimuksen tavoitteena on selvittää aineiston dokumentointiin sekä hakujärjestelmän ja käyttöliittymän piirteisiin kohdistuvia tarpeita ja vaatimuksia tutkimalla 1 Kuvamateriaalin hankintaa, hakua, valintaa ja käyttöä osana television toimintaprosesseja sekä näissä koettuja esteitä. Minkälaisia ovat työtehtävät ja -prosessit, joihin kuvamateriaalin käyttö liittyy? Mitkä kuvamateriaalin piirteet ovat keskeisiä haku- ja valintakriteerejä työtehtävien eri vaiheissa? Mikä estää käytön? Miten kuvamateriaalia haetaan? Mikä on selauksen ja katselun rooli? Minkälainen aineisto on käytön kannalta arvokkainta? Mitä ongelmia koetaan aineiston käyttöön saannissa?
Marjo Markkula Page 4 14.11.2001 Miten hakuprosessin arvioidaan muuttuvan digitaalisen arkistointijärjestelmän myötä? 2 Kuvamateriaalin dokumentointi- ja organisointikäytäntöjä sekä toimituksen omissa arkistoissa että TV-arkistossa sekä näissä koettuja ongelmia. Toimituksen arkistot heijastanevat toimittajan työstä lähteviä tarpeita, TV-arkisto näiden lisäksi myös muita tekijöitä (lainsäädäntö, toimituksen ulkopuolinen käyttö). Minkälainen on kuvamateriaalin dokumentointiprosessi? Mitä sääntöjä ja periaatteita dokumentoinnissa noudatetaan? Mitä dokumentin piirteitä (kuva, ääni, ajallinen rakenne, lähde jne) kuvailussa huomioidaan? Miten kuvamateriaali organisoidaan toimituksen arkistoissa? Mitä ongelmia informaatikot ja kuvaussihteerit kokevat dokumentoinnissa? Miten dokumentointiprosessin arvioidaan muuttuvan digitaalisen arkistojärjestelmän myötä? Käyttäjien ja organisaation tarpeiden pohjalta voidaan selvittää (1) missä määrin nykyiset dokumentointikäytännöt ja hakijoiden tarpeet kohtaavat, tunnistaa (2) millä osa-alueilla on ongelmia ja (3) hahmotella miten dokumentointia ja hakujärjestelmiä voitaisiin kehittää vastaamaan käyttäjien tarpeita. Yleisemmin tutkimus tuottaa tietoa, jonka avulla voidaan (4) suunnata hakumenetelmien teknistä kehitystyötä ja käyttöliitymien suunnittelua sekä (5) hahmottaa niitä vaatimuksia, joita erilaiset käyttötarpeet asettavat tulevaisuuden mediavarantojen hallintajärjestelmille. 3 Aineiston keruu Aineisto kerätään YLE:n TV2:ssa ja TV1:ssä kesän ja syyskauden 2001 aikana. Keruumenetelmät ovat osallistuva havainnointi sekä aikajana- ja teemahaastattelut.
Marjo Markkula Page 5 14.11.2001 3.1 Havainnointi Havainnoinnilla aineistoa kerätään (1) dokumentointikäytännöistä TV-arkistossa sekä jos mahdollista (2) aineiston hankinnasta ja käytöstä uutis- ja ajankohtaistoimituksessa (erityisesti Katso-järjestelmän osalta). Havainnointi on osallistuvaa: tutkija pyrkii perehtymään työtehtäviin ja näiden suorittamiseen seuraamalla työprosesseja. 3.2 Aikajanahaastattelut Aikajanahaastattelu soveltuu erityisesti käyttäjien tarpeiden, käyttökokemusten ja - tyytyväisyyden kartoittamiseen. Haastateltavaa pyydetään kuvailemaan joku aiempi kuvamateriaalin hankintaprosessi kokonaisuudessaan. Prosessin yksittäiset osat kirjataan muistiin ja niistä keskustellaan edelleen yksityiskohtaisesti. Tässä tutkimuksessa aikajanahaastatteluilla kerätään aineistoa toimituksen työprosesseista, aineiston haku- ja valintakriteereistä, hakukäyttäytymisestä, käytetyistä lähteistä, käytöstä, käyttökokemuksista ja -tyytyväisyydestä. Aikajanahaastatteluja pyritään tekemään dokumenttien, ajankohtaisohjelmien ja uutisten toimituskontekstissa. Tilanteen kuvaus pyydetään aloittamaan työtehtävän kuvauksella. Jokainen tilanne koostuu peräkkäisistä tapahtumista (esim. ideointi, lähteen valinta, kollegojen kanssa neuvottelu, pyyntö tietopalvelulle / kuvaussihteerille tms., haku viitetietokannasta, aineiston fyysinen hankkiminen, aineiston katselu, aineiston leikkaaminen jne), joista keskustellaan tarkemmin tutkimuskysymysten valossa. 3.3 Teemahaastattelut Teemahaastattelujen tarkoitus on selvittää haastateltavien kokemuksia aineiston dokumentoinnista ja käyttöönsaannista nykyisellään, parannusehdotuksia ja digitaaliseen mediavarantojen hallintajärjestelmään kohdistuvia odotuksia. Haastatellaan
Marjo Markkula Page 6 14.11.2001 informaatikkoja, filmitoimittajia, kuvaussihteereitä ja toimittajia. Alla on alustavasti hahmoteltu haastattelujen teemoja. Informaatikot Tyotehtävät Dokumentointiprosessi Dokumentointikäytännöt, kuvailussa huomioidut piirteet Millainen aineisto on tärkeintä, mikä estää käytön? Dokumentoinnissa koetut ongelmat, ratkaisuehdotukset Kuvamateriaaliin kohdistuvat tarpeet, haku- ja valintakriteerit informaatikkojen kokemusten pohjalta Haun ongelmat Arviot ja odotukset digitaalisen arkistojärjestelmän tuomista muutoksista Filmitoimittajat Työtehtävät Filmitoimittajien arkistointikriteerit: mitä arkistoidaan, millainen aineisto tärkeintä, mikä estää käytön? Toimituksen arkistointijärjestelmän organisointiperiaatteet Kuvamateriaaliin kohdistuvat tarpeet, haku- ja valintakriteerit Kuvitusprosessi Hakukäyttäytyminen Haun, käytön ongelmat Arviot ja odotukset digitaalisen arkistojärjestelmän tuomista muutoksista
Marjo Markkula Page 7 14.11.2001 Kuvaussihteerit Työnkuva Kuvamateriaalin kulku TV-arkistoon Kuvaussihteerin suorittama dokumentointi Dokumentoinnissa koetut ongelmat Kuvitusprosessi Kuvamateriaaliin kohdistuvat tarpeet: mitä halutaan, haku- ja valintakriteerit Haun, käytön ongelmat Arviot ja odotukset digitaalisen arkistojärjestelmän tuomista muutoksista Toimittajat Työnkuva Kuvitusprosessin vaiheet Kuvamateriaaliin kohdistuvat tarpeet: mitä halutaan, haku- ja valintakriteerit Hakukäyttäytyminen Haun, käytön ongelmat Arviot ja odotukset digitaalisen arkistojärjestelmän tuomista muutoksista 3.4 Hakupyynnöt Hakupyyntöjen avulla pyritään selvittämään haussa ja valinnassa sovellettuja kriteerejä. Hakupyyntöjä kerätään lomakkeilla. Lisäksi voidaan seurata hakupyyntöjen tulosten arviointia ja sopivan kuvitusmateriaalin valintaa.
Marjo Markkula Page 8 14.11.2001 4 Alustava aikataulu Aineiston keruu tapahtuu TV2:ssa kesällä, TV1:ssä syyskaudella 2001. Aineistoa pyritään analysoimaan alustavasti jo keruun aikana. Varsinainen aineiston analyysi tapahtuu talvella 2001-2002. Ensimmäinen artikkeli tutkimuksesta valmistunee 2002 keväällä. 5 Lähteet Brunelli R, Mich O and Modena CM (1999) A Survey on the automatic indexing of video data. Journal of Visual Communication and Image Representation 10, 72-112. Markkula M and Sormunen E (1998) Searching for photos - Journalists practices in pictorial IR. In: Eakins J, Harper D, Jose J, eds. The Challenge of Image Retrieval. Electronic Workshops in Computing (ewic), 1998. Available at URL: http://www.info.uta.fi/tutkimus/fire/firearchive.html Markkula M and Sormunen E (2000) End-User searching challenges indexing practices in the digital photograph archive. Information Retrieval 1(4): 259-285. Available at URL: http://www.info.uta.fi/tutkimus/fire/firearchive.html Markkula M, Tico M, Sepponen B, Nirkkonen K and Sormunen E (2001) Information retrieval 4(3/4): 275-294. A Test collection for the evaluation of content-based image retrieval algorithms - A user and task-based approach. Available at URL: http://www.info.uta.fi/tutkimus/fire/firearchive.html Mills T, Pye D, Hollinghurst N and Wood K (2000) AT&TV:Broadcast television and radio retrieval. In: proceedings of RIAO 2000 - Content-based Multimedia Information Access, Paris, France, April 12-14,2000. p. 1135-1144.
Marjo Markkula Page 9 14.11.2001 Pejtersen A and Rasmussen J (1997) Effectiveness testing of complex systems. In: Salvenby G (ed) Handbook of Human Factors and Ergonomics, 2.edition. New Yourk:Wiley. Sormunen E, Markkula M and Järvelin K (1999) The Perceived Similarity of Photos - Seeking a Solid Basis for the Evaluation of Content-based Retrieval Algorithms. In: Draper S. et al, eds. Mira 99: Evaluating interactive information retrieval. Glasgow, UK, 4-16 April, 1999. Electronic Workshops in Computing. Available at URL: http://www.info.uta.fi/tutkimus/fire/firearchive.html