OPAC vai WWW Miten elektroniset kausijulkaisut löytyvät? Kausijulkaisupäivä 04.10.2002 Esittely: sovellussuunnittelija Helsingin yliopiston Linnea- eli tietokantapalveluissa päävastuu Voyager-projektissa liittynyt OPAC-asioihin kansallisen portaalin projektiryhmä Otsikkona on OPAC vai WWW. Pikemminkin se voisi olla OPAC vai Portaali tästä näkökulmasta. Keskityn elektronisiin kausijulkaisuihin, pääasiassa FinELibin kautta lisensoituihin. Jätetään ulkopuolelle kaikki muu elektroninen aineisto, koska se ei sisälly annettuun otsikkoon (mutta liittyy kyllä isona osana itse aiheeseen - HYK:ssä huolena esim. digitoidut aineistot, elektroniset vapaakappaleet) Aihe on ajankohtainen ja kuuma. On harmi, ettei mitään varmaa voi sanoa oikeastaan mistään, kun ollaan siinä tilanteessa missä nyt ollaan kansallisen portaali -projektin kohdalla. Esityksessä tulee siis olemaan enemmän arvailuja ja kysymyksiä kuin vastauksia, mutta toivottavasti se herättää ajatuksia. 1
Nykytilanne Vain n. puolet FinELib-lehdistä LINDAssa toimimattomat linkit Kirjastojen omat ratkaisut www-sivut erilliset tietokannat Tällä hetkellä elektronisten kausijulkaisujen kannalta ainoa olemassa oleva keskitetty ratkaisu on se, että yksi henkilö luetteloi FinELib-lehtiä LINDAan. Sehän ei tietenkään riitä, kun huomioidaan lehtien määrä. Kaiken lisäksi luettelointi on tähän asti ollut suurelta osin primääriluettelointia. Lehdistä on luetteloitu alle puolet (n. 3500 kpl) ja tähän mennessä tehtyjen tietueiden ongelma on lisäksi se, että URL:t ovat vanhentuneita. Nyt tavoite on saada korjattua linkit olemassa oleviin tietueisiin, vasta sitten voidaan miettiä uusien lehtien luettelointia. Kirjastot eivät ole voineet odottaa loputtomiin, joten kaikille on syntynyt omia ratkaisuja asiakkaiden tarpeiden tyydyttämiseen. On tehty erilaisia www-lehtilistoja tai omia tietokantaratkaisuja elektronisille kausijulkaisuille. Yksi tähän aiheeseen puhujaksi kutsuttu, mutta kieltäytynyt henkilö totesikin, että murto-osalla näistä kirjastojen panostuksista e-lehtien luettelointi olisi varmasti hoidettu jo ajat sitten. Se lienee totta. Yksittäiset ratkaisut ovat toki hienoja ja toimivia, mutta tilanne ei ole kansallisesti kehuttava. 2
Luetteloinnin tehostaminen Olemassa olevan datan kerääminen ja yhdistäminen Kopioluettelointi Dataa kustantajilta? Keskittäminen vai hajauttaminen? Kaikki kirjastoissa jo tehty työ pitäisi pystyä hyödyntämään, kun aletaan etsiä yhteistä ratkaisua tähän ongelmaan. Pitäisi selvittää mitä on jo tehty missäkin ja kerätä data yhteen paikkaan (+tuplien poisto) samassa muodossa. Kun tarkastellaan mitä puuttuu, olisi otettava kopioluettelointi käyttöön mahdollisimman tehokkaasti. BookWhere on yliopistokirjastoissa kopioluettelointiin käytettävä sovellus. Uusien (ja vanhojenkin) aineistojen kohdalla olisi kysyttävä kustantajilta, millaista metadataa heillä olisi tarjota omista aineistoistaan. Olisiko meidän mahdollista ottaa kustantajien data käyttöön jopa suoraan tai jonkinlaisen konversion avulla? Olisiko tämä asia, jonka voisi jopa lisätä tulevaisuudessa tehtäviin lisenssisopimuksiin? Missä luettelointityö tapahtuisi? Yksi vaihtoehto on keskittäminen. Esim. HYK:ssä voisi sijaita e-aineistojen luettelointikeskus. Ongelmana ovat tilojen ja työntekijöiden puuttuminen. Rahoitus FinELibiltä? Toinen vaihtoehto on hajauttaminen, jossa kirjastot vastaisivat itse lisensioimiensa aineistojen luetteloinnista. Vastuita pitäisi tietenkin jakaa keskitetysti. Kirjastokentän toteuttama luettelointiratkaisu, sen koordinointi ja kustannukset tulee selvittää (HYK) tosin tiedetään esim. Linnea2 luettelointityöryhmän vastustaneen ajatusta kirjastokenttääkin vaivaavan resurssipulan vuoksi. Joka tapauksessa osa luettelointityöstä on hoidettava HYKssä, mieluiten kaikki FinELib:in lisensoima aineisto (olemassa olevan työn kerääminen / datan hankkiminen kustantajilta + konversiot). Kirjastoille jää paljon tehtävää muiden aineistojensa kanssa. 3
Mihin luetteloidaan mistä haetaan? Kirjastojen erilliset e-lehti -tietokannat Kirjastojen kokoelmatietokannat LINDA-UC Kansallinen Portaali päätös valittavasta ohjelmistosta 10/2002 Prosessi on liikkunut väärään suuntaan kun olisi pitänyt aloittaa isommasta (ja kopioida pienempään mikäli tarpeen), onkin aloitettu pienestä. Hyvää tarkoittava idea oli se, että FinELib-lehdet olisivat kaikki olleet Lindassa, ja kirjastot olisivat sieltä kopioineet lisensioimansa lehdet omiin kokoelmatietokantoihinsa. Mutta tämä ei toteutunut. Erilliset ratkaisut ovat siis nyt ne välineet, jotka ovat käytettävissä, mutta toivottavasti tilanne ei jatku näin pitkään. Erillisistä ratkaisuista on päästävä eroon ja löydettävä yhteinen ratkaisu. Ja kuten sanottu, tähän asti tehtyä työtä on käytettävä hyväksi alussa. Kansallinen Portaali -hanke alkaa vihdoin olla siinä vaiheessa, että päätös valittavasta ohjelmistosta saadaan pian. Suunnitelman mukaan lokakuun 2002 loppupuolella. Siitä paljolti riippuu, mitä teknisiä välineitä e- lehtiasiassa on käytettävissä tulevaisuudessa. (En aio tässä mennä syvemmin Portaali-hankkeeseen, koska Kristiina Hormia-Poutanen on ollut puhumassa siitä viime vuonna. Lopussa voin vastata portaalia koskeviin kysymyksiin, jos niitä jää esityksen jälkeen.) Perimmäinen kysymys: Mitä kautta e-lehtien tulisi löytyä, jotta palvelisimme loppukäyttäjiä mahdollisimman hyvin? Kun meillä on portaali, riittääkö se? Muodostuuko portaalista one stop shop joka on sen tavoite? Milloin siihen asti päästään? Tällöin haut aloitettaisiin aina oletusarvoisesti portaalin kautta (organisaatiokohtaiset aloitussivut). Voisi hakea samalla haulla omasta kokoelmatietokannasta, Lindasta ja portaalin lehtitietokannasta. Tarvitaanko silloin tietoa muualla kuin yhdessä paikassa? Vai pitääkö e-lehtien löytyä sekä kirjastojen kokoelmatietokannoista, Lindasta että portaalista? Yleisön mielipide? Miten monessa paikassa kuvailutietoja tulisi siis ylläpitää? Mikä olisi datan primääri tallennuspaikka? Miten datan siirto toteutetaan, jos nähdään, että tietoja tulee ylläpitää useassa paikassa? Selvää on, että luettelointi/kuvailutyö kannattaa tehdä vain kerran ja tiedot pitää voida olla kopioitavissa/siirrettävissä muihin tarpeellisiin paikkoihin. Kaikki lehdet on jo luetteloitu jossakin sitä pitää osata hyödyntää! Saako ilmiasu määrätä mistä aineistoa haetaan? Nyt se määrää Teos on se mitä haetaan ei ilmiasu. (Entä mitä siitä seuraa, jos nyt jo kirjastotietokantoihin vietyä e-aineistoa on kannoissa, mutta sitä ei enää tallennettaisikaan jatkossa, vaan kaikki e-aineisto haettaisiin vain portaalin kautta?) 4
Portaali & e-lehdet Tavoitteet aakkosellinen lehtilista nimeke-haku (karkea) asiasana-haku näytetään vain ne, joihin käyttäjällä on oikeus linkit viitteistä -> OpenURL kokotekstit kokoelmatietokannan saatavuustiedot extended services (esim. hakukoneet) Tavoitteena on, että portaalin kautta lehdet on saatava selailtavaksi aakkosellisena listana, jotta käyttäjä näkee mitä kaikkea on käytettävissä. Lisäksi lehtiä pitää voida hakea nimekkeellä ja karkeilla, ennalta määrätyillä asiasanoilla (pudotusvalikko). Tarkoitus on näyttää käyttäjälle vain ne lehdet, joihin hänellä on käyttöoikeus (kattavat lehtilistat on tarkoitus esittää FinELibin hallinnollisilla sivuilla). Portaalissa täytyy siten olla tallennettuna seuraavia tietoja: lehden bibliografinen kuvailu (ISSN, nimeke) karkea asiasanoitus (-tosin ei ole vielä mahdollista potentiaalisissa tuotteista kehittyvät) käyttöoikeudet Jos oletetaan, että portaali olisi primääri luettelointipaikka, missä muodossa metadata olisi portaalissa? Riippuu valittavasta ratkaisusta. Esim. MARC21 tai DuplinCore ovat konvertoitavissa MARC21-Fin:iin ja sitä kautta siirrettävissä Lindaan eräajoina, jos se nähdään tarpeelliseksi. Niin edelleen kirjastot voisivat kopioida sitten Lindasta omiin kokoelmatietokantoihinsa. Pääosa lehtien tiedoista vietäisiin portaaliin keskitetysti HYK:ssa, mutta myös kirjastot voisivat ylläpitää sekä yhteisesti lisensoitujen, että itse hankkimiensa lehtien tietoja portaalissa (kaikilla yliopistoilla pääsy tietojen hallintopuolelle). Jos tiedot siirrettäisiin valikoimatta Lindaan, siellä olisi viitteet kaikista FinELib-lehdistä riippumatta siitä ovatko palvelut loppukäyttäjän käytettävissä vai eivät. Se olisi hyvä asia, mutta edellyttää sitä, että rajoitusten pitää näkyä käyttäjälle selvästi. Viitteissä olisi hyvä myös olla linkki palveluntarjoajan sivuille, oli sitten käyttöoikeutta tai ei. Kirjastot puolestaan kopioisivat vain niitä lehtiä, jotka ovat lisensoineet, joten niiden omissa tietokannoissa näkyisi vain sellaisia, joihin on käyttöoikeus. Pelkät viitteet eivät lohduta elektronisten aineistojen kyseessä ollen, joten linkit viitteistä kokoteksteihin / kirjastotietokannan saatavuustietoihin / laajennettuihin palveluihin hoidetaan OpenURL:n avulla. 5
OpenURL Metadata välitetään tietyssä muodossa ratkaisijalle, joka osaa rakentaa asiaankuuluvat linkit käyttäjäkohtaisesti KnowledgeBase Toimii myös Voyagerissa versiosta 2001.2 eteenpäin Esim. http://xxx.library.edu?genre=article&issn=12345678&volume= 99&issue=1&date=20020101&spage=27&atitle=What Is An OpenURL&title=Harry's White Papers&id=doi:123/456789 Varteenotettavissa portaalisovelluksissa on käytössä OpenURL. Se toimii näin: Käyttäjä saa viittelistan. Hän valitsee viitteen. Huolimatta siitä, mistä lähteestä viite on peräisin, siinä olevista tiedoista rakentuu/generoituu OpenURL ja viitteen metadata (esim. ISSN), välittyy tässä tietyssä syntaksissa OpenURL-resolverille. Resolver osaa OpenURL:n sisältämän metadatan perusteella muodostaa linkin kyseisestä viitteestä OpenURL enabled kustantajien (mahdollisesti useampien) kokoteksteihin, haluttuun (kirjaston määrittelemään) kirjastotietokantaan/-tietokantoihin, webin hakupalveluihin ym. OpenURL-resolver tarkistaa myös käyttöoikeudet, joten se näyttää linkit vain sellaisiin kokoteksteihin, joihin käyttäjällä on oikeus. Portaalituotteen mukana tulee OpenURL-tietokanta (KnowledgeBase), jossa on valmiiksi useiden tuhansien lehtien tiedot. Alati muuttuvia tietoja ylläpidetään muualla ja tietokanta päivittyy/päivitetään portaaliin muutaman viikon välein. Puuttuvat tiedot voidaan lisätä itse kirjastoissa ja olemassa olevia tietoja voidaan muokata. Voyager versioon 2001.2 on tulossa kyky muodostaa OpenURL-muotoisia linkkejä. (Tällä hetkellä Voyagerissa on mahdollista tallentaa linkit itse OpenURL-muodossa -> keskustelu resolverin kanssa.) Esimerkki OpenURL:stä: ensin resolverin osoite, kysymysmerkin jälkeen metadataa (genre=artikkeli, ISSN, volyymi, numero, päivämäärä, sivunumerot, artikkelin nimeke [escape encoded, ASCII hexadecimal codes], lehden nimeke, DOI jne ) http://xxx.library.edu?genre=article&issn=12345678&volume=99&issue=1&date=20020101&spage =27&atitle=What%20Is%20The%20OpenURL&title=Harry%27s%20White%20Papers&id=doi:123 /456789 6
Mitä nyt? Kannattaa odottaa portaaliratkaisua! HYK:n sisäinen e-julkaisutyöryhmä Ei kannata panostaa omiin ratkaisuihin juuri nyt Luettelointisäännöt ja politiikat Tällä hetkellä kannattaa odottaa portaalisovelluksen valintaa tapahtuu pikapuoliin. HYK:ssa on sisäinen e-aineistojen problematiikkaan paneutuva työryhmä, joka lähtee heti päätöksen tultua miettimään e-lehtien tallennusta valitun sovelluksen lähtökohdista. Kirjastoilla on tälläkin hetkellä omat ratkaisunsa käytettävissään. Suositeltavaa on, että niihin ei nyt tuhlata kovasti paukkuja, koska portaali ja sen mukana tuleva jonkin tasoinen keskitetty ratkaisu on näköpiirissä lähiaikoina. Näin on tietysti sanottu jo kauan, mutta nyt tämä pitäisi olla ihan totta. E-aineistojen luettelointisäännöt ja politiikat (aineistokoodien käyttö vaikuttaa rajaukseen/hakuun, yksi vai monta tietuetta jne.) ovat sitten asia erikseen, joihin ei mennä tässä esityksessä. Niistä keskustellaan vilkkaasti sekä maailmalla että Suomessa, kuten tämän päivän esityksissä on tullut esille. Kun saamme kansallisen ratkaisun tähän asiaan, säännötkin muotoutunevat sen mukaan. 7