Tutkimukseen liittyviä tietovarantoja Viite- ja kokoelmatietokannat 6.11.2008 Viitetietokannat Digitaaliset julkaisut Kokoelmatietokannat Muut tietokannat Havaintotietokannat DNA-sekvenssitietokannat Esimerkkejä?? Tietokannat Tietokannat ovat tiettyjen periaatteiden mukaan järjestettyjä pysyväisluonteisen datan säilytyspaikkoja Tietokannan data on erityisen hallintaohjelman valvonnassa kyselyt datan päivitys käyttöoikeudet samanaikaisten käyttäjien hallinta Taulukko (paikallinen) Rajattu määrä rivejä ja sarakkeita Yksi käyttäjä kerrallaan Tiedon hallinta rivinäkymässä Tietoa toistetaan luokiteltaessa Lajittelu mahdollista vain muutaman muuttujan suhteen kerrallaan Tiedot helppo järjestää esim. tilastoanalyysiä tai kuvaajaa varten Tietokannat Tietokanta (palvelimella) Suuret tietomäärät Useampi käyttäjä Syöttölomake Yhteen käsitteeseen liittyvät tiedot yhteen tauluun, relaatiot Haut ja raportit joukko-opin tapaan Esim. SQL-kielen avulla Mahdollisuus automatisoida analyyseja ja liittää tietoa reaaliajassa muiden kantojen tietoihin Tietokannat Tietokantojen avulla voidaan välttää versiointiongelma Alkuperäisaineistoa säilytetään yhdessä paikassa Korjaukset, muutokset ja päivitykset tehdään alkuperäisaineistoon Historiatieto säilytetään, että muutokset/virheet voidaan myöhemmin jäljittää Muista aineistoista VIITATAAN primääriaineistoon EI KOPIOIDA AINEISTOJA TOISIIN KANTOIHIN Tieteellisen kirjallisuuden käytön kehitysvaiheet 1) Kirjaston hyllyjen tai kortiston selaus, eripainospyynnöt 2) Painetut viite- ja abstraktijulkaisut 3) Viitetietokannat CD:llä 4) Viitetietokannat verkossa 5) Maksulliset julkaisut verkossa 6) Avoimet julkaisut verkossa 1
Kirjaston hyllyjen selaus, eripainospyynnöt Kirjastojen tilaamat kirjat ja tieteelliset sarjat riippuvaisia käytettävissä olevista määrärahoista Tutkijat hyvin eriarvoisessa asemassa sijainnista riippuen Ennen kopiokoneita tutkijat lähettivät toisilleen eripainoksia postitettujen pyyntökorttien perusteella Eripainoksia voi edelleen pyytää ja lähettää PDFmuodossa Kustannussopimuksissa eroja, aina tutkijalla ei ole oikeuksia omaan artikkeliinsa Painetut viite- ja abstraktijulkaisut Helpottivat tieteellisen kirjallisuuden seuraamista luetteloimalla tietyn alan tieteellisissä sarjoissa painetut artikkelit ja julkaisemalla niiden tiivistelmät Artikkelit sisälsivät tietysti viitteet, mutta uusimpien julkaisujen löytäminen oli ongelmallista Esim. Biological Abstracts tai Zoological Records Viitetietokannat CD:llä CD-levyillä julkaistujen viite- ja abstraktitietokantojen avulla oli mahdollista tehdä hakuja eri kriteerien mukaan Löydetyt viitteet ja abstraktit pystyi tulostamaan Päivitys määrävälein, uusi CD postissa Käytössä vieläkin esim. nimistöissä Tarkoituksenmukaista jos tarvitaan staattinen ajankohta ( painos ) johon viitataan http://www.sp2000.org/ Viitetietokannat verkossa Internetin myötä viite- ja abstraktitietokannat siirtyivät vähitellen saataville verkon kautta Etuna ajantasaisuus Voivat edelleen olla maksullisia, suojaus käyttäjätunnuksen, IP-osoiteavaruuden tms. perusteella Suurin osa viitteistä ja abstraktiesta avoimesti saatavilla, linkit kokotekstiversioihin maksullisia Maksulliset julkaisut verkossa Koko toimitusprosessi muuttui vähitellen digitaaliseksi, ainoastaan lopputuote on painettu paperille Tekijänoikeusehdot vaihtelevat eri kustantajien julkaisusopimuksissa http://www.helsinki.fi/ejulkaiseminen/ Tukea julkaisusopimusten tekemiseen Tutkijalle itselleen oikeudet artikkeliinsa Rinnakkkaisjulkaisu oman tutkimuslaitoksen julkaisutietokannassa tai pdf-eripainokset Osa sähköisistä julkaisuista perii kirjoittajalta julkaisumaksua (sisällytettävä tutkimuskustannuksiin) Julkaisujen keskitetty lisensointi Nelli ja FinELib maksuttomia yliopiston koneilta ja/tai käyttäjätunnuksella Viitetietokannoista yleensä linkit eteenpäin abstrakteihin tai koko artikkeleihin IP tunnistuksella HY:n verkon sisäpuolelta tai käyttäjätunnuksella proxy-linkin kautta Ongelmallista pienempien tutkimuslaitosten tutkijoille ja muille tiedon tarvitsijoille esim. toimittajille 2
Avoimet julkaisut verkossa Tieteellisten julkaisujen kustannusrakenne on omalaatuinen (verrattuna muuhun kustannustoimintaan) Ongelmana jatkuvasti kasvavat tieteellisten sarjojen tilausmaksut Verkkoon syntynyt y y ilmaisia tieteellisiä julkaisuja, j jotka kilpailevat perinteisten painettujen sarjojen kanssa kevyempi kustannusrakenne laadun ylläpito (referointi) Paperijulkasut pyrkivät pitämään tilaajansa julkaisemalla artikkelit digitaalimuodossa viiveellä Portaalit Keskenään yhteensopimattomia käyttöliittymiä voidaan yhtenäistää portaalipalvelun alle NELLI: kansalliskirjaston portaalipalvelu www.nelliportaali.fi Viitetietokantoja Julkaisutietokantoja e-kirjoja Hakuteoksia, sanakirjoja Tilanne tällä hetkellä Kaikki oleelliset tuoreet sarjajulkaisut löytyvät digitaalimuodossa verkosta HTML-muoto nopeaan tutkimiseen PDF-muoto paperitulostukseen Hakutoiminnot ovat parantuneet huimasti Kirjoja hyvin vähän saatavilla verkossa, jatkossa tilanne voi muuttua (mm. Amazon.comin projektit) Vanhoja klassikkojulkaisuja ei välttämättä löydy verkosta, ne täytyy edelleen hankkia kirjastosta Useita hankkeita vanhojen tieteellisten atikkelien digitalisoimiseksi Kuva: Noël Zia Lee, http://www.flickr.com/photos/noelzialee/298937843/ Creative Commons Attribution 2.0 Generic Nimet voivat olla epätäsmällisiä (monta merkitystä) Synonyymejä (monta nimeä) Erilaiset käyttötavat Mitä Oenanthe tarkoittaa? Taksoninimet Paikannimet Ihmisten nimet Tasku Kuva: mozzercork, http://www.flickr.com/photos/noelzialee/298937843/ Creative Commons Attribution 2.0 Generic Pahaputki Kuva: Rictor Norton & David Allen, http://www.flickr.com/photos/rictor-and-david/2554972281/ Creative Commons Attribution 2.0 Generic 3
Mitä Larus argentatus tarkoittaa? Mitä Larus argentatus tarkoittaa? van Noordwijk 2004 Larus argentatus L. a. argentatus t L. a. michahellis Mullarney ym. 1999 Larus argentatus Larus michahellis Larus argentatus sec. van Noordwijk 2004 = urn:lsid:luomus.fi:gu:1540 Larus argentatus t sec. Mullarney ym. 2001 = urn:lsid:luomus.fi:gu:5462 Nimistötietokantoja Nimistötietokantoja www.luomus.fi/taxondev www.catalogueoflife.org Nimistötietokantoja Missä on Myllyjärvi? www.itis.gov 4
Paikan merkitseminen Koordinaatit Koordinaattijärjestelmä Virhearvio (säde tai koordinaattien tarkkuus) Näytteet ja digitointi Kasvimuseon sijainti: 6675495:3386271 yhtenäiskoordinaatisto 6672693:8386148 ETRS-TM35FIN 60.175201:24.947744 WGS84 Kokoelmien käyttö: kehitysvaiheet 1. Etiketit, systemaattinen järjestys 2. Kortistot 3. Sisäinen kirjanpito tietokoneella 4. Luettelojen jakelu levykkeellä tai CD:llä 5. Suojattu luettelo verkossa 6. Avoin luettelo verkossa 7. Kuvitettu avoin luettelo verkossa 8. Virtuaalinäyte Sisäinen kirjanpito tietokoneella Työläin vaihe paperikortiston siirto koneelle Aineiston monipuolinen indeksointi ja lajittelu useiden eri kriteerien perusteella Myös tilastoinnit vaivattomasti Avoin luettelo verkossa Yhä useampi alunperin suljettu luettelo on avattu julkiseen käyttöön Joissakin maissa avoimuus on lakisääteistä Kaupalliset hyödyntämismahdollisuudet usein verrattain rajoitetut Luettelointi yleensä aloitettu arvokkaimmista näytteistä tyyppinäytteet hävinneet ja uhanalaiset lajit Kuvitettu luettelo, Virtuaalinäyte Valokuvia, 3D-kuvia, röntgenkuvia Mahdollistaa kokoelmien tutkimisen paikasta ja ajasta riippumatta, vähentää tarvetta matkustaa ja postittaa näytteitä Virtuaalinäyte: oikeaa näytettä ei tarvita 5
Tilanne tällä hetkellä Kastikka-kasvitietokanta Jatkuvasti uusia kokoelmatietokantoja tulee saataville verkon kautta Käyttöliittymät selainpohjaisia, muutoin paljon yksilöllisiä eroja Globaaleja portaalihankkeita, mm. GBIF (Global Biodiversity Information Facility) Avoimuus lisääntymässä Kasviatlas, www.luomus.fi/kasviatlas Linnén näytteet Helsingissä http://www.fmnh.helsinki.fi/english/botany/linne/ Havaintotietokannat Suomalaisia: Hatikka: kaikki eliöt kaikkialta Tiira: linnut Suomesta Hyönteistietokanta: hyönteiset Suomesta Lepakkohavainnot.info: p lepakot Suomesta Havaintohaku Ulkomaisia: Artportalen: Ruotsi ebird: USA 6
data.gbif.org Kokoelmatiedot nykyään tietokantaan: haku eri kriteereillä, tietojen yhdistely Tallennettavan tiedon laatu tärkeää Havaintotietoja kerätään verkossa Tiedon avoimuus lisääntymässä 7