Julkaisuarkistojen käyttötilastot: Mitä tilastoidaan ja miksi?

Samankaltaiset tiedostot
Analytiikka tulosten mittaamisessa. Google Analytics

Kirjastoverkkopäivät, DSpace-sessio, Jyrki Ilva

COUNTER-tilastosuositukset - Code of Practice for Journals and Databases, Release 3 - Code of Practice for Books and Reference Works, Release 1

Julkaisuarkistopalveluiden tilannekatsaus

Finna käytön trendit 2014 Tiivistelmä

Open access Suomessa 2013? Avoin tiede -keskustelutilaisuus, Jyrki Ilva

þÿ O p i n n ä y t t e e t v e r k k o o n m o n t a h y v ä ä s y y t ä Holopainen, Mika

Kansalliskirjaston julkaisuarkistopalvelut. Jyrki Ilva Erikoiskirjastojen neuvosto,

Julkaisuarkisto avoimen julkaisemisen infrastruktuuri

Miten julkaisen työni yliopiston sähköisessä julkaisuarkistossa

Open repositories 2011 Austin, Texas, Julkaisuarkistotapaaminen, Jyrki Ilva

Finna Tunnusluvut

TIEDONHAKU INTERNETISTÄ

Järjestelmäarkkitehtuuri (TK081702)

OPEN ACCESS HELSINGIN YLIOPISTOSSA

Open Repositories Helsingissä

Tutkimus vapaaksi verkkoon! seminaari, Helsingin yliopisto, Jyrki Ilva

Miten löydän Venäjää koskevaa tietoa? Johdatus monitieteiseen Venäjä-tutkimukseen (VEN301)

Rinnakkaistallennuksen arkea, haasteita ja mahdollisuuksia

Theseus avoimen julkaisutoiminnan edistämisen välineenä ammattikorkeakouluissa

Helsingin yliopiston rinnakkaistallennuskäytäntö

Julkaisutiedot läpinäkyviksi: julkaisuportaali. Tampereen teknillinen yliopisto, Jyrki Ilva

Uusi JYKDOK ja kansallinen julkaisutietoportaali JUULI. Informaatikko Marja Kokko

Alternative access vaihtoehtoisia polkuja artikkeleiden luo

Käyttöehdot ja evästekäytäntö

Sähköistä asiointia graafisen alan yritysverkostossa - projektin yhteenveto - Ismo Heikkilä, VTT

Open Repositories 2014 Helsingissä

Theseus ja rajatun käytön aineistot

Tutkimusdatan pitkäaikaissäilytys ATT-hankkeessa.

Julkaisujen avoimen saatavuuden tukeminen

Kansallinen julkaisurekisteri ja kotimaiset viitetiedot. Linnea2-konsortion yleiskokous, Jyrki Ilva

FinElibin e-kirjojen käyttöä selvittävä kysely: Case Oulu Kari Tossavainen

Arto, Linda ja Fennica kansallisen julkaisurekisterin tietojen lähteinä. Asiantuntijakokous, Jyrki Ilva

Kirjastojen muuttuva toimintaympäristö haastaa perinteiset mittaustavat

JURE ja julkaisufoorumi. Julkaisuarkistotapaaminen, Jyrki Ilva

Hallintaliittymän tilastosivu jakautuu neljään osaan, yleisnäkymään, reaaliaikaisiin kävijätietoihin, hakutilastoihin ja raportointiin.

Projektinhallintaa paikkatiedon avulla

TYÖKALUT HAKUKONEOPTIMOINTIIN

Matti Hirvonen. Mediashake

Miten digimarkkinoinnilla tehdään tulosta?

SUOMEN KUNTALIITTO RY

E-aineistot ja tiedonhaun neuvonta Slaavilaisen kirjaston kokemuksia

Kansainväliset tutkijatunnisteet

Pimeän arkiston toteutusvaihtoehtoja Theseukselle

Väitöskirjakokoelma verkossa

Korkeakoulukirjastojen keskitetyt kirjastoverkkopalvelut Kristiina Hormia-Poutanen

Edellinen päivitys: :10 Raportin aikaväli: Kuukausi Elo 2010

Julkaisuarkistojen yhteentoimivuus

Rinnakkaisjulkaiseminen Tampereen yliopistossa

Juuli-julkaisutietoportaali: tilannekatsaus

Uude(llee)n ajattelua

Julkaisuportaali ja yliopistojen julkaisutiedot





PDF-tiedostojen optimointi hakukoneille

Tutkimuksen rahoitus valtion talousarviossa 2017

OPEN ACCESS JYVÄSKYLÄN YLIOPISTO AVOIN TIETEENTEKIJÄ

Tilastokeskus Kaisa-talolla yhteistyötä ja työnjakoa. Erikoiskirjastojen neuvoston vuosikokous

Hakukoneoptimointi. DigiReWork hanke Hamk.fi/digirework. Digityöpaja, Outi Mertamo.

Vastauksia palvelukyselyn palautteisiin

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

ORCID ja tutkijoiden tunnistaminen. RAKETTI-tulosseminaari, Jyrki Ilva

DigiReWork - digitaalisuus työelämän uudistajana

Porin tiedekirjasto ja TTY:n verkkoaineistot

Juuli - julkaisutietoportaali. Asiantuntijaseminaari, Helsinki Jyrki Ilva (jyrki.ilva@helsinki.fi)

Kangasniemen yrityshakemisto KÄYTTÖOHJE YRITTÄJÄLLE. KANGASNIEMEN KUNTA yrityshakemisto.kangasniemi.fi

Int rane n avoit itemitt ittarit

Yhteinen keittiö -hanke

Aineistojen hyöty-kustannus-suhde : Kokoelmapolitiikan priorisoinnit

Klikit Myynniksi. Raahe Jaakko Suojanen

Suomalaiset lehdet ja avoimen julkaisemisen rahoitus

Kansallinen digitaalinen kirjasto: tilannekatsaus

Hakukone digitaalisen mainonnan työkaluna

Tervetuloa Westpro cc Oy:n verkkosivuille.

Verkkosivut ja hakukoneoptimointi. Julkinen yhteenveto Jaakko Suojasen esityksestä

EMAGZ- AIKAKAUSLEHTIPALVELUN ETÄKÄYTTÖPILOTTI HELMET-KIRJASTOISSA

Ebrary-palvelun e-kirjojen lukeminen selaimessa

Kirjastot ja avoin lähdekoodi: DSpace

Kuinka tutkijat hakevat tietoa Aaltoyliopiston

JUSTUS - Theseus integraatio

Huippuyksikköohjelmien viestintä

Tämä on rinnakkaistallenne. Rinnakkaistallenteen sivuasettelut ja typografiset yksityiskohdat saattavat poiketa alkuperäisestä julkaisusta.

Juulin kehittäminen: tilannekatsaus

UUSI ARKKITEHTUURI PAREMMAT PALVELUT. Järjestelmäarkkitehtuurihankkeet

- kaksi vuotta amkien yhteisen julkaisuarkiston koordinointia

Yliopistojen julkaisujen avoimuus vuonna 2016

Digitaalisen median tekniikat. Esteettömyys ja käytettävyys

Kansallisten viitetietokantojen hyödyntäminen JUREssa

Visma Fivaldi. Ohjeet Java web startin ja HTML5-työkalun aktivointiin

Digitaalisen median tekniikat. Esteettömyys ja käytettävyys Harri Laine 1

Kuoleeko kaukopalvelu? Valtakunnalliset kaukopalvelupäivät, Turku

Tieteelliset lehdet ja takautuva digitointi. Digitointirahaa onko sitä? -seminaari Jyrki Ilva

egradu & Muuntaja Ylemmän tutkintovaiheen opinnäytetöiden elektroninen arkistoiminen ja esilletuonti

Kotisivutyöpaja -Kylien Salo-

Kotimainen tieteellinen julkaiseminen ja avoimuus. Johanna Lilja Kirjastoverkkopäivät

Ouka.fi aikamatka saavutettavuuteen

Transkriptio:

Julkaisuarkistojen käyttötilastot: Mitä tilastoidaan ja miksi? DSpace-käyttäjäryhmän tilastoseminaari Kansalliskirjaston auditoria, 3.11.2009 Jyrki Ilva (jyrki.ilva@helsinki.fi)

Miksi verkkopalveluiden käyttöä tilastoidaan? Palveluiden ja toiminnallisuuksien parantaminen Mitä käyttäjät tekevät? Miten navigointi toimii? jne. Toiminnan tuloksellisuuden osoittaminen Miten paljon palvelua ja sen sisältämiä aineistoja käytetään? Tutkijoiden ja arkiston ylläpitäjien motivoiminen Auttaa perustelemaan palvelun merkitystä rahoittajille Web-analyytikassa puhutaan konversiosta Mitä julkaisuarkiston käyttäjien halutaan tekevän? Kokotekstin lataaminen?

Tilastoinnin haasteita Käytön tilastointi vaatii asiantuntemusta Valitettavan usein halutaan vain uskoa hienolta kuulostaviin suuriin lukuihin Tarvitaan aina analyysia siitä mitä luvut oikeasti kertovat Toinen näkökulma: julkaisujen vaikuttavuus Vaikuttavuutta voidaan tutkia esim. sitaatioanalyysilla Mittaa kuitenkin enemmän organisaation tuottaman tutkimuksen laatua kuin julkaisuarkiston toimintaa

Tilastoinnin tekniset lähtökohdat Nykyään kaksi perusvaihtoehtoa: Palvelimen lokitiedostojen analysointi Verkkosivuille sijoitettu, käyttäjän www-selaimessa toimiva javascript-koodi, jolla kerätään tietoja julkoiseen palveluun (esim. Google Analytics) Kummassakin ratkaisussa omat vahvuutensa ja heikkoutensa Täydentävät toisiaan, monissa palveluissa käytetään molempia

Kerättävät tiedot Kerätään monia erilaisia tietoja (mm.): Vierailijoiden, vierailuiden ja sivulatausten määrät Vierailijoiden IP-osoitteet/domain-nimet Vierailijoiden tuloreitit ja käytetyt hakusanat Sivulla vietetty aika ja sen kautta poistuneiden osuus Teknisiä tietoja kävijöiden käyttöjärjestelmistä ja selaimista Tältä pohjalta mahdollista generoida erilaisia tilastoja (esim. suosituimmat julkaisut) Yhdistelemällä tietoja voidaan analysoida kävijöiden liikkeitä palvelussa

Julkaisuarkistot ja tilastointi Kokotekstitiedostojen latauskerrat näyttävät järkevimmältä yksittäiseltä tilastointikohteelta / mittarilta Mittaa nimenomaan julkaisujen käyttöä Vrt. kaupalliset palvelut ja konversio päämääränä; miten moni kävijöistä päätyy lataamaan julkaisun? Latauskertojen tilastoinnin haasteita: PDF:ään liittyvät ongelmat, latautuvat usein palasissa, jolloin lokeista liian suuria lukuja PDF:ien käytön saaminen näkyviin esim. Google Analyticsissa vaatii virittelyä

Julkaisuarkistot ja tilastointi (2) Muistakin tilastotiedoista toki iloa ja hyötyä Esittelysivun kävijämäärä saattaa sekin kertoa työn herättämästä huomiosta Hakujen määrää ei kovin mielekästä tilastoida, koska haut tapahtuvat pääosin muissa järjestelmissä Hakurobotit ja tilastointi Pyritään suodattamaan pois: tyypillisesti kymmeniä prosentteja käytön kokonaismäärästä Suurin osa ei indeksoi PDF-tiedostoja, eli näiden kohdalla hakukoneiden osuus jonkin verran HTMLtiedostoja pienempi

Googlen merkitys Enemmistö kävijöistä tulee Googlen kautta Suuri osa näistä tulee suoraan kokotekstitiedostoon käymättä millään muulla palvelun sivulla Jos kokotekstien käyttöä ei tilastoida, eivät näy käyttöluvuissa Jos valtaosa käyttäjistä tulee Googlen kautta, kannattaako oman käyttöliittymän viilaamiseen satsata? Toisaalta paikalliskäyttäjät pääosin oman käyttöliittymän kautta, suomalaisetkin suurelta osin Ulkomaiset käyttäjät lähes pelkästään hakukoneen kautta

Mitä latauskerta oikeastaan kertoo? Latauskerta kertoo tiedoston lataamisesta, ei anna selkeää tietoa mitä käyttäjä on sillä tehnyt Ei voi rinnastaa painetun aineiston lainaus- tai myyntilukuihin Tiedonhakija saattaa vain kurkistaa tiedostoa ja todeta ettei se kiinnosta Vrt. ottaa kirjan hyllystä ja pistää sen takaisin Emme tiedä onko käyttäjä tulostanut tai lukenut julkaisun Toisaalta tiedosto saattaa siirtyä käyttäjän omalle kovalevylle/muistitikulle ja kadota tilastoinnin piiristä

Lukujen merkityksestä Esim. Doria: v. 2008 yht. 2,3 miljoonaa latauskertaa (eli keskimäärin noin 200 000 latauskertaa kuussa) Käytetyimpiä yksittäisiä julkaisuja ladataan tyypillisesti satoja kertoja kuukaudessa Suosio ei välttämättä kerro tieteellisestä merkittävyydestä Populaareja aiheita (1,2), julkkiskirjoittajia (1,2), jne. Vrt. yliopiston kolmas tehtävä? Toisaalta tieteellinen viestintä suunnattu pääosin tiedeyhteisön sisäiselle yleisölle Kohderyhmä voi olla hyvinkin pieni

Esimerkki: Maailman julkaisuarkistojen näkyvyys Espanjalaisen tutkimuslaitoksen kokoama lista: http://repositories.webometrics.info/ Tutkittu näkyvyyttä eri verkkopalveluissa Metodeja voi kritisoida, mutta tällaisilla listoilla kuitenkin toisinaan yllättävää merkitystä (vrt. listaukset parhaista yliopistoista) Tulevaisuudessa perustuu ehkä Google Analytics - raportteihin

Tilastoinnin yhdenmukaistaminen? Tarvitaanko julkaisuarkistojen käytön tilastoinnissa yhteisiä käytäntöjä tai suosituksia? Kaupallisten kustantajien Counter-suositus yksi mahdollinen vertailukohta Kirjastot tottuneet kaupallisten aineistojen yhteydessä Yhteensopivuutta toivottu myös julkaisuarkistoihin, jolloin käytön määrää arvioitaisiin samoilla mittareilla Käytännön toteutuksia julkaisuarkisto-ohjelmistoihin odotellaan edelleen Erot eivät kuitenkaan kovin suuria