Theseuksen kehittäminen Katsaus historiaan, kurkistus tulevaan

Samankaltaiset tiedostot
Julkaisuarkistopalveluiden tilannekatsaus

- kaksi vuotta amkien yhteisen julkaisuarkiston koordinointia

VERKKOKIRJASTO theseus

Pimeän arkiston toteutusvaihtoehtoja Theseukselle

Kansalliskirjaston julkaisuarkistopalvelut. Jyrki Ilva Erikoiskirjastojen neuvosto,

Metadatasuositus julkaisuarkistojen tekstiaineistoille

Metatietosuositus julkaisuarkistojen tekstiaineistolle

JUSTUS - Theseus integraatio

Theseuksen tulevaisuudennäkymiä

Julkaisuarkisto avoimen julkaisemisen infrastruktuuri

Vaatimusmäärittely julkaisujen tuelle Theseuksessa

Theseus avoimen julkaisutoiminnan edistämisen välineenä ammattikorkeakouluissa

To cite this Article: Tolonen, T. & Marjamaa, M. (2017) Theseus visio vuodelle 2018: täyden palvelun avoimen julkaisemisen alustaksi. Kreodi 3, 1 5.

Open Access- hanke. Organisaatio

Theseus ja rajatun käytön aineistot

Julkaisuarkistojen käyttötilastot: Mitä tilastoidaan ja miksi?

Arcada Nylands svenska yrkeshögskolan Opisk. / opettajat 200 %

Ohjeistus opiskelijalle opinnäytetyön tallentamiseksi Theseus-verkkokirjastoon.

Verkkokirjasto Theseuksen toimintasuunnitelma

Tutkimusdatan pitkäaikaissäilytys ATT-hankkeessa.

Kirjastot ja avoin lähdekoodi: DSpace

Uusi JYKDOK ja kansallinen julkaisutietoportaali JUULI. Informaatikko Marja Kokko

Kirjastoverkkopäivät, DSpace-sessio, Jyrki Ilva

OpenSearch-, RSS- ja ATOM-feedit Kansalliskirjaston julkaisuarkistoissa

UUSI ARKKITEHTUURI PAREMMAT PALVELUT. Järjestelmäarkkitehtuurihankkeet

OpenSearch-, RSS- ja ATOM-feedit Kansalliskirjaston julkaisuarkistoissa

Julkaisuarkistojen yhteentoimivuus

Tämä on rinnakkaistallenne. Rinnakkaistallenteen sivuasettelut ja typografiset yksityiskohdat saattavat poiketa alkuperäisestä julkaisusta.

Pieni historia-, tilasto- ja tulevaisuuskatsaus Theseukseen :

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

April 25, Rinnakkaistallentaminen. Theseus. Palautetta kyselyn vastauksiin. Tiina Tolonen & Minna Marjamaa

Finna Johtava avoimen kulttuurin ja tieteen hyödyntämisen väylä

Museoiden keskustelutilaisuus Kansalliskirjasto Museovirasto Arkistolaitos

KDK-asiakasliittymä - tilannekatsaus. OKM kirjastopäivät Kristiina Hormia-Poutanen

Tutkimus vapaaksi verkkoon! seminaari, Helsingin yliopisto, Jyrki Ilva

HY:n ehdotus käyttäjähallintotuotteesta

Korkeakoulujen kansallinen julkaisuportaali. OKM:n bibliometriikkaseminaari, Jyrki Ilva

Haka-käyttäjien kokoontuminen Arto Tuomi CSC Tieteen tietotekniikan keskus

RINNAKKAISTALLENNUSOHJE

Mitä, miksi ja miten?

Sähköisten materiaalien käyttö tableteilla

MatTaFi projektin HAKA-pilotti

Uloskirjautuminen Shibbolethissa

Moniviestin. Monimediaisen verkkosisällön tuotantojärjestelmä. Rikupekka Oksanen Jyväskylän yliopisto

ARTIVA-pilotointi. KVP asiantuntijaseminaari Lassi Lager

Kansallinen digitaalinen kirjasto missä mennään? Kristiina Hormia-Poutanen

Juuli-julkaisutietoportaali: tilannekatsaus

RINNAKKAISTALLENNUSOHJE

Kirjastojen kansallinen metatietovaranto KDK 2012 seminaari Terhi Mikkola, Kansalliskirjasto

Julkaisutiedot läpinäkyviksi: julkaisuportaali. Tampereen teknillinen yliopisto, Jyrki Ilva

SUKUKIELTEN DIGITOINTIPROJEKTI JA KIRJALLISUUSPANKKI ESIMERKKEINÄ TUTKIJAYHTEISTYÖSTÄ

KDK-Asiakasliittymä. KDK kevätseminaari Ari Rouvari

KDK-asiakasliittymä ja museot. Museo hankkeen aloitusseminaari Tapani Sainio, Kansalliskirjasto

Yhteisten palvelujen ohjauksen uudistaminen. Annu Jauhiainen

OPINNÄYTETYÖN JULKAISEMINEN THESEUS- VERKKOKIRJASTOSSA. Päivi Toikkanen

Vaihe 1: Opinnäytetyötä koskevien perustietojen tallennus HumakProssa

Juuli-julkaisutietoportaali

Oulun seudun ammattikorkeakoulu, kirjaston ryhmätyötila 4, Sosiaali- ja terveysalan yksikkö, Kiviharjuntie 8, (90220) Oulu

Korkeakoulujen kirjastojärjestelmien uusiminen - tilannekatsaus

Ajankohtaista Kansalliskirjaston palveluissa

Hankintayhteistyö korkeakoulujen kirjastojärjestelmän hankinnassa

OJS-palvelun kehittäminen. Artiva-seminaari Johanna Lilja

Kansalliskirjaston ATThankkeet

TSV:n palvelut verkkojulkaisemisessa. Sari Lehtinen Julkaisu- ja verkkopalvelut

Visma Liikkuvan työn ratkaisut VLS lisensointi. Ylläpitäjän opas

lähtijöistä EU EUC YLIOPISTOT Lappeenrannan teknillinen yo ,

Vastauksia palvelukyselyn palautteisiin

AsioEduERP v12 - Tietoturvaparannukset

Laadukas verkkototeutus - valmennus. Toteutuksen viimeistely klo

Kansallinen metatietovaranto Melindan tilannekatsaus. Minna Olkinuora-Tauru Asiantuntijaseminaari

Talotietojen päivittäminen

Juulin kehittäminen: tilannekatsaus

TYPO3 - Open Source Enterprise CMS

egradu-hanke Ylemmän tutkintovaiheen opinnäytetöiden elektroninen arkistoiminen ja esilletuonti

ARTOn / ARTIVAn hyödyntäminen julkaisutiedonkeruussa

NTG CMS. Julkaisujärjestelm. rjestelmä

Suomalaiset julkaisuarkistot osa kansainvälistä yhteisöä? Jyrki Ilva Kirjastoverkkopäivät,

Opinnäytteen tallennus Theseus-verkkokirjastoon

Avoin tiede ja tutkimus ATT Hankkeiden esittely

Varaamon kautta kirjaston laitteet, tilat ja palvelut löytyvät helposti

Finnan ja kirjaston palveluiden ohjeita

v4.0 Palvelukuvaus

Journal.fi-palvelu. Antti-Jussi Nygård Tieteellisten seurain valtuuskunta

Järjestelmäarkkitehtuuri (TK081702)

Arvio lähtijöistä. Arvio, kk. lähtijöistä (2v (2v Tuki 09/10. (2v

Talotietojen päivittäminen

Open access Suomessa 2013? Avoin tiede -keskustelutilaisuus, Jyrki Ilva

JulkICT Lab ja Dataportaali Avoin data ja palvelukokeilut

egradu & Muuntaja Ylemmän tutkintovaiheen opinnäytetöiden elektroninen arkistoiminen ja esilletuonti

Finnan ja kirjaston palveluiden ohjeita

Haka-kokoontuminen Helsinki

Kirjastoverkkopalveluiden. toiminta Kristiina Hormia- Poutanen KANSALLISKIRJASTO

MichaelPlus. Hankkeen esittely Mikael Vakkari Suunnittelija MichaelPlus hanke

Finnan palvelusopimukseen lisättävät liitteet

Kirjastoverkkopalvelut Tulokset, avainluvut ja kohokohdat KANSALLISKIRJASTO

Metatietovaranto Melinda Hankkeen tilanne Minna Olkinuora-Tauru

Open Journal Systems digitoitujen aineistojen tallennusalustana ANTTI-JUSSI NYGÅRD SUUNNITTELIJA, TIETEELLISTEN SEURAIN VALTUUSKUNTA

Julkaisukanava-hankkeen DSpacen shibbolointi

Sisältö. Päivitetty viimeksi Sivu 2 / 14

Transkriptio:

Theseuksen kehittäminen Katsaus historiaan, kurkistus tulevaan Theseus 10-vuotisjuhlaseminaari 21.11.2018 Samu Viita (samu.viita@helsinki.fi)

Esityksen runko teknispainotteinen katsaus Theseuksen historiaan ja tulevaisuuteen Theseuksen suunnittelu, pilotointi ja tuotannon ensivaiheet Pikakelaus nykypäivään: poimintoja matkan varrelta Kansalliskirjaston julkaisuarkistopalvelun kehittämisperiaatteita Tuoreita ominaisuuksia Kurkistus Theseuksen tulevaisuuteen

Theseuksen suunnittelu - lähtötilanne 11. joulukuuta 2007 rehtorit allekirjoittivat sopimuksen ammattikorkeakoulujen yhteisestä verkkokirjastopalvelusta Kansalliskirjasto (KK) valittiin verkkokirjaston toteuttajaksi KK julkaisuarkisto Doriaan kuuluneet E-thesis, LutPub ja Stadia toimivat referenssinä opinnäytteiden julkaisuprosessista.

Theseuksen suunnittelu ja pilotointi Palvelusopimus AMK:ien ja KK:n välillä vuosiksi 2008-2013 Suunnittelu- ja kehitystyö tapahtui talven ja kevään 2008 aikana. Pilotointi touko - joulukuussa 2008 11 AMK:ia mukana pilotissa (Arcada, HAAGA-HELIA, Jyväskylä, Kemi-Tornio, Lahti, Laurea, Metropolia, Pirkanmaa, Satakunta, Seinäjoki ja Turku). Pilotoivien amkien kanssa kokoonnuttiin suunnitteluvaiheessa useaan otteeseen ja hahmoteltiin vaatimuksia.

Theseuksen suunnittelu Avoimen lähdekoodin sovellus DSpace valittiin myös Theseukseen Suunnittelupalavereissa nousi erityisesti esiin itsetallentamiseen liittyvän käytettävyyden tärkeys. Palvelun juridiset seikat askarruttivat Julkaisulupa, uudelleenkäyttöön liittyvät lisenssit, käyttöehdot, metadata / kokoteksti... AMK:it tilasivat lakitoimistolta apua. -> Theseuksen ominaisuuksiin merkittävä lisäys viime hetkellä: Creative Commons lisensointi opinnäytteisiin.

Kehittämisvaiheen haasteita Miten toteuttaa kaikki vaatimukset neljässä kuukaudessa tuotantokuntoon puolen htv:n resursseilla: Syöttölomakkeen vaatimukset opinnäytteiden luovuttamiseen: Kriittinen osa valmistumisprosessia, ei siedä katkoja tai hidasteluja Ennustettu vuosikartunta jopa 30 000 opinnäytettä Käyttäjäystävällisyys välttämätöntä -> Lomaketta käytetään keskimäärin kerran elämässä Haka-kirjautuminen + tietojen esitäyttö Tuki eri selaimille Monikielisyystuki

Kehittämisvaiheen haasteita Syötön vaatimukset eivät toteutuneet Dspace-lomakkeella 2008: Ei kielikäännöksiä, metadatan kieliversiointia, kenttien esitäyttöä, URN-tunnuksen automaattista hakua yms Päätös: Opinnäytteiden luovutuslomake itsenäisenä sovelluksena ja eri palvelimelle kuin julkaisuarkisto Syöttölomake räätälöitävissä paremmin ja luovutus riippumaton Theseuksen julkaisuarkiston mahdollisista katkoista

Kehittämisvaiheen haasteita Dspacen muokkaus verkkoarkistolle (Theseukselle) sopivaksi Dspace suunniteltu alun perin yhden organisaation tarpeisiin, vaati muokkauksia koodiin Ulkoasu, ohjeistus, kielikäännökset Joitain Dspacen ominaisuuksia tuli piilottaa käyttäjiltä Puutteiden ja bugien, kuten rajapintojen tietoturvavuotojen korjaaminen Dspacen käyttäjänhallinnan sovittaminen Theseuksen käyttöön

Kehittämisvaiheen haasteita Haka-käyttäjätunnistusjärjestelmä Hakan ideana tarjota kertakirjautuminen verkoston jäsenille Teoriassa Hakan luottamusverkostosta tulevat tiedot ovat yhteismitallisia Selvitys paljasti kuitenkin toista: AMK-kohtaisia vaihteluja käytänteissä oli attribuuttien ja niiden arvojen osalta -> Vaati yhtenäistämistä AMK:ien IdP-vastaavien kanssa Osaa atribuuttien käytön poikkeuksista ei saatu yhteismitalliseksi Koodissa AMK-kohtaisia poikkeuksia niiden hallintaan Osa AMK:eista oli pitkään ilman Haka-tekniikkaa Tuli toteuttaa lomake myös ilman Hakaa kirjautuville

Kehittämisvaiheen haasteita Vaatimusmäärittelyyn viime hetken lisäys CC-lisenssien tukemisesta Syötön yhteyteen haluttiin tuki käyttäjän valintoja ohjaavalle lisenssivalitsimelle, joka tuottaisi metadataan ja pdf:ään CC-lisenssin kuvineen ja linkkeineen Pdf-tiedostoon lisäyksestä kuitenkin luovuttiin - se koettiin liian riskialtiiksi syöttövolyymi suuri, pdf:ien versiovariaatiota odotettavissa paljon Ratkaisu: Syöttö kaksivaiheinen, ensin lisenssin valinta, toisessa vaiheessa itse opinnäytteen kuvailu Mahdollistaa lisenssitiedon lisäämisen opinnäytteeseen näiden välissä

Täsmentynyt aikataulu Theseus Shibboleth autentikoidulla syötöllä tuotantokunnossa 16.5.2008 Creative Commons tuki kesän 2008 aikana Aikataulu oli siis edelleen haastava. Hätäapua koodaukseen KK:n Nelli-tiimiltä Lopulta Theseus saatiin onnellisesti tuotantokuntoon aikataulun mukaisesti!

Tuotannon ensivaiheet Day one: 0 tietuetta Opinnäytteiden määrä nousi kesän aikana yli 1000 kpl Takautuvia aineistoja vietiin Theseukseen SAMK:in toimesta jo kesän aikana Asiakastuki aluksi haastavaa: paljon suoria yhteydenottoja asiakkailta AMK-kirjastot, opiskelijat, tiedonhakijat, opettajat Tilanne helpottui Kansalliskirjastossa, kun Theseus-rukkaset aloittivat toimintansa 2010: Suorat asiakaskontaktit ohjattiin rukkasille

Tuotannon ensivaiheet Syöttöprosessi osoittautui toimivaksi Kesti kuormaa hyvin, myös pilotin jälkeen Syöttölomake nopea ja käytännössä vapaa katkoista tai hidasteluista Syöttö vastasi odotuksia myös käytettävyyden osalta Pilotin aikana käyttöluvut ja kartunta maltillista, ei palvelun kuormaan liittyviä haasteita vielä 2008

Ylläpidon haasteita 2009 -> Käyttökuorma omaa luokkaansa Opinnäytteitä hyväksyviä virkalijoita lähes 200 (arvio) Opinnäytteitä syötetään ruuhka-aikaan parhaillaan yli 300 päivässä Aktiivisia käyttäjiä sivustolla yli 2000 (20.11.2018 Google analytics) Paljon hakurobottiliikennettä Palvelunestohyökkäykset

Pikakelaus nykypäivään 2009 Julkaisujen syöttömahdollisuus: Julkaisutyöryhmä suunnitteli metadatan. KK-kehitti pdf-latauksien tilastointiohjelma Simplestatsin julkaisuarkistoihinsa 2010 AMK:it lähes täysilukuisina mukana, vuosikartunta n. 10 000, pdf-latauksia n. 1,5 milj. 2011: Toinen täysipäiväinen työntekijä julkaisuarkistojen tekniikkaan KK:ssa (Päivi Rosenström)! KK otti virtuaalipalvelintekniikan ja versionhallinnan käyttöön. 2012: Theseuksen etusivu www.theseus.fi sai uuden osoitteen submission.theseus.fi ja www.theseus.fi vapautui julkaisuarkiston käyttöön. 2013: Vuosikartunta n. 15 000, pdf-latauksia n. 12 milj. 2014: Theseuksen etusivu eli nykyinen submission.theseus.fi siirtyi KK:n ylläpitoon. 2016: Kolmas täysipäiväinen työntekijä julkaisuarkistojen tekniikkaan KK:ssa (Anis Moubarik)! 2017: Responsiivinen käyttöliittymä, kansikuvat ja Rest-rajapinta. Vuosikartunta n. 17 500, pdf-latauksia n. 16,5 milj.

Kansalliskirjaston julkaisuarkistojen kehittämisperiaatteita KK:n julkaisuarkistopalvelulla nykyisin 11 julkaisuarkistoa ylläpidossa Theseus, Doria, Julkari, Jukuri, Valto, Lauda, TamPub, UTUPub, LUTPub, Osuva, Fenno-Ugrica Asiakaskohtaisia kehitystoiveita riittää - Suurin osa kuitenkin yhteisiä Ominaisuustoiveet pyritään toteuttamaan kaikille aina kun mahdollista Kaikki saavat hyödyn uudistuksista ja bugikorjauksista

Tärkeimmät kehittämistä ohjaavat periaatteet KK:n julkaisuarkistopalveluissa Tietoturva Vakaus Saatavuus ja saavutettavuus: Mahdollisimman monen käytettävissä Käyttö erilaisilla päätelaitteilla ja apuvälineillä (esim. näkövammaiset) Myös koneet käyttäjinä Tiedon uudelleenkäytön mahdollistaminen Julkaisuarkistot osana isompaa IT-infrastruktuuria (Jyrki Ilvan esitys kertoo tästä tarkemmin)

Tärkeimmät kehittämistä ohjaavat periaatteet Edellä luetellut periaatteet tarkoittavat usein myös maltillisuutta uusien toimintojen tai esim. grafiikan suhteen "keep it simple"

Theseuksen tuoreita ominaisuuksia 2017-2018 Responsiivinen käyttöliittymä Mobiililaitteille tuki Kansikuvat Dspace 5:en myötä ImageMagick-ohjelma hoitaa Uusi REST-rajapinta Dspacen virallinen, korvasi aiemmin KK:ssa laaditun REST:in Refworks-exportointi äänen ja videon streamaus HTML5 -tekniikalla Kuvagalleriatoiminto

Kurkistus Theseuksen lähitulevaisuuteen Luovutaan vanhasta Theseuksen syöttölomakkeesta tilalle KK:n muokkaama Dspace-lomake Miinuksia toistaiseksi: Ei metadataan kielimääreitä eikä tietojen esitäyttöä Hakan perusteella Hyötyjä: Finto-kytkös, jatka myöhemmin -toiminto, toistuvien kenttien syöttö helpompaa Lomakkeiden kustomointi ja päivittäminen helppoa Uusia ominaisuuksia Theseuksen syöttölomakkeelle tulevaisuudessa Kirjaston henkilökunnalla mahdollisuus siirtyä kokonaan Haka-kirjautumiseen (vaatii Haka-attribuuttien osalta lisäselvitystä / koordinointia)

Kurkistus lähitulevaisuuteen Kansallisen metadatasuosituksen käyttöönotto (Tanja Vienonen, KK) Kokoelmien karsinta: Yksi opinnäyte- ja julkaisukokoelma per AMK Koulutusohjelma- yms. tiedot esiin selausvaihtoehtojen ja fasettien avulla Ulkoasu-uudistus (Minna Marjamaan ja Tiina Tolosen esitys) EU:n vaatimukset: Saavutettavuuden ja GDBR:n huomioonotto entistä paremmin Endnote-eksportointi Odottaa metadatauudistusta ja viittaussuosituksen valmistumista APA-tyylinen viittauslaatikko Odottaa metadatauudistusta ja viittaussuosituksen valmistumista

Kurkistus lähitulevaisuuteen Kuorman tasaus: Kuormaa tasattu aiemmin vain erottamalla syöttö ja julkaisuarkisto (Dspace) eri palvelimille Suunnitelmissa hoitaa syöttökin jatkossa Dspacella Tarve kuorman tasaukselle DSpace (www.theseus.fi) klusteroidaan: yhteensä viisi palvelinta pyörittämään Theseuksen julkaisuarkistopuolta

Kurkistus lähitulevaisuuteen http -> https Luovutaan http:stä, vaatii vielä selvitystä haravoijien osalta Justus-kytkentä Theseukseen Julkaisujen syöttöön ja tiedonkeruuseen helpotusta Justuksen avulla Tästä tarkemmin Joonaksen Nikkasen esityksessä!

Alustavia suunnitelmia pidemmälle tulevaisuuteen Julkaisuarkistojen tietojen avaaminen linkitettynä datana Metadatauudistus edistää linkitetyn datan käyttöönottomahdollisuuksia Datat todennäköisesti Turtle-formaattia Pimeä arkisto Theseuksen yhteyteen Kokoelmarakenteen purku ja Dspace-syöttölomakkeen käyttö avaa mahdollisuuksia pimeän arkiston toteuttamiselle Vaatii vielä teknistä ja muuta selvitystyötä lisää!

Kiitos! Lopuksi vinkki juhlaseminaarin väelle: Sulzer-höyrykone 2. kerroksessa!