Digiarkistosta palveluja kuluttajille 29.9.2016 Kari Kaikkonen Mediatalo ESA Oy
Etelä-Suomen Sanomat digitaalisena Kansalliskirjastossa Kansalliskirjasto on digitoinut Etelä-Suomen Sanomat ja sitä edeltäneet julkaisut vuodesta 1900 tähän päivään saakka. Vanhat julkaisut vuoteen 2013 saakka on digitoitu mikrofilmeistä ja tuoreet julkaisut talletetaan Kansalliskirjaston tietojärjestelmään PDF- ja XML-tiedostoina. Etelä-Suomen Sanomien digisisällöt ovat toimituksen sisäisessä käytössä Kansalliskirjaston järjestelmästä.
Digiarkiston sisältöjen tarjoaminen kuluttajille Mediatalo ESA:lla on tavoitteena tarjota digisisältöjä maksullisena palveluna kuluttajille. Palvelun toteuttaminen on nyt mahdollista tekijänoikeuksien ja teknologian puolesta. Kaupallisen hyödyntämisen käynnistämiseksi täytyy vielä sopia toimintamalli yhteistyöstä Kansalliskirjaston kanssa ja toteuttaa tekninen rajapinta Kansalliskirjaston järjestelmään arkistolehtien ja yksittäisten sivujen esittämiseksi kuluttajille.
Arkiston hyödyntäminen median verkkopalvelussa Lehden arkiston sisältö on paljon laajempi kuin verkkojulkaisun arkiston sisältö.
Arkiston integroiminen median verkkopalveluun Ville Haapasalosta kertovaan juttuun on jutun luontivaiheessa lisätty tagi Ville Haapasalo. Kun lukija avaa jutun, julkaisujärjestelmä lähettää tagin hakusanana arkistoon, joka palauttaa muutaman osuman sekä Näytä lisää -linkin. Jos lukija klikkaa arkistolinkkiä, hän saa luettavakseen sen arkistosivun, jossa juttu on julkaistu. Hakusanan esiintymät sivulla on korostettu..
Tekstiarkiston integroiminen median verkkopalveluun 1. Median verkkojulkaisun sivulle lisätty widget lähettää jutun tagin hakusanana arkistopalveluun 4. Palvelu palauttaa N osumaa ja Näytä lisää -linkin 5. Lukija klikkaa linkkiä Median arkistopalvelun api (rajapinta) 2. Haku 3. Hakutulos Median hakumoottori, johon arkiston sisältö on indeksoitu 6. Sivupyyntö Kansalliskirjaston rajapintaan 8. Lukijalle palautetaan arkistosivu 7. Sivun lähetys Kansalliskirjaston palvelu, josta sivujen kuvat haetaan
Itsenäinen arkistopalvelu Salpausselän kisat HAE
Sanahaku palauttaa sivun, jossa hakutermit on korostettu
Tekstihaun prosessi digitaalisessa lehtiarkistossa 1. Hakupyyntö 4. Hakutulos 5. Sivupyyntö Median arkistopalvelu 2. Haku 3. Hakutulos Median hakumoottori, johon arkiston sisältö on indeksoitu 8. Päätelaitteelle sovitettu sivu 7. Sivun lähetys 6. Sivukuvan pyyntö rajapinnalle Kansalliskirjaston palvelu, josta sivujen kuvat haetaan
Hakupalvelussa voi hakea kokonaisen lehden kalenterinäkymästä
Arkiston hyödyntäminen median verkkopalvelussa Asiakkaat voivat hakea sisältöä tekemällä tekstihakuja tai valitsemalla lehden julkaisupäivämä ärän perusteella. Sisältöä voi hakea sana- ja fraasihaulla ja haussa voi käyttää ns. sumeaa hakua.
Kalenterihaku palauttaa yhden päivän lehden
Yhden päivän julkaisun haku digitaalisessa lehtiarkistossa 1. Käyttäjä avaa kalenterinäkymän 2. Kalenteri näyttää julkaisupäivät Median arkistopalvelu (tietää julkaisupäivät ja sivumäärät) 3. Päivän lehden pyyntö (selailtavana jpg-muodossa tai yhtenä pdf-tiedostona) 8. Päätelaitteelle sovitettu sivu 7. Etusivun kuvan tai koko lehden numeron sisältävän pdf-tiedoston lähetys 4. Lehden numeron haku Kansalliskirjaston palvelu, josta sivujen kuvat ja pdf-tiedostot haetaan
ESA digiarkisto Saas-palveluna Mediatalo ESA toteuttaa medioille tarkoitetun digitoitujen sanomalehtisisältöjen haku- ja jakelupalvelu, jonka avulla mediat voivat tarjota arkistosisältöjä asiakkailleen verkossa. Tekstisisällöt ja metatiedot tuodaan Kansalliskirjaston tietokannasta ja indeksoidaan ESA digiarkiston hakumoottoriin monipuolisten hakujen mahdollistamiseksi Loppukäyttäjille esitettävät sivujen kuvat ja kokonaiset julkaisut esitetään Kansalliskirjaston palvelusta rajapinnan kautta. Mediatalo ESA tekee palveluun käyttöliittymän sisältöjen hakemiseen ja esittämiseen
ESA digiarkiston kuvaus ESA digiarkisto toimii kahdennetussa pilvipalvelussa Palvelu koostuu useista komponenteista: Hakurajapinta, api, johon loppukäyttäjien sisältöhaut tulevat Hakumoottori, johon sisällöt on indeksoitu hakuja varten Vapaasanahaku, fraasihaku, sumea haku, boolean haku, suomenkielen taivutus Kuvatiedostojen välitys loppukäyttäjille Tiedostopyynnöt käyttäjältä Kansalliskirjastoon Kuvien käsittely ja välitys loppukäyttäjälle Käyttöoikeuksien hallinta Käytön seuranta tekijänoikeuksien valvontaa varten
Loppukäyttäjän tuotteet Hakunäkymä digiarkistoon Fraasihaku, useita hakutermejä, jotka voivat olla pakollisia, valinnaisia tai kiellettyjä, aikarajaus Javascript-widgetti samaan aiheeseen liittyvien arkistosisältöjen hakemiseen ja esittämiseen median verkkojulkaisussa Päivän uutiseen liittyvää avainsanaa, tagia, hyödynnetään käyttämällä tagia hakuterminä
Arkistopalvelun toteutus Digiarkistopalvelun toteutus edellyttää seuraavien teknologiahankkeiden toteutusta: Mediatalo ESAn ehdottaman rajapinnan toteuttamista Kansalliskirjaston digiarkistoon. Kansalliskirjaston tehtävä. Tietojärjestelmän toteuttamista pilvipalveluun: Mediatalo ESA toteuttaa yhdessä teknologiakumppanin kanssa Digiarkiston sisältöjen importointi ja päivitys Alto-tiedostoista Sisältöjen indeksointi eri käyttötarkoituksia varten Eri palvelu- ja käyttäjäryhminen hallintapalvelut API-sovelluksen kehittämistä indeksoidun datan esittämiseksi Digitoitujen sivujen ja julkaisujen kuva- ja pdf-tiedostojen haku Kansalliskirjaston arkistosta Loppukäyttäjälle tarjottava näkymä/käyttöliittymä, jolla digisisältöjä haetaan ja esitetään.