Datan jäljet -työpaja

Samankaltaiset tiedostot
On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Käytön avoimuus ja datanhallintasuunnitelma. Open access and data policy. Teppo Häyrynen Tiedeasiantuntija / Science Adviser

Tutkimusdata ja julkaiseminen Suomen Akatemian ja EU:n H2020 projekteissa

Infrastruktuurin asemoituminen kansalliseen ja kansainväliseen kenttään Outi Ala-Honkola Tiedeasiantuntija

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Korkeakoulujen tietohallinto ja tutkimus: kumpi ohjaa kumpaa?

Tutkimusrahoittajien ja tiedejulkaisujen vaatimukset aineistonhallinnalle

anna minun kertoa let me tell you

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

BDD (behavior-driven development) suunnittelumenetelmän käyttö open source projektissa, case: SpecFlow/.NET.

Hankkeiden vaikuttavuus: Työkaluja hankesuunnittelun tueksi

Nuku hyvin, pieni susi -????????????,?????????????????. Kaksikielinen satukirja (suomi - venäjä) ( (Finnish Edition)

The CCR Model and Production Correspondence

National Building Code of Finland, Part D1, Building Water Supply and Sewerage Systems, Regulations and guidelines 2007

Skene. Games Refueled. Muokkaa perustyyl. for Health, Kuopio

Capacity Utilization

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

Information on Finnish Courses Autumn Semester 2017 Jenni Laine & Päivi Paukku Centre for Language and Communication Studies

Miksi Suomi on Suomi (Finnish Edition)

Information on preparing Presentation

Uusia kokeellisia töitä opiskelijoiden tutkimustaitojen kehittämiseen

AYYE 9/ HOUSING POLICY

Uusi Ajatus Löytyy Luonnosta 3 (Finnish Edition)

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

Business Opening. Arvoisa Herra Presidentti Very formal, recipient has a special title that must be used in place of their name

Choose Finland-Helsinki Valitse Finland-Helsinki

Julkaisun laji Opinnäytetyö. Sivumäärä 43

Results on the new polydrug use questions in the Finnish TDI data

Returns to Scale II. S ysteemianalyysin. Laboratorio. Esitelmä 8 Timo Salminen. Teknillinen korkeakoulu

koiran omistajille ja kasvattajille 2013 for dog owners and breeders in 2013

Information on Finnish Language Courses Spring Semester 2017 Jenni Laine

MEETING PEOPLE COMMUNICATIVE QUESTIONS

ATLAS-kartan esittely - Peli palveluiden yhteiskehittämisen menetelmistä Päivi Pöyry-Lassila, Aalto-yliopisto

KONEISTUSKOKOONPANON TEKEMINEN NX10-YMPÄRISTÖSSÄ

Vertaispalaute. Vertaispalaute, /9

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus

1. Liikkuvat määreet

Salasanan vaihto uuteen / How to change password

Infrastruktuurin aineistonhallinta ja käytön avoimuus

Esikaupallisesti ratkaisu ongelmaan. Timo Valli 58. ebusiness Forum

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

Operatioanalyysi 2011, Harjoitus 4, viikko 40

EVALUATION FOR THE ERASMUS+-PROJECT, STUDENTSE

Väite Argument "Yhteiskunnan velvollisuus on tarjota virkistysalueita ja -palveluita." "Recreation sites and service

Oma sininen meresi (Finnish Edition)

EUROOPAN PARLAMENTTI

Humanististen alojen aineistojen erityispiirteet ja aineistonhallinta METODIFESTIVAALI

Hankkeen toiminnot työsuunnitelman laatiminen

ETIIKKASEMINAARI Rahoitushauissa huomioitavaa

Data protection template

DATAN JÄLJET Projekti tutkimusdataan viittaamisen kehittämisestä Suomessa Heidi Laine, projektikoordinaattori, FCRD:in sihteeri

16. Allocation Models

Digitalisoituminen, verkottuminen ja koulutuksen tulevaisuus. Teemu Leinonen Medialaboratorio Taideteollinen korkeakoulu

Tekijyys, hallinta ja tieteellinen meriitti ARJA KUULA-LUUMI KUKA OMISTAA TUTKIMUSDATAN? KESKIVIIKKO KLO TAMPEREEN YLIOPISTO

Olet vastuussa osaamisestasi

VUOSI 2015 / YEAR 2015

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

Travel Getting Around

Guidebook for Multicultural TUT Users

White Rose Research Online & National Fairground Archive

1.3Lohkorakenne muodostetaan käyttämällä a) puolipistettä b) aaltosulkeita c) BEGIN ja END lausekkeita d) sisennystä

Tunnisteet ja viittaukset sähköisessä tutkimusympäristössä. Jessica Parland-von Essen Informaatiotutkimuksen päivät

RANTALA SARI: Sairaanhoitajan eettisten ohjeiden tunnettavuus ja niiden käyttö hoitotyön tukena sisätautien vuodeosastolla

C++11 seminaari, kevät Johannes Koskinen

Palveluportaali Ailan käyttö

ECVETin soveltuvuus suomalaisiin tutkinnon perusteisiin. Case:Yrittäjyyskurssi matkailualan opiskelijoille englantilaisen opettajan toteuttamana

BIOENV Laitoskokous Departmental Meeting

MUSEOT KULTTUURIPALVELUINA

Rotarypiiri 1420 Piiriapurahoista myönnettävät stipendit

VAASAN YLIOPISTO Humanististen tieteiden kandidaatin tutkinto / Filosofian maisterin tutkinto

1.3 Lohkorakenne muodostetaan käyttämällä a) puolipistettä b) aaltosulkeita c) BEGIN ja END lausekkeita d) sisennystä

Ulkomaisten julkaisu- ja viittaustietokantojen hankinta

Matkustaminen Majoittuminen

Microsoft Lync 2010 Attendee

Expression of interest

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

Matkustaminen Majoittuminen

Alueellinen yhteistoiminta

Voice Over LTE (VoLTE) By Miikka Poikselkä;Harri Holma;Jukka Hongisto

Statistical design. Tuomas Selander

F-SECURE TOTAL. Pysy turvassa verkossa. Suojaa yksityisyytesi. Tietoturva ja VPN kaikille laitteille. f-secure.com/total

1. Laitoksen tutkimusstrategia: mitä painotetaan (luettelo, ei yli viisi eri asiaa)

Miten saan käytännössä kaupan käyntiin halutussa. maassa? & Case Intia

4x4cup Rastikuvien tulkinta

Lab SBS3.FARM_Hyper-V - Navigating a SharePoint site

The role of 3dr sector in rural -community based- tourism - potentials, challenges

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

OP1. PreDP StudyPlan

Integration of Finnish web services in WebLicht Presentation in Freudenstadt by Jussi Piitulainen

Elämä on enemmän kuin yksi ilta (Finnish Edition)

Helsinki Region Infoshare 2013

Gap-filling methods for CH 4 data

DATAN JÄLJET Tutkimusdataan viittaamisen kehittäminen Suomessa. Työpaja Pekka Orponen Data-asiain kansalliskomitea

Arkkitehtuuritietoisku. eli mitä aina olet halunnut tietää arkkitehtuureista, muttet ole uskaltanut kysyä

==>Download: Lakimies PDF ebook By Allan Särkilahti

Curriculum. Gym card

Efficiency change over time

Tietoarkiston palvelut. Arja Kuula-Luumi (Tietoarkisto) Tieteelliset lehdet ja tutkimusdata seminaari Tieteiden talo, Helsinki

Aineistonhallinta pähkinänkuoressa METODIFESTARIT TAMPEREEN YLIOPISTO ARJA KUULA-LUUMI

Transkriptio:

Datan jäljet -työpaja Eri sidosryhmien roolit kansallisen dataviittausjärjestelmän kokonaisuudessa Tuomas J. Alaterä

2 Kartoitus data-arkistonäkökulmasta Viittausmallit ovat olleet data-arkistoilla käytössä jo pitkään, viittausohjeet ~2010 alkaen Tietoarkisto 2001 aineistoviite, ohjeet 2010 Tietoarkisto: www.fsd.uta.fi/fi/aineistot/jatkokaytto/viittaaminen.html Gesis: www.gesis.org/angebot/daten-analysieren/weitere-sekundaerdaten/datenservice/forschungsdaten-zitieren/ IASSIST IG: iassistdata.org/sites/default/files/quick_guide_to_data_citation_high-res_printer-ready.pdf Tekijä mainitaan viitteessä nyt ensimmäisenä (meriitti) - Dataviite/avattu data lisää viittauksia julkaisuun» Esim. Pivowar at al 2007, 2013, Pronk 2016 Viite kopioitavissa tutkijan ansioluettelomalliin - Tutkimustyön tieteellinen ja yhteiskunnallinen vaikuttavuus: ansiot tutkimus- ja tietoaineistojen tuottamisessa ja jakamisessa

3 Dataan viittaaminen Tietoarkistossa Aineistojen jatkokäytön ehdot vaativat dataan viittaamista, ei vain hyvä tieteellinen käytäntö Sanktiointi haasteellista, seuranta työlästä Tietoarkiston säilyttämät datat saavat viittaustiedot automaattisesti DDI-kuvailusta Datoilla(?) kuvailuilla(?) landing pageilla(?) on PID FSD3166 Suomalaisen työn tulevaisuus -kirjoituskilpailu 2016-2017 Dufva, Mikko (Teknologian tutkimuskeskus VTT Oy): Suomalaisen työn tulevaisuus - kirjoituskilpailu 2016-2017 [sähköinen tietoaineisto]. Versio 1.0 (2017-04-04). Yhteiskuntatieteellinen tietoarkisto [jakaja]. http://urn.fi/urn:nbn:fi:fsd:t-fsd3166

4 Vertaillaanpa tiekarttaan Data reference should consist of following elements: creator, title, publisher, publication time, identifier. Useful additional elements are also: version, resource type, copyright status. Dufva, Mikko (Teknologian tutkimuskeskus VTT Oy): Suomalaisen työn tulevaisuus -kirjoituskilpailu 2016-2017 [sähköinen tietoaineisto]. Versio 1.0 (2017-04-04). Yhteiskuntatieteellinen tietoarkisto [jakaja]. http://urn.fi/urn:nbn:fi:fsd:t-fsd3166

5 CESSDA ERIC PID-policy (valmistelussa) Velvoittaa data-arkistoja (Suomessa Tietoarkistoa) Ei ristiriitaa tiekarttaan nähden. Taustalla samoja lähteitä, mm. Force11 Suurilta osin samat tavoitteet sekä keinot PIDit, viittausmallit ja riittävä metadata viitettä varten landing pagen sisällössä ehkä hieman eroa ei myöskään vaadi viittausta dataan, ohi landing pagen how to access the data, licensing rules, different versions and provenance, tombstone page

6 CESSDA PID-policyn periaatteet ability to easily locate and access digital resources and then associate them with the related metadata is essential to allow for the citation, retrieval and preservation of those data 1 Identifying (yksiselitteisyys) 2 Locating (perustiedot, saatavuus) 3 Resolving (24/7) 4 Referencing and Citation (viittauksen karkeustaso!) 5 Visibility (data ja sen ristiviittausten maksimointi) 6 Flexibility (muutokset, esim. organisaatiotunnisteet)

7 Dataviittaus data-arkistossa/lle Osoitus siitä, että data on arkistoitu (ja saatavilla tietyin ehdoin) Omaa sellaisenaan sangen vähän toiminnallisuutta PID mainittu suosituksen tärkeimpänä elementtinä Keskeinen rakennuspalikka Huomioitava, ettei pelkästää toimi ihmisluettavana, innostavana viitteenä jatkotiedusteluihin Julkaisijan ja data-arkiston tiedonkulun suunta Kumpi haravoi? Haravoiko jokin kolmas osapuoli?

8 Miksi viittausmalli data-arkistolle tärkeä? Valttikortti, jolla vakuuttaa tutkija arkiston palvelusta A Trusted Digital Repository simply has one, sertifiointi Voidaan yhdistää ja rikastaa tarjottavaa kuvailutietoa Julkaisut, koodi, tutkimusorganisaatiot ja -rahoittajat, aineistoon liittyvät datasetit, versiot, lisenssit Voidaan jakaa (meta)dataa ja seurata datan käyttöä Mahdollistaa tiedon aineiston dearkistointinista Duplikaattien/versioiden tunnistaminen

9 Ajatelkaamme nyt arkiston sidosryhmiä Viittaus edellyttää, että on dataa johon viitata Sidosryhmistä tärkein on siis tutkija/tutkijayhteisö Datan jakamisen palveluita ja porkkana(keppejä) on edelleen kehitettävä ja tuettava Rahoittajien ja tutkimusorganisaatioiden suositukset, koulutus ja niihin vaikuttaminen Viitattu data vaatii pysyvän hoivaketjun (päättäjät) - Rahoitus, jatkuvuus, osaaminen, infrastruktuurivaateet Lainsäädännöllinen kehys - Toimiedellytykset, tietosuojan varmistaminen yms.

10 Data-arkisto ja tutkija Tutkija on arkiston tärkein tiedonlähde Arkisto laatii dataviitteet Arkisto ohjeistaa (aineistonhallintasuunnitelmissa, tietopalveluna, koulutuksena) tuottamaan riittävää metadataa aineistosta Dataa hyödyntävä tutkija sitoutuu käyttöehtoihin/lisensseihin, ml. viittaamiseen Palvelut osana kansallista tutkimusinfrastruktuuria

11 I would share my data but Someone could use it inappropriately No one has made a case that it will affect my academic career It is too much work to compile various parts of the data into a coherent dataset suitable for reuse There are no clear definitions of ownership or usage rights It would be a copyright infringement Someone misinterprets our data and it has a negative impact our group Data security issues regarding identifiers prevent it Data cannot be anonymized or it is too expensive to do, or it becomes useless when anonymized Legal reasons or research ethics code prevents sharing File formats are old or damaged, and there is not enough documentation (metadata) to be sure what to share No one else can understand the data, it is too personal It is old, it doesn t answer to the questions researchers ask today There is no funding to produce a reusable copy of the data No rules or recommendations on which data should be shared Data is classified or a NDA was required by the funder/partner People will criticize my methods. I don't have documentation - only I understand the data My data is something special I can offer my own students. I just don t have the time to fill in all the metadata again As described on IASSIST listserv I spent a lot of money on this research, and it s too valuable to just give away. What if another researcher uses my research for commercial purposes? That s not how my funder wanted this used. Sharing might lead to need to give advice/guidance to those who reuse of the data I promised my IRB/participants I would destroy it when I am done I promised IRB/participants only the research team would see it I promised I would keep data locked in my office I don't want it to be used to reverse social policies my research has been used to support My university holds ownership and won't let me My PI/Collaborators won't share I'm not done with it yet I want to be able to co-author all publications My students need it to complete their theses before release The rights owner is dead so he can t give permission for deposit Data got lost in the mail There is no sharing culture in my field It is not the optimal thing for me as a researcher to do I do not know how or why Repository systems are too complicated to deposit I don t understand the licenses you require

12 Data-arkisto ja yliopisto Tekijyyden määrittely kuka vastaa arkistoinnista? Arkistonti on sopimus mm. säilyttämisvastuusta ja datan välittämisestä --> kuka on sopimusosapuoli? Luvanvaraiset aineistot vaativat luvanantajan Jatkuvuudesta huolehdittava Yliopiston tunnettava laajasti oman alansa viitekehys ja datanhallinnan toimijat

13 Data-arkisto ja rahoittaja Rahoittajan vaatimusten tulisi sisältää ehdottomia viittausvaatimuksia Sisällytettävä aineistonhallintasuunnitelmaan Saatavuudesta sovittava aineistohallintasuunnitelmassa Rahoitus ja tuotos yhdistettävissä tunnistein? Kustantajat myös mukana viittausohjeissa, esim. Elsevier

14 Data-arkisto ja julkaisija Missä vaiheessa data saa tunnisteen? Mahdollista jo hyvin aikaisessa vaiheessa ennen dataa Edistettävä datan ja julkaisun yhdistämistä Datan merkittävyys ja vertaisarviointi? Mikä taho vastaisi tästä? Data-arkisto, tiedeyhteisö? Data tutkimustuotoksena nostaa sen arvoa, mutta arkisto tai rahoittaja ei yksinään voine arvioida datan tieteellistä laatua. Siihen tarvitaan tiedeyhteisöä. Datanjulkaisualustojen jufo-luokitus?!? - I publish in repository X because it is better than Y

15 Data-arkisto ja tieteellinen kirjasto Työnjako: onko kirjasto osa tutkimuslaitosta, jolloin vastuulla olisi enemmän koulutus ja käyttö, kuin arkistointi? Missä on aineistojen jatkokäytön osaaminen ja tuki? Perinteinen data librarianship Erityisesti aineistot, jolla ei ole temaattista palvelukeskittymää

16 Landing page Luonnollinen arkiston ylläpidettäväksi Voi vaatia sopimuksen rekisterinpitäjän (tutkija) kanssa, jos sisältää henkilötietoja Lisenssi, käyttölupaehdot, erityisehdot Keskeiset tietolähteet: Tutkija Mahdollisesti rahoittaja Mahdollisesti organisaatiorekisteri Sanastot (esim. Finto)

17 Lyhyt katsaus suosituksiin All datasets intended for citation must have a globally unique persistent identifier Finnish data repositories should use either DOI or URN as their PID of choice DOI usein nähdään olevan paras ja kaunein, tuottaa jonkin verran työtä olla yhteentoimiva This persistent identifier must resolve to a landing page that supports access to the actual data set. Pääsy voi olla ehdollinen, lisenssi/käyttöehtopohjainen, käyttötarkoitussidonnainen tms. Assigning PIDs and creating landing pages is the responsibility of the data repository Landing page should facilitate access to metadata, either by holding metadata or a link to metadata. http://urn.fi/urn:nbn:fi:fsd:t-fsd3166 The landing page should include reference model for citation, and ideally also metadata helping with discovery, in human-readable and machine-readable format National data centers, libraries and archives should agree on the required metadata content of a data landing page. Kuinka yksityiskohtainen tämän pitäisi olla, mihin sen tulisi pohjautua, ja kuinka sitova sopimuksen tulisi olla? Tietoarkisto linkittää aineistokuvailuun. Eri aineistotyypit eroavat kuvailevan metadatan osalta Entä kv-standardit/suositukset ja yhteentoimivuus Data that no longer exist should have a persistent landing page License all metadata with a CC0 license or equivalent. CC BY käytössä Tietoarkistossa Make metadata freely harvestable through open APIs The persistent identifier must be embedded in the landing page in machine-readable format Pilot the RDA Data Citation model for dynamic data in one or several national data centers. Ei suoraan sovellu Tietoarkiston dataan toistaiseksi. Onko muita malleja? Release all data citation related content intended for broad audiences, in open format, i.e. CC-BY, or equivalent.

18 Lopuksi on sanottava Ehdotetut viittausohjeet ovat hyvin kattavat ja yhdenmukaiset aihepiirin muiden ohjeiden kanssa Syntyykö kansainvälisiä, rinnakkaisia, malleja hyvin pienillä eroilla? Miten tarkkaan määritellään landing page? Kuinka hienojakoisia ovat tutkijan tarpeet dataviittauksissa? Generoituihin osiin viittaaminen? Periaatteista käytäntöön ja yhteentoimivuuden haasteet.

19 Vielä lopun jälkeen todettava Sharing benefits the scientific community, while it maybe is not the most optimal strategy for the individual researcher. (Pronk 2016) Citation benefit may be an answer. Kuinka varmistaa, että viittaukset tutkimustuotoksiin tulevat näkyviksi ja yhdistyvät toisiinsa ja kaikki osapuolet hyötyvät? - Useita avauksia (esim. Scholix) mutta ei määräävää

Kiitos Alaterä, Tuomas J. (Tietoarkisto) : Eri sidosryhmien roolit kansallisen dataviittausjärjestelmän kokonaisuudessa. Datan jäljet -työpaja. [sähköinen tietoaineisto]. Versio 1.0 (2017-10-20). Data-asian kansalliskomitea [jakaja]. CC BY. (PID puuttuu, ehkä hyvä niin) Tuomas J. Alaterä tuomas.alatera@uta.fi orcid.org/0000-0002-3448-3448

21 Mainitut lähteet Pivowar, Heather A. & Day, Roger S. & Fridsma, Douglas B. (2007): Sharing Detailed Research Data Is Associated with Increased Citation Rate. PLoS ONE2(3): e308. https://doi.org/10.1371/journal.pone.0000308 Piwowar, Heather A & Vision, Todd J. (2013): Data Reuse and the Open Data Citation Advantage. PeerJ 1:e175 https://doi.org/10.7717/peerj.175 Pronk, Tessa (2016): A Game Theoretic Analysis of Research Data Sharing. Konferenssiesitys IASSIST 2016, Bergen, Norway. http://iassistdata.org/conferences/2016/presentation/7426 "I would share my data but" -editoitujen sitaattien lähde IASSISTin keskustelulista lokakuu 2017.