ReplicaX työkalu avointen datakopioiden luomiseen
|
|
- Hanna-Mari Ahola
- 9 vuotta sitten
- Katselukertoja:
Transkriptio
1 ReplicaX työkalu avointen datakopioiden luomiseen Juha Karvanen ReplicaX on R-koodina toteutettu menetelmä avoimien datakopioiden tuottamiseen terveystiedosta ja muusta datasta, jota ei sellaisenaan voi julkaista. Marraskuu 2013
2 Johdanto Ihmisten terveydentilaan liittyviä tutkimusainestojen nykyistä laajempi hyödyntäminen edellyttää aineistojen julkaisemista tavalla, joka ei vaaranna tutkimukseen osallistuneiden tietosuojaa. Tietosuojaan ja aineiston hyödyntämiseen liittyvät kysymykset voidaan ratkaista, mikäli käytössä on menetelmä korkeatasoisen kopion luomiseen alkuperäisestä datasta. Tällaisiin datakopioihin kohdistuu kaksi keskeistä vaatimusta: 1. Henkilöiden tunnistaminen ei saa olla millään tavalla mahdollista esimerkiksi iän, sukupuolen, ammatin, koulutustason tai muiden vastaavien muuttujien avulla. 2. Ollakseen hyodyllinen, kopion tulee kaikilta tilastollisilta ominaisuuksiltaan mahdollisimman tarkasti vastata alkuperäistä aineistoa. Tämä vaatimus koskee paitsi jokaisen yksittäisen muuttujan reunajakaumaa (keskiarvo, varianssi, jne), myös muuttujien välisiä riippuvuusrakenteita (esim. Korrelaatiokertoimet).
3 ReplicaX: tekninen toteutus Kilpailutyössä on uusimpaa tilastotieteen tutkimusta hyödyntäen kehitetty yleiskäyttöinen menetelmä datakopioiden luomiseen. Menetelmä sekoittaa yksilöitä identifioivat tiedot mutta säilyttää muuttujien reunajakaumat ja riippuvuusrakenteen. Algoritmi hoitaa jatkuvien muuttujien reunajakaumien mallintamisen automaattisesti käyttäen parametristen mallien ja ydinestimoinnin yhdistelmää. Diskreeteille muuttujille käytetään menettelyä, jossa uusia havaintoja generoidaan naapurihavaintojen arvoja sekoittamalla. Menetelmä on toteutettu R-koodina ja se on vapaasti saatavilla osoitteestahttp://
4 Esimerkki: THL:n MONICA-data Esimerkissä vertaillaan alkuperäistä dataa ja sen pohjalta luotua kopiota eri näkökulmista. Esimerkkiaineistona on käytetty Terveyden hyvinvoinnin laitoksen (THL) julkaisemaa otosta (N=11833) MONICA-datasta. Tietoa WHO:n MONICA-projektista: Linkki esimerkissä käytettyyn dataan Datan dokumentaatio: Datasta on esimerkkiä varten poimittu muuttujat: MARIT siviilisääty (diskreetti muuttuja) EDLEVEL koulutustaso (diskreetti muuttuja) SCHOOL koulutusvuodet (diskreetti muuttuja) HEIGHT pituus (jatkuva muuttuja) WEIGHT paino (jatkuva muuttuja) WAIST vyötärön ympärys (jatkuva muuttuja) HIP lantion ympärys (jatkuva muuttuja)
5 Esimerkkirivejä datasta ja kopiosta Alkuperäisessä datassa on 8 henkilöä, joiden siviilisäädyksi on merkitty 5 (muu): MARIT EDLEVEL SCHOOL HEIGHT WEIGHT WAIST HIP NA NA NA NA NA NA NA NA Vastaavat rivit kopiossa eivät ole tunnistettavissa: MARIT EDLEVEL SCHOOL HEIGHT WEIGHT WAIST HIP NA NA NA NA NA NA NA NA
6 Siviilisäädyn ja koulutustason ristiintaulukointi Alkuperäinen data: EDLEVEL MARIT Kopiossa kaikkein pienimmät frekvenssit karsiutuvat pois: EDLEVEL MARIT
7 Paino siviilisäädyn mukaan Alkuperäinen data: Kopio: MARIT N keskiarvo keskivirhe MARIT N keskiarvo keskivirhe
8 Riippuvuusrakenteet säilyvät: Korrelaatiomatriisit Korrelaatiomatriisi, alkuperäinen data: Korrelaatiomatriisi, kopio: HEIGHT WEIGHT WAIST HIP HEIGHT WEIGHT WAIST HIP HEIGHT WEIGHT WAIST HIP HEIGHT WEIGHT WAIST HIP
9 Yhteenveto MONICA-esimerkistä Esimerkkidatan tapauksessa menetelmä vaikuttaa toimivan hyvin: yksilöt eivät ole tunnistettavissa mutta reunajakaumat ja riippuvuusrakenteet vastaavat alkuperäistä dataa. Menetelmä on helppokäyttöinen, koska käyttäjän ei tarvitse tehdä mallinuspäätöksiä. Kyseessä on kuitenkin asiantuntijan työkalu: käyttäjän tulee aina huolellisesti tarkastaa kopiodatan laatu ennen sen julkaisemista.
10 Jatkokehitys Laajempi testaus erilaisilla datoilla. Koodin kehittäminen ja dokumentoinnin parantaminen. Tavoitteena on julkaista koodi R-pakettina CRAN-arkistossa. Projektia on myös mahdollista jatkaa tieteellisen julkaisun suuntaan. Tällöin keskeistä on menetelmän täsmällinen kuvaaminen ja vertailut R-paketeissa sdcmicro ja simpopulation esitettyjen menetelmien kanssa.
Menetelmät tietosuojan toteutumisen tukena - käytännön esimerkkejä. Tilastoaineistot tutkijan työvälineenä - mahdollisuudet ja rajat 2.3.
Menetelmät tietosuojan toteutumisen tukena - käytännön esimerkkejä Tilastoaineistot tutkijan työvälineenä - mahdollisuudet ja rajat 2.3.2009 Tietosuoja - lähtökohdat! Periaatteena on estää yksiköiden suora
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
LisätiedotHarjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..
Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. TEHTÄVÄ 1 Taulukko 1 Kuvailevat tunnusluvut pääkaupunkiseudun terveystutkimuksesta vuonna 2007 (n=941) Keskiarvo (keskihajonta) Ikä
LisätiedotLiikehavaintojen estimointi langattomissa lähiverkoissa. Diplomityöseminaari Jukka Ahola
Liikehavaintojen estimointi langattomissa lähiverkoissa Diplomityöseminaari Jukka Ahola ESITYKSEN SISÄLTÖ Työn tausta Tavoitteen asettelu Johdanto Liikehavaintojen jakaminen langattomassa mesh-verkossa
LisätiedotSisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
Lisätiedotb6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.
806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564. POIKKEAVAN HAVAINNON VAIKUTUS PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla
LisätiedotLectio praecursoria. Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin. Markus Ojala. 12.
Lectio praecursoria Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin Markus Ojala 12. marraskuuta 2011 Käsitteet Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden
LisätiedotMetsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3
Lisätiedot1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotTeema 5: Ristiintaulukointi
Teema 5: Ristiintaulukointi Kahden (tai useamman) muuttujan ristiintaulukointi: aineiston analysoinnin ja tulosten esittämisen perusmenetelmä usein samat tiedot esitetään sekä taulukkona että kuvana mahdollisen
LisätiedotSuomalaisten mielipiteet alkoholipolitiikasta Suomalaisten mielipiteet alkoholipolitiikasta
Suomalaisten mielipiteet alkoholipolitiikasta 1 1 Tutkimuksen taustaa Suomalaisten alkoholipoliittisia mielipiteitä selvittävä mielipidekysely toteutettiin tammikuussa 1. Tutkimuksen toteutti Kantar TNS
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden
LisätiedotSote-tuloksellisuusmittarointia
Sote-tuloksellisuusmittarointia Vaikuttavuus- ja kustannustieto-alaryhmän kuulumisia Etäesitys Seinäjoelle 8.4.2016 EPSOTE-taustatietotyöryhmän kokous Sote- ja aluehallintouudistuksen valmisteluorganisaatio
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotHirsitaloasukkaiden terveys ja
Hirsitaloasukkaiden terveys ja tyytyväisyys y Altti-tutkimukseen perustuva selvitys Fil. yo. Mira Anttila, FM Maria Pekkonen, Dos. Ulla Haverinen-Shaughnessy Asumisterveyden ja rakennusten terveellisyyden
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotTALTIONI BIOPANKKITALLETTAJAN VERKKOPANKKI
TALTIONI BIOPANKKITALLETTAJAN VERKKOPANKKI Biopankkitoiminnan tavoitteet ja periaatteet Edistää lääketieteellistä tutkimusta ja tuotekehitystä sekä toimia henkilökohtaisen lääketieteen veturina Turvata
LisätiedotEpävarmuuden hallinta bootstrap-menetelmillä
1/17 Epävarmuuden hallinta bootstrap-menetelmillä Esimerkkinä taloudellinen arviointi Jaakko Nevalainen Tampereen yliopisto Metodifestivaalit 2015 2/17 Sisältö 1 Johdanto 2 Tavanomainen bootstrap Bootstrap-menettelyn
LisätiedotNeuvolan asiakastyytyväisyyskyselyn tulokset toiminnan kehittämisen perustana
Neuvolan asiakastyytyväisyyskyselyn tulokset toiminnan kehittämisen perustana Salla Sainio, kehittämispäällikkö, THL Eija Luoto, projektipäällikkö, THL Kansalliset asiakaspalautekyselyt Mitä ovat kansalliset
LisätiedotMaakunnan tiedolla johtaminen ja tietoaltaan hyödyntäminen Jyrki Tirkkonen Liiketoimintapäällikkö, Tiedolla johtaminen ja informaation hallinta
Maakunnan tiedolla johtaminen ja tietoaltaan hyödyntäminen Jyrki Tirkkonen Liiketoimintapäällikkö, Tiedolla johtaminen ja informaation hallinta Jari Uotila Johtava konsultti, Uudet liiketoiminnot Istekki
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas RIIPPUVUUS ALARYHMISSÄ Riippuvuus saattaa olla erilaista jos samassa aineistossa on esim. tutkittavia molemmista sukupuolista Yhteys saattaa olla erilaista
LisätiedotAvoimen tieteen osaajakoulutus Työpaja: Avoin tiede ja tietohallinto 14.9.2015
Avoimen tieteen osaajakoulutus Työpaja: Avoin tiede ja tietohallinto 14.9.2015 Johdanto aiheeseen Mitä on avoin tiede? Avoimen tieteen ja tutkimuksen prosessi Palvelut ja tietojärjestelmät Esimerkkejä
LisätiedotGeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotLASTEN KUULEMINEN VAHVISTUU LASTENSUOJELUSSA
LASTEN KUULEMINEN VAHVISTUU LASTENSUOJELUSSA Tarja Heino Tutkimusprofessori, THL 14.2.2019 Esityksen nimi / Tekijä 1 LAPEN AIKANA TOTEUTETTU Maakunnallisisssa hankkeissa on ollut vahvasti esillä lasten
LisätiedotWebropol-kyselyt. Tarja Heikkilä
Webropol-kyselyt Tarja Heikkilä Internet-kyselyt Soveltuvat kyselyihin, joissa kaikilla perusjoukon jäsenillä on mahdollisuus internetin käyttöön, toisin sanoen on mahdollisuus edustavan aineiston saamiseen.
LisätiedotMittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.
1/11 4 MITTAAMINEN Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. Mittausvirhettä johtuen mittarin tarkkuudesta tai häiriötekijöistä Mittarin
LisätiedotOsakesalkun optimointi. Anni Halkola Turun yliopisto 2016
Osakesalkun optimointi Anni Halkola Turun yliopisto 2016 Artikkeli Gleb Beliakov & Adil Bagirov (2006) Non-smooth optimization methods for computation of the Conditional Value-at-risk and portfolio optimization.
Lisätiedot1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman
LisätiedotAINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA
AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA Tietosuojavastaava Jarkko Reittu 13.11.2018 Aineiston jakamisen myyteistä ja haasteista/jarkko Reittu 1 ESITYKSEN KOHDE Kuinka tietosuojalainsäädäntö rajoittaa
LisätiedotMTTTP1, luento KERTAUSTA
26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotPeruspalvelujen kustannukset ja vaikuttavuus
Peruspalvelujen kustannukset ja vaikuttavuus Ismo Linnosmaa, THL/CHESS, ismo.linnosmaa@thl.fi Jutta Järvelin THL/CHESS, jutta.jarvelin@thl.fi Unto Häkkinen THL/CHESS, unto.hakkinen@thl.fi 1 Teemat I. CHESS:n
LisätiedotImetys Suomessa Vauvamyönteisyysohjelma
Imetys Suomessa Vauvamyönteisyysohjelma 2017-2021 Imetys 10 kunnassa Jyväskylä 16.3.2017 Vieraileva tutkija Kirsi Otronen 21.03.2017 Kirsi Otronen 1 WHO:n uusi suositus v.2025 mennessä 50% lapsista olisi
LisätiedotMTTTP1, luento KERTAUSTA
25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotKURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun
LisätiedotYLEISKUVA - Kysymykset
INSIGHT Käyttöopas YLEISKUVA - Kysymykset 1. Insight - analysointityökalun käytön mahdollistamiseksi täytyy kyselyn raportti avata Beta - raportointityökalulla 1. Klikkaa Insight välilehteä raportilla
LisätiedotHenkilö, johon asiakas voi ottaa yhteyttä henkilötietojen käsittelyä koskevissa asioissa.
Laatimispäivä: 1/2015 Tämä on tietosuojaseloste, joka sisältää rekisteriselosteen ja asiakkaiden henkilötietojen käsittelyä koskevan informoinnin. 1. Toiminnasta vastaava rekisterinpitäjä Katuosoite: Kuopion
LisätiedotTeema 3: Tilastollisia kuvia ja tunnuslukuja
Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin
LisätiedotAvoin lähdekoodi hankinnoissa Juha Yrjölä
Avoin lähdekoodi hankinnoissa 9.6.2016 Juha Yrjölä Mitä on avoin lähdekoodi? 1. Lähdekoodi tulee jakaa ohjelmiston mukana tai antaa saataville joko ilmaiseksi tai korkeintaan luovuttamiskulujen hinnalla.
LisätiedotOpen Arctic Challenge - kilpailu. Anna Keskitalo Data-asiantuntija 6Aika - Avoin data ja rajapinnat
Open Arctic Challenge - kilpailu Anna Keskitalo Data-asiantuntija 6Aika - Avoin data ja rajapinnat www.ouka.fi/oac Idea Digitaalisen avoimuuden innovaatiokilpailu Pohjois-Pohjanmaan ja Pohjois-Suomen alueella.
LisätiedotEsimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
LisätiedotTarkista vielä ennen analysoinnin aloittamista seuraavat seikat:
Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotJulkICT Lab ja Dataportaali Avoin data ja palvelukokeilut
JulkICT Lab ja Dataportaali Avoin data ja palvelukokeilut Pelvelukehityksen ekosysteemi julkisessa hallinnossa 3.12.2013 Mikael Vakkari JulkICT/YRO Palvelukehittämisen ekosysteemi Uusien palveluinnovaatioiden
LisätiedotKADA (Drupal 7) migraatio uuteen (versioon) webiin
KADA (Drupal 7) migraatio uuteen (versioon) webiin Hallittu elinkaaren siirto suoran migraation sijaan Mikko Malmgren & Antti Tuppurainen Mikko Malmgren / Kuntaliitto Antti Tuppurainen / Industry62 @mikko_malmgren
LisätiedotData käyttöön! Ministeriön datapolitiikka osana työ- ja elinkeinopolitiikkaa 18.3.2014
Data käyttöön! Ministeriön datapolitiikka osana työ- ja elinkeinopolitiikkaa 18.3.2014 Antti Eskola Kaupallinen neuvos Innovaatiopolitiikan ryhmä Työ- ja elinkeinoministeriö Data käyttöön mutta mikä data?
LisätiedotVaikuttamisindeksi
Ohjeita viidensien mikroharjoitusten (vk 8) tekemiseksi omatoimisesti: 1. 2 7 12 17 27 32 Vaikuttamisindeksi Käynnistä Tixel-ohjelma työpöydän kuvakkeella, paina Enable Content, avaa ADD-INS, valitse Tixel8-valikosta
LisätiedotHenkilötietosuojattu data
Henkilötietosuojattu data Päivi Timonen Johtaja Kuluttajatutkimuskeskus Valtiotieteellinen tiedekunta / Päivi Timonen/ henkilötietosuojattu data www.helsinki.fi/yliopisto 7.2.2017 1 Lähtökohtana henkilöt
LisätiedotYleinen sosiaali- ja terveystieto sekä avuntarpeen itsearviointimenetelmät -projekti
Yleinen sosiaali- ja terveystieto sekä avuntarpeen itsearviointimenetelmät -projekti SADe-ohjelman sosiaali- ja palvelukokonaisuuden kevätseminaari 23.4.2013 Anu Suurnäkki 19.4.2013 1 Mitä kehitetään ja
LisätiedotJulkaisuportaali ja yliopistojen julkaisutiedot
Julkaisuportaali ja yliopistojen julkaisutiedot Kotimaiset tieteelliset artikkelit näkyviksi!, Helsinki 25.4.2013 Jyrki Ilva (jyrki.ilva@helsinki.fi) Mihin erillistä julkaisuportaalia tarvitaan? Julkaisuportaali
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
LisätiedotOmahoitopolut.fi Toteutuksen tilannekatsaus
Omahoitopolut.fi Toteutuksen tilannekatsaus PVM 1 Sisällysluettelo Aikataulu ja saavutukset tähän mennessä Aikataulu, seuraavaksi toteutettavat tehtävät Budjetti Kertynyt työmäärä suhteessa suunniteltuun
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
Lisätiedotehoks: tietomalli ja rajapinta
ehoks: tietomalli ja rajapinta webinaari koulutuksen järjestäjien järjestelmävastaaville ja järjestelmätoimittajille 19.12.2018 Paula Borkowski/Opetushallitus ehoks kokoaa opiskelijan henkilökohtaisen
LisätiedotLuentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012
Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko
LisätiedotTilastomenetelmien lopputyö
Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien
LisätiedotMäärällisen aineiston esittämistapoja. Aki Taanila
Määrällisen aineiston esittämistapoja Aki Taanila 24.4.2017 1 Kategoriset muuttujat Lukumääriä Prosentteja (muista n-arvot) Pylväitä 2 Yhteenvetotaulukko (frekvenssitaulukko) TAULUKKO 1. Asunnon tyyppi
LisätiedotHannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164
86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna
LisätiedotText Mining. Käyttöopas
Text Mining Käyttöopas Webropol Analytics: Text Mining Mitä tarkoittaa kun asiakkaat tai henkilöstö antavat arvosanan 3.1 Keskiarvoa informatiivisempaa ovat taustalla olevat syyt Onko sinulla aikaa lukea
LisätiedotJäsenrekisteri tietosuoja-asetus ja henkilötietolaki
Jäsenrekisteri tietosuoja-asetus ja henkilötietolaki Miten hoidamme yhdistyksen henkilötietoasiat lain mukaiselle tasolle? Merja Kaija, kyläasiamies Pohjois-Savon Kylät ry Tietosuoja-asiat kuntoon ja jäsenrekisterit
LisätiedotErityisnäytteenotto, esimerkkinä Fineli
Erityisnäytteenotto, esimerkkinä Fineli Näytteenottokoulutus 19. 20.11.2016 Mikä on Fineli? Elintarvikkeiden koostumustietokanta Terveyden ja hyvinvoinnin laitos (THL) ylläpitää perustettu vuonna 1984
LisätiedotMTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO
8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet
LisätiedotTehokkaiden strategioiden identifiointi vakuutusyhtiön taseesta
MS E2177 Operaatiotutkimuksen projektityöseminaari Väliraportti Tehokkaiden strategioiden identifiointi vakuutusyhtiön taseesta 28.3.2016 Asiakas: Model IT Projektiryhmä: Niko Laakkonen (projektipäällikkö),
LisätiedotAvoimen lähdekoodin karttapalvelu Oskarin hyödyntäminen HSY:ssä. Henna-Kaisa Räsänen HSY paikkatietoseminaari Finlandia-talo
Avoimen lähdekoodin karttapalvelu Oskarin hyödyntäminen HSY:ssä Henna-Kaisa Räsänen HSY paikkatietoseminaari 22.3.2017 Finlandia-talo Avoimen lähdekoodin ohjelmisto paikkatiedon esittämiseen ja monipuoliseen
LisätiedotOppilaiden sisäilmakysely - Tutkimusseloste
Tutkimusseloste 1(10) Oppilaiden sisäilmakysely - Tutkimusseloste Kohde: Ivalon yläaste ja Ivalon lukio sekä vertailukouluna toiminut Inarin koulu Kuopio 29.01.2016 Jussi Lampi Asiantuntijalääkäri jussi.lampi@thl.fi
LisätiedotTIEDOTE HAASTATTELUSTA JA TIETOJEN KERÄÄMISESTÄ
TIEDOTE HAASTATTELUSTA JA TIETOJEN KERÄÄMISESTÄ Kiitos osallistumisestasi Kelan Työhönkuntoutuksen kehittämishankkeen toista vaihetta (TK2) koskevaan arviointitutkimukseen kuluneen vuoden aikana. Tutkimuksessa
LisätiedotS09 04 Kohteiden tunnistaminen 3D datasta
AS 0.3200 Automaatio ja systeemitekniikan projektityöt S09 04 Kohteiden tunnistaminen 3D datasta Loppuraportti 22.5.2009 Akseli Korhonen 1. Projektin esittely Projektin tavoitteena oli algoritmin kehittäminen
Lisätiedot3. Yhteistyöhankkeena tehtävän tutkimuksen osapuolet ja vastuunjako
TIETEELLISEN TUTKIMUKSEN 1(7) Tietoa tutkimukseen osallistuvalle Tässä selosteessa kuvataan, miten henkilötietojasi käsitellään FinTerveys 2017 - tutkimuksessa. 1. Tutkimuksen rekisterinpitäjä Terveyden
LisätiedotAvoin data metsäntutkimuksessa E-P DIGI, , Seinäjoki
Avoin data metsäntutkimuksessa E-P DIGI, 22.3.2017, Seinäjoki Risto Lauhanen, tutkimus- ja kehittämispäällikkö, SeAMK Ruoka. Lisätiedot: risto.lauhanen@seamk.fi Seliina Päällysaho, tutkimuspäällikkö, SeAMK.
LisätiedotTehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.
Tehtävä 1 Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä Ei Hypoteesi ei ole hyvä tutkimushypoteesi, koska se on liian epämääräinen.
LisätiedotA TIETORAKENTEET JA ALGORITMIT
A274105 TIETORAKENTEET JA ALGORITMIT HARJOITUSTEHTÄVÄT 6 DEADLINE 1.4.2009 KLO 9:00 Kynätehtävät tehdään kirjallisesti ja esitetään harjoituksissa. Välivaiheet näkyviin! Ohjelmointitehtävät sähköisesti
LisätiedotKansallinen ASPAtietojärjestelmä
Kansallinen ASPAtietojärjestelmä Taustoitus Järjestäjien tarve yhteiselle asiakaspalautteen keräämisen järjestelmälle nousi esiin kevään selvityksessä Asiakaspalautetieto on myös osa kansallista sote-tietopohjaa
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
LisätiedotYhteentoimivuutta edistävien työkalujen kehittäminen - JulkICTLab jatkohakemus
Yhteentoimivuutta edistävien työkalujen kehittäminen - JulkICTLab jatkohakemus Pilottiehdotuksen osapuolet: CSC Tieteen tietotekniikan keskus Oy Aalto-yliopisto Verohallinto Yhteyshenkilö: Suvi Remes suvi.remes@csc.fi
LisätiedotATH-koulutus THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelma Ositus ja 75 vuotta täyttäneiden ylipoiminta Painokertoimet Tulosten esittäminen: mallivakiointi Esimerkit
Lisätiedot2. Kuvaus tutkimushankkeesta ja henkilötietojen käsittelyn tarkoitus
TIETEELLISEN TUTKIMUKSEN 1(6) Tietoa tutkimukseen osallistuvalle Tässä selosteessa kuvataan, miten henkilötietojasi käsitellään tutkimuksessa. Lähtökohtaisesti tutkimukseen osallistuminen on vapaaehtoista.
LisätiedotPROSESSIMALLI FLEXI: THL:N KOULUTERVEYSKYSELYN TULOSTEN HYÖDYNTÄMINEN OSANA KOULUJEN JA OPPILAITOSTEN ARKEA
PROSESSIMALLI FLEXI: THL:N KOULUTERVEYSKYSELYN TULOSTEN HYÖDYNTÄMINEN OSANA KOULUJEN JA OPPILAITOSTEN ARKEA 1. TULOKSET YHTEISÖLLISELLE OPISKELUHUOLTORYHMÄLLE Rehtori/koulutuspäällikkö tuo koulunsa Kouluterveyskyselyn
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
Lisätiedot1. Kuvaus tutkimushankkeesta ja henkilötietojen käsittelyn tarkoitus
Tietoa tutkimukseen sisältyvistä tiedoista TIETEELLISEN TUTKIMUKSEN 1(6) Tässä selosteessa kuvataan, miten henkilötietoja käsitellään THL:n IMPRO-tutkimuksessa. Tutkimuksen rekisterinpitäjä Terveyden ja
LisätiedotSemanttinen Finlex Arttu Oksanen ( )
Semanttinen Finlex 7.3.2016 Arttu Oksanen ( arttu.oksanen@aalto.fi ) Taustaa Lainsäädäntö ja oikeuskäytäntö julkaistu aiemmin ihmisluettavina dokumentteina Finlexpalvelussa Data ei kuitenkaan ole ollut
LisätiedotISOISÄNSILTA URAKAN TIETOMALLIVAATIMUKSET, -BONUKSET JA -SANKTIOT BONUS- JA SANKTIOJÄRJESTELMÄ,
ISOISÄNSILTA URAKAN TIETOMALLIVAATIMUKSET, -BONUKSET JA -SANKTIOT BONUS- JA SANKTIOJÄRJESTELMÄ, 2.10.2013 HELSINGIN KAUPUNKI Yleistä Nämä tietomallivaatimukset, -bonukset ja -sanktiot koskevat Isoisänsiltaa
LisätiedotAvoimen tieteen palvelut
Avoimen tieteen palvelut Ville Tenhunen 26.11.2015 2015 OKM ATT 2014 2017 -hanke www.avointiede.fi Lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -käyttöluvalla Agenda Mihin palveluita tarvitaan?
Lisätiedot11. laskuharjoituskierros, vko 15, ratkaisut
11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa
Lisätiedot- ALMA - Asumisen ja hyvinvoinnin alueelliset palvelumallit bes.tkk.fi
- ALMA - Asumisen ja hyvinvoinnin alueelliset palvelumallit Tieteiden talo 18.5.2010 Arto Huuskonen, DI TUTKIMUKSEN TAUSTATEKIJÄT Väestö ikääntyy ja palvelutarpeet muuttuvat Ikääntyvä väestö viettää enemmän
LisätiedotSNOMED CT KANSALLINEN JAKELUKESKUS (NRC) JA KANSALLISET KÄYTTÖKOHTEET
SNOMED CT KANSALLINEN JAKELUKESKUS (NRC) JA KANSALLISET KÄYTTÖKOHTEET Mikko Härkönen, Juha Mykkänen THL OPER 26.4.2019 1 SNOMED CT NRC FINLAND SNOMED CT on laajin käytössä oleva kansainvälinen terveydenhuollon
LisätiedotAlgebralliset menetelmät virheenkorjauskoodin tunnistamisessa
Algebralliset menetelmät virheenkorjauskoodin tunnistamisessa Jyrki Lahtonen, Anni Hakanen, Taneli Lehtilä, Toni Hotanen, Teemu Pirttimäki, Antti Peltola Turun yliopisto MATINE-tutkimusseminaari, 16.11.2017
LisätiedotPotilas -ja asiakastietojärjestelmien vaatimukset ja valvonta Ammattimainen käyttäjä laiteturvallisuuden varmistajana
Potilas -ja asiakastietojärjestelmien vaatimukset ja valvonta Ammattimainen käyttäjä laiteturvallisuuden varmistajana 26.5.2016 Yli-insinööri Antti Härkönen, Valvira Tietojärjestelmien valvonta Terveysteknologia-ryhmä
LisätiedotRakenteinen tieto ja asiakastietojärjestelmä sosiaalityön pakotettu muutos
Rakenteinen tieto ja asiakastietojärjestelmä sosiaalityön pakotettu muutos Sosiaalihuollon asiakastiedot ja niiden hyödyntäminen Sosiaalityön tutkimuksen päivät Helsingissä 2017 Erikoistutkija Paula Saikkonen,
LisätiedotMATEMAATTIS- LUONNONTIETEELLINEN OSAAMINEN
MATEMAATTIS- LUONNONTIETEELLINEN OSAAMINEN Matematiikka ja matematiikan soveltaminen, 4 osp Pakollinen tutkinnon osa osaa tehdä peruslaskutoimitukset, toteuttaa mittayksiköiden muunnokset ja soveltaa talousmatematiikkaa
Lisätiedot