Tutkimustiedonhallinnan peruskurssi

Samankaltaiset tiedostot
Tutkimustiedonhallinnan peruskurssi

Tietokannan hallinta. Kevät 2004 Jan Lindström R&G Chapter 1

HELIA 1 (17) Outi Virkki Tiedonhallinta

Tietokantojen suunnittelu, relaatiokantojen perusteita

On autoja, henkilöitä, Henkilöllä on nimi Autolla on omistaja, joka on henkilö. Taulu AUTO(rekno, malli) Taulu HENKILO(nimi, )

Helsingin yliopisto/tktl DO Tietokantojen perusteet, s 2000 Relaatiomallin peruskäsitteet Harri Laine 1. Relaatiotietokannat DONOTP

POLKU LUOKKAKAAVIOISTA TAULUJEN TOTEUTUKSEEN

Jouni Huotari & Ari Hovi. Käsitemallinnuksesta relaatiokantaan KÄSITEMALLI. LOOGINEN MALLI: tietomalli valittu. FYYSINEN MALLI: DBMS valittu

Tietokantojen perusteet k2004helsingin yliopisto/tktl Tietokantojen perusteet, s 2005 relaatiomalli Harri Laine 1.

Tietomallit. Näkökulmat tietoon. Näkökulmat tietoon. Mitä malleja olisi tarjolla? Abstraktiotasot tiedon käsittelyssä

Työkalujen merkitys mittaamisessa

Helsingin yliopisto/tktl DO Tietokantojen perusteet, s 2000 Johdanto & yleistä Harri Laine 1. Tietokanta. Tiedosto

Ohjelmistojen mallintamisen ja tietokantojen perusteiden yhteys

Tutkimustiedonhallinnan peruskurssi

Relaatiotietokantojen perusteista. Harri Laine Helsingin yliopisto

Tietomallit. Näkökulmat tietoon. Näkökulmat tietoon. Näkökulmat tietoon. Abstraktiotasot tiedon käsittelyssä

Tietokannan suunnittelu

Tenttikysymykset. + UML-kaavioiden mallintamistehtävät

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Helsingin yliopisto/tktl Tietokantojen perusteet, k 2003 Relaatiomallin peruskäsitteet Harri Laine 1. Tietomallit. Näkökulmat tietoon

Helsingin yliopisto/tktl Tietokantojen perusteet, s 2006 Tiedon mallinnus ja tietokannat. Harri Laine 1. Tietokanta.

jotakin käyttötarkoitusta varten laadittu kokoelma toisiinsa liittyviä säilytettäviä tietoja

TIEDONHALLINTA - SYKSY Luento 2. Pasi Ranne /8/17 Helsinki Metropolia University of Applied Sciences

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tietokanta (database)

HAAGA-HELIA TIKO-05 1 (19) ICT23a Tietokannan suunnittelu ja toteutus O.Virkki

millainen on se kohde, jota tiedoilla pitäisi kuvata asiat, joita pitäisi esittää Mitä tietoelementtien arvot tarkoittavat

Paikkatiedon mallinnus Dokumentoinnin ymmärtäminen. Lassi Lehto

Tietokannan hallintajärjestelmän (DBMS) palvelut ja rakenne

Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia.

TIEDONHALLINTA - SYKSY Luento 7. Pasi Ranne /10/17 Helsinki Metropolia University of Applied Sciences

HELIA 1 (8) Outi Virkki Tietokantasuunnittelu

Luento 3 Tietokannan tietosisällön suunnittelu

Jokaisella tiedostolla on otsake (header), joka sisältää tiedostoon liittyvää hallintatietoa

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Esimerkkiprojekti. Mallivastauksen löydät Wroxin www-sivuilta. Kenttä Tyyppi Max.pituus Rajoitukset/Kommentit

HAAGA-HELIA heti09 1 (27) ICT05 Tiedonhallinta ja tietokannat O.Virkki Relaatiomalli

TIEDONHALLINNAN PERUSTEET - SYKSY 2013

2. Käsiteanalyysi ja relaatiomalli

HELIA 1 (11) Outi Virkki Tiedonhallinta

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Projektinhallintaa paikkatiedon avulla

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

LAS- ja ilmakuva-aineistojen käsittely ArcGIS:ssä

HELIA 1 (20) Outi Virkki Tiedonhallinta

HELIA 1 (14) Outi Virkki Käyttöliittymät ja ohjlmiston suunnittelu

HELIA 1 (12) Outi Virkki Tiedonhallinta

TIETOKANNAT JOHDANTO

Luento 2: Tiedostot ja tiedon varastointi

Tiedostorakenteet. R&G Chapter Tietokannan hallinta, kevät 2006, Jan 1

Tietorakenteet ja algoritmit - syksy

Helsingin yliopisto, TKTL Tietokantojen perusteet, k 2000 Tietokannan suunnittelusta Harri Laine 1

Relaatiomalli ja -tietokanta

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

Tieto- ja tallennusrakenteet

Interfacing Product Data Management System

Tietokannanhallintajärjestelmä (DBMS)

private TreeMap<String, Opiskelija> nimella; private TreeMap<String, Opiskelija> numerolla;

Tenttikysymykset. + UML- kaavioiden mallintamistehtävät

Ohjelmistojen mallintaminen, kesä 2010

D B. Tietokannan hallinta - kurssin tavoite. Kurssilla opitaan periaatteet. Edellytyksenä osallistumiselle on Tietokantojen perusteiden hallinta

Ohjelmistojen suunnittelu

MONISTE 2 Kirjoittanut Elina Katainen

Johdanto. Kiinteistöhuoltoyhtiö tarvitsee järjestelmän huoltopyyntöjen hallinnointiin

HELIA TIKO-05 1 (28) ICT03D Tieto ja tiedon varastointi O.Virkki

Hakemistojen sisällöt säilötään linkitetyille listalle.

TIEDONHALLINTA - SYKSY Luento 11. Hannu Markkanen /10/12 Helsinki Metropolia University of Applied Sciences

Paikkatiedot ja Web-standardit

Tietokantajärjestelmien tulevaisuuden haasteet. Jan Lindström

Tietojärjestelmä tuotantoympäristössä. Sovellusohjelmat Helsingin ammattikorkeakoulu Stadia / Tekniikka ja liikenne Vesa Ollikainen

TIETOKANTOJEN PERUSTEET MARKKU SUNI

IHTE-1900 Seittiviestintä

IHTE-1900 Seittiviestintä

Sokkelon sisältö säilötään linkitetyille listalle ja tekstitiedostoon. Työ tehdään itsenäisesti yhden hengen ryhmissä. Ideoita voi vaihtaa koodia ei.

Testausraportti. Orava. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Tietokantakurssit / TKTL

HELIA 1 (21) Outi Virkki Tietokantasuunnittelu

Ohjelmistojen mallintaminen luokkamallin lisäpiirteitä

Paikkatiedon hyödyntäminen vesiensuojeluyhdistyksissä

Opettajana Mika Sorsa, HAMK:n ammatillisen opettajakoulutuksen opetusharjoittelija

Kansallinen koodistojen siirtoformaatti

Helsingin yliopisto/tktl Kyselykielet, s 2006 Optimointi Harri Laine 1. Kyselyn optimointi. Kyselyn optimointi

v 1 v 2 v 3 v 4 d lapsisolmua d 1 avainta lapsen v i alipuun avaimet k i 1 ja k i k 0 =, k d = Sisäsolmuissa vähint. yksi avain vähint.

HELIA 1 (21) Outi Virkki Tietokantasuunnittelu

HELIA 1 (19) Outi Virkki Tietokantasuunnittelu

JAVA-PERUSTEET. JAVA-OHJELMOINTI 3op A JAVAN PERUSTEET LYHYT KERTAUS JAVAN OMINAISUUKSISTA JAVAN OMINAISUUKSIA. Java vs. C++?

Työ tehdään itsenäisesti yhden hengen ryhmissä. Ideoita voi vaihtaa koodia ei.

Sisällys. JAVA-OHJELMOINTI Osa 7: Abstrakti luokka ja rajapinta. Abstraktin luokan idea. Abstrakti luokka ja metodi. Esimerkki

Uudelleenkäytön jako kahteen

Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia.

Ohjelmoinnin perusteet Y Python

UML-kielen formalisointi Object-Z:lla

4.2 Yhteensopivuus roolimalleihin perustuvassa palvelussa

Järjestelmäarkkitehtuuri (TK081702) Hajautettu tietokanta. Hajautuksen hyötyjä

SÄHKE-hanke. Abstrakti mallintaminen Tietomallin (graafi) lukuohje

Kehitysohje. ETL-työkalu. ExtraTerrestriaLs / Aureolis Oy

Algoritmit 1. Luento 3 Ti Timo Männikkö

Käyttöliittymäsuunnitelma MAITO Metadatan Analyysi-, Integraatio- ja Transformaatio-Ohjelmisto

KDK: Finna ja pitkäaikaissäilytys

Ohjelmistojen mallintaminen, kesä 2009

Transkriptio:

Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi 1/221 Kevät 2004

Metadata Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 178/221 Kevät 2004

Metadata: osan sisältö Mitä metadata on? Mihin sitä tarvitaan? Mitä vaikutusta metadatalla on tutkimustiedonhallinnan ratkaisuihin? Lähde: Z. Michalewicz (toim.): Statistical and Scientific Databases; luku 4 Esimerkkisovellus: Pubudu Wariyapola et al.: Ontology and Metadata Creation for the Poseidon Distributed Coastal Zone Management System, Advances in Digital Libraries, 1999, 180 189. Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 179/221 Kevät 2004

Mitä metadatalla tarkoitetaan? Metadata on tietoa, jota tarvitaan datan (raaka- ja analysoidun) hakemiseen, käsittelemiseen, jäsentämiseen, tulkitsemiseen Metadatan keruu ja talletus on välttämätöntä muuten varsinainen data ei ole käyttökelpoista! tavoittena varsinaisen datan ymmärrettävyys, käytettävyys, ylläpidettävyys muillekin ja myöhemminkin + tutkimuksen toistettavuus Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 180/221 Kevät 2004

Tutkimuksen metadataa raakadatan tuottaminen ja kerääminen tutkimus- tai koejärjestelyt datan keruun tai mittausprosessin kuvaus kuka, missä, milloin? datan jalostus ja analyysi suoritetut muunnokset, suodatukset, korjaukset muunnosten yms. perustelut tehdyt analyysit, niiden parametrit sovelletut menetelmät ja työkalut Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 181/221 Kevät 2004

tutkimustulosten käyttöohjeet opastusta tiedon ymmärtämiseen, lisätiedon hankkimiseen tulkinnassa käytetyt mallit ja otokset viittauksia ulkoisiin artikkeleihin, taksonomioihin, standardeihin sovellusaluekohtainen osaaminen ei välttämättä käytettävissä koneellisesti äärimmillään koko tutkimushistoria rekonstruoitavissa Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 182/221 Kevät 2004

Metadataa on myös... tiedon fyysinen rakenne tiedostojen nimet ja formaatit, tietotyypit tiedon looginen rakenne tietoalkioiden nimet ja attribuutit mahdolliset operaatiot Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 183/221 Kevät 2004

I: Ohjaava metadata käsittelijöinä tietokannan ja järjestelmän operaatiot sovellusten välisen tiedonsiirron rajapinnat määrämuotoinen esitystapa ohjaavan metadatan käyttö suositeltavaa laadun varmistus tiedon eheys sekä raakadatan että käsitellyn datan laatu automatisointi, kustannusten ja resurssien säästö Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 184/221 Kevät 2004

: Opastava metadata@ käsittelijöinä ihmiset etsintä; selailu esitys luonnollisella kielellä, kuvina opastava metadata on välttämätönt datan ymmärtäminen rajapinta tiedon tuottajan ja käy Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 185/221 Kevät 2004

Mistä tutkimustieto koostuu mikrodata eli raakadata: havainnot simuloinnin tulokset makrodata eli analysoitu data = käsittelyn tuloksena syntynyt data periaatteessa konstruoitavissa uudelleen, mutta voi olla työlästä käsittely voi kohdistua raakadataan tai jo analysoituun dataan: esim. yhteenvedot metadata Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 186/221 Kevät 2004

Tutkimustiedon ominaisuuksia Raakadata: havaintoja tai simulointituloksia havaintojen säännöllisyys: havaintoja tehdään usein jonkin (aikaan tai paikkaan liittyvän) säännön mukaan koordinaattien talletus? havaintojen tiheys: hylätyt arvot (mittaustarkkuus) havaintotiedon tiivistys Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 187/221 Kevät 2004

ajan vaikutus koordinaatteihin: havaintopisteiden koordinaatit voivat muuttua ajan funktiona Parametridata: raakadataa kuvaaviin parametreihin liittyy usein luokitteluhierarkioita samat tai eri operaatiot hierarkian eri tasoilla yhteenvedot hierarkian eri tasoilla Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 188/221 Kevät 2004

Datan käsittelyn tasoja raakadata kalibroitu data tarkistettu data johdettu data tulkinta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 189/221 Kevät 2004

Tutkimustiedon rakenne moniulotteisuus monessakin mielessä: kymmeniä tai satoja attribuutteja eri tietojoukoissa voidaan käyttää samoja attribuuttien nimiä (samoista tai samantapaisista käsitteistä) attribuuttien merkitykset (luokittelukriteerit) voivat muuttua ajan kuluessa datajoukosta voi olla useita eri-ikäisiä versioita yhtä aikaa käytössä Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 190/221 Kevät 2004

rakenteellinen monimutkaisuus: alkioiden välillä on monenlaisia (ja monimutkaisia) riippuvuuksia alkio voi sisältää rakenteeltaan ja käsittelytavaltaan erilaisia osia luokitteluhierarkiat erityiset tietotyypit kuten aikasarjat (dataa toistuvista mittauksista) merkkijonot, sekvenssit (esim. DNA) paikkatieto kaaviot, kuvat Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 191/221 Kevät 2004

Metadatatietokanta rakenteeltaan ja käsittelytavaltaan erilaisia tietotyyppejä, kuten tekstiä kaavioita tekstidokumentteja ohjelmia sääntöjä taulukoita viittauksia muihin lähteisiin omat talletustavat ja operaatiot (työvälineet) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 192/221 Kevät 2004

voidaan rakentaa kuten tietokanta parhaimmillaan käsitellään samassa ympäristössä kuin varsinaista dataa tavoitteena on automatisoida metadatan käsittelyä mahdollisia työkaluja myös XML, RDF, ontologiat tietojen vaihdettavuus, yhteiset käsitteistöt Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 193/221 Kevät 2004

Tutkimusmetadatan piirteitä metadata on hyvin monimuotoista metadata muuttuu usein kerätään uudentyyppistä dataa käsitellään kerättyä dataa uusilla tavoilla monimuotoisuus rakenteessa ja käytössä ei keskitettyä auktoriteettia ei kaikenkattavia standardeja vain rajallinen automatisointi datan ja metadatan tuottavat tutkijat tutkijan pitäisi päästä keskittymään sisältöön, ei rakenteeseen Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 194/221 Kevät 2004

Metadata: yhteenveto metadata kuvaa dataa metadata on välttämätöntä datan käsittelemiseksi ja ymmärtämiseksi tutkimustiedon tuottaminen ja jalostaminen: paljon vaihtoehtoja, täsmällisyys tärkeää tarkka ja monipuolinen metadata miten raakadata on tuotettu ja kerätty? miten dataa on käsitelty ja analysoitu? kytkentä tunnettuihin taksonomioihin ja standardeihin Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Metadata 195/221 Kevät 2004

Tiedon mallitus ja talletus Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 196/221 Kevät 2004

Tiedon mallitus: osan sisältö Miten tietoa jäsennetään talletusta varten? Millaiset esitystavat ja talletusrakenteet sopivat erityisesti tutkimustiedolle? Lähde (esim.): Harri Laine: Johdatus sovellussuunnitteluun ja Tietokantojen perusteet (TKTL:n opetusmonisteita) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 197/221 Kevät 2004

Tiedosto kaiken tiedon talletuksen perusta monimutkaisemmat talletusrakenteet toteutetaan (yhden tai useiden) tiedostojen avulla hierarkkinen muistijärjestelmä keskusmuisti: hakuaika X ns levy: X ms cd-pakka: X s käsittelyä varten tieto tuodaan muistiin tehokkuuden kannalta on edullista tuoda tietoa kerralla paljon käsitellä muistissa oleva osa kerralla Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 198/221 Kevät 2004

Järjestämätön peräkkäisrakenne tietueet peräkkäin lisäysjärjestyksessä lisäys aina tiedoston loppuun ei hukkatilaa hyvä ratkaisu jos tarvitaan suurta talletusnopeutta staattista talletusrakennetta (= ei poistoja) tehokasta tilankäyttöä peräkkäiskäsittelyä aina samassa järjestyksessä (tai järjestyksellä ei väliä) tyypillinen talletusrakenne raakatiedon talletuksessa Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 199/221 Kevät 2004

Hakupuut tietueet (tai avaimet) on talletettu puun lehtiin sisäsolmun lapset osittavat sen tietueavaruuden puun pitäminen tasapainossa takaa tehokkuuden joka lehteen yhtä pitkä matka (log m (n)) lukuisia muunnelmia: mm. B-, R-, LSD-, TV-puut erityisiä puurakenteita paikkatiedolle tehokas haku 2 3-ulotteisessa datassa talletuksen lokaalisuus tyypillisten operaatioiden tehokkuus Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 200/221 Kevät 2004

Tietokanta suuren tietomäärän pitkäaikainen säilytys rakenteinen tieto tietoalkioiden väliset suhteet tiedon looginen rakenne tietoon kohdistuvat kyselyt ja operaatiot tiedon samanaikainen käyttö hallintaan liittyviä tehtäviä on siirretty käyttäjältä tietokannan hallintajärjestelmälle Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 201/221 Kevät 2004

Tiedostot vs. tietokanta säilytys: OK? (varmuuskopiointi) rakenteisuus, eheys: käyttäjä hallitsee ja ylläpitää kyselyt ja operaatiot: käyttäjä ohjelmoi ja toteuttaa samanaikainen käyttö: käyttäjät huolehtivat itse Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 202/221 Kevät 2004

Tiedonhallinnan peruskäsitteitä eritasoiset kaaviot (schema) joilla tietokantaa kuvataan käyttäjän näkymä tietokantaan tietokannan looginen sisältö tietokannan talletusrakenteet käyttäjän operaatioita varten tarvitaan määrittelykieli kyselykieli SQL sisältää molemmat komponentit Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 203/221 Kevät 2004

työnjako tietokannan käyttö tietokannan ylläpito tietokannan toteutus lähestymistapoja mallittamiseen relaatiomallit (relaatiot, attribuutit, relaatiokaaviot) oliomallit (oliot, luokat, tyypit) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 204/221 Kevät 2004

Tietokantajärjestelmän osat käyttäjä tietokantaan kohdistuvat kyselyt (kyselykieli ja sovellusohjelmat) tietokannan sisällön muutokset tietokantakaavion muunnokset tietokannan hallintajärjestelmä kyselyiden käsittely tapahtumien käsittely talletusrakenteen käsittely tietojen talletus data + metadata Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 205/221 Kevät 2004

Tietokannan suunnittelun vaiheet 1. laaditaan malli käyttäjän näkökulmasta mitä tietokannassa pitäisi olla miten osat suhtautuvat toisiinsa miten tietokantaa on tarkoitus käyttää käyttäjän käsitteet Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 206/221 Kevät 2004

2. kirjoitetaan malli tietokantajärjestelmän ymmärtämällä kielellä relaatiorakenne, oliorakenne 3. muokataan rakenne tehokkaaksi (normalisointi) toistot pois, turhat rajoitukset pois hakemistot Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 207/221 Kevät 2004

Tietomallin laatiminen reaalimaailman asioita, niiden ominaisuuksia ja suhteita kuvaavat nimet havainnollinen esitystapa: kaaviot, teksti malli koostuu olioista, joihin voi liittyä attribuutteja relaatioita operaatioita (menetelmiä) ominaisuuksiltaan samanlaiset oliot kuuluvat samaan luokkaan Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 208/221 Kevät 2004

terminologia vaihtelee riippuen käytettävästä esitystavasta ER-malli: yksilöt, ominaisuudet,... oliomalli: luokat, oliot, menetelmät,... Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 209/221 Kevät 2004

Attribuutti (ominaisuus) olion ominaisuus, jolla on jokin arvo olioon sisältyvä tieto attribuuttiin liittyy tyyppi (arvojoukko), esim. kokonaisluku merkkijono {punainen, keltainen, vihreä} attribuutti voi olla myös rakenteinen, esim. osoite: katuosoite, postinumero attribuutilla voi olla myös puuttuva arvo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 210/221 Kevät 2004

Relaatio ominaisuus joka liittää olion toiseen olioon olioiden välinen suhde relaatio voi liittää toisiinsa samaan tai eri luokkiin kuuluvia olioita relaatio voi olla yksi yhteen yksi moneen moni moneen Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 211/221 Kevät 2004

Operaatio (menetelmä) toimenpide joka oliolle voidaan tehdä tapa jolla oliota voidaan käsitellä operaatiot liittyvät kiinteästi tiedon käyttötarkoitukseen operaatioiden kytkeminen olioihin on erityisesti oliosuunnitteluun liittyvä piirre olio ja sen operaatiot muodostavat kokonaisuuden olio "näkyy" muille olioille vain operaatioidensa välityksellä Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 212/221 Kevät 2004

Luokkahierarkia periytyminen oliolla voi olla samat ominaisuudet kuin jonkin luokan olioilla, mutta lisäksi joukko erityisominaisuuksia aliluokka aliluokka perii yliluokkansa ominaisuudet attribuutit relaatiot operaatiot luokat muodostavat hierarkian moniperintä: luokalla on monta yliluokkaa ja se perii kaikkien niiden ominaisuudet Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 213/221 Kevät 2004

Avain attribuutti tai joukko attribuutteja avaimen oltava yksikäsitteinen, eli kahden eri olion avaimet eivät voi olla samat avain yksilöi olion usein jokin attribuutti on erityisesti valittu avaimeksi esim. henkilötunnus avaineheys: avaimella ei voi olla puuttuvaa arvoa oliomallissa jokaisella oliolla on yksikäsitteinen identiteetti: oliotunniste (OID) oliomallissa kahden eri olion kaikki attribuutit voivat olla samat Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 214/221 Kevät 2004

Suunnitteluperiaatteita mallin pitää vastata todellisuutta mallin pitää olla (mahdollisimman) yksinkertainen sovellus- ja tapauskohtainen kompromissi minimaalisuus samoja asioita ei pidä toistaa luokkahierarkian hyödyntäminen rajoitukset avaineheys, viite-eheys attribuutin arvojoukkoa koskevat rajoitukset Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 215/221 Kevät 2004

Relaatiomalli relaatiotietokantojen perustana oleva yksinkertaiseen malli kaikki tiedot esitetään taulukkoina (relaatioina) attribuutit = relaatiotaulun sarakkeet relaatiokaavio = taulun otsikkorivi, esim. mittaus(järvi, laji, lkm) relaatiokaaviot muodostavat yhdessä relaatiotietokantakaavion taulun rivi = monikko (tietue): sisältää kutakin attribuuttia vastaavan komponentin, esim. (Tsuolbmajavri, Heterodissocladius maeari, 43) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 216/221 Kevät 2004

kaavion attribuutit esitetään aina samassa järjestyksessä attribuutit ovat yksinkertaisia eivätkä koosteisia relaation monikot muodostavat joukon kaksi eri monikkoa eivät voi olla identtisiä monikoiden käsittely perustuu niiden attribuuttien arvoihin, ei niiden "sijaintiin taulussa" relaatiokaavio määrittelee rakenteen, joka on (yleensä melko) staattinen relaatiotaulun sisältö (= relaation ilmentymä) voi muuttua monikoiden lisäykset, poistot, päivitykset Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 217/221 Kevät 2004

Tietomallista relaatiomalliin olioluokka relaatiotaulu yksinkertainen attribuutti relaatiotaulun attribuutti rakenteinen attribuutti esim. joukko relaatiotaulun attribuutteja olioiden välinen relaatio (yhteys) attribuutti, joka sisältää viitattavan olion avaimen hyvä ratkaisu, jos viitattavia olioita on vain yksi relaatiotaulu, jonka attribuutteina ovat molempien olioiden avaimet hyvä ratkaisu, jos relaatio on monesta moneen Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 218/221 Kevät 2004

Aliluokka relaatiomallissa kutakin aliluokkaa vastaa relaatiotaulu, joka sisältää kaikki attribuutit (sekä omat että perityt): kaikki olion ominaisuudet löytyvät yhdestä taulusta yhden attribuutin arvoja monessa taulussa tai kunkin aliluokan relaatiotaulussa on vain ko. aliluokan omat ominaisuudet (ja avain) olion ominaisuuksia monessa taulussa samoja attribuutteja ei esitetä eri tauluissa Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 219/221 Kevät 2004

tai kaikki aliluokat esitetään yhtenä relaatiotauluna komponentti saa puuttuvan arvon, jos attribuutti ei koske tätä monikkoa Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 220/221 Kevät 2004

Tiedon mallitus: yhteenveto talletusvaihtoehtoja: tiedostot, hakupuut ja muut erikoisrakenteet, tietokanta tietomallin käsitteitä: attribuutti, relaatio, operaatio, luokkahierarkia tavoitteena yksikertainen mutta riittävän todenmukainen malli relaatiomalli, oliomalli Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tiedon mallitus ja talletus 221/221 Kevät 2004