TIETOVARASTOJEN SUUNNITTELU



Samankaltaiset tiedostot
Tietovarastojen suunnittelu

NORMALISOINTI TIETOJEN MALLINNUS JOUNI HUOTARI & ARI HOVI

TIETOKANNAN SUUNNITTELU

Normalisointi. Jouni Huotari & Ari Hovi. kirjan Hovi, Huotari, Lahdenmäki: Tietokantojen suunnittelu & indeksointi, Docendo (2003, 2005) luku 5

Opettajana Mika Sorsa, HAMK:n ammatillisen opettajakoulutuksen opetusharjoittelija

Käsiteanalyysi prosessina ja tarveanalyysi

Jouni Huotari OLAP-ohjetekstit kopioitu Microsoftin ohjatun OLAP-kuution teko-ohjeesta. Esimerkin kuvaus ja OLAP-määritelmä

TIETOJEN TUONTI TIETOKANNASTA + PIVOT-TAULUKON JA OLAP-KUUTION TEKO

Tietokannan suunnittelu

KÄSITEANALYYSI PROSESSINA JA TARVEANALYYSI

Fyysinen suunnittelu

FYYSINEN SUUNNITTELU

Data Warehouse kuulumisia

FYYSINEN SUUNNITTELU

Health Intelligence - Parempaa informaatiota terveydenhuollon päätöksentekoon. Terveydenhuollon ATK päivät Sibelius Talo, Lahti

IIO10200 TIETOKANTAOHJELMOINTI (4 OP) OPINTOJAKSON ESITTELY JOUNI HUOTARI

Ville Porkka ASIAKKAAN DATAN MALLINNUS JA SEN ANALYSOINTI BUSINESS INTELLIGENCE -JÄRJESTELMÄSSÄ

IIO10200 Tietokantaohjelmointi (4 op)

Uudenmuotoiset yliopistot ja tietohallinto, OPM Alustuspuheenvuorot Ahti Planman, Kuopion yliopisto,tietotekniikkakeskus (Tike)

Luku Yleistä tietovarastoinnista 6.2 Tietovaraston kehittäminen 6.3 Tiedonlouhinta

Data, informaatio, tieto, ymmärtäminen ja viisaus

Terveydenhuollon tehokas johtaminen edellyttää parhaat raportointi- ja analysointityövälineet

IIO30100 Tietokantojen suunnittelu (6 op)

Moniulotteisen datan liitos tähtimallissa

TIETOKANNAT JOHDANTO

IIO30100 TIETOKANTOJEN SUUNNITTELU (6 OP)

IIO30100 Tietokantojen suunnittelu (6 op)

LAPPEENRANNAN TEKNILLINEN YLIOPISTO

Diplomityö TEHDASMITTAUSTEN VARASTOINTI MONIULOTTEISELLA TIETOMALLILLA

MICROSOFT TEST MANAGERIN KÄYTTÖ TIETOVARASTOYMPÄRISTÖN VALVONNASSA

Tällä viikolla. Kotitehtävien läpikäynti Aloitetaan Pelifirman tietovaraston suunnittelu Jatketaan SQL-harjoituksia

BUSINESS INTELLIGENCE- OHJELMISTON VALINTA

Tietovarasto automaattisten tarkastusjärjestelmien keräämälle datalle

Liiketoimintatiedon hallinta ja hyödyntäminen (BI) Nice Tuesday. Minna Oksanen Avarea Oy

TIETOVARASTON UUDELLEENSUUNNITTELU JA TOTEUTTAMINEN

POLKU LUOKKAKAAVIOISTA TAULUJEN TOTEUTUKSEEN

Jouni Huotari & Ari Hovi. Käsitemallinnuksesta relaatiokantaan KÄSITEMALLI. LOOGINEN MALLI: tietomalli valittu. FYYSINEN MALLI: DBMS valittu

TIETOVARASTOT. Tietovarastot ohjelmistokehityksessä

HELIA 1 (11) Outi Virkki Tiedonhallinta

Tietovarastointiratkaisut massaräätälöinnin konfiguraattoreiden tukena. DI Mika Aho BI/DW Specialist

TAMPEREEN TEKNILLINEN YLIOPISTO KÄYTTÖOHJE TIETOVARASTON KUUTIOT

TIETOVARASTON VALVONTA

VAASAN YLIOPISTO TEKNILLINEN TIEDEKUNTA TIETOTEKNIIKKA. Jarkko Lehto TIETOVARASTOINTI JA BUSINESS INTELLIGENCE. Tietotekniikan pro gradu tutkielma

Nopeutta ja Sulavuutta Analytiikkaan

HAAGA-HELIA Heti-09 1 (12) ICT05 Tiedonhallinta ja Tietokannat O.Virkki Näkymät

Tietovarastokuvausten takaisinmallinnus mallinnustyökalun avulla. Samuel Heino

KARELIA-AMMATTIKORKEAKOULU Tietotekniikan koulutusohjelma. Jarkko Lösönen TALOUDEN RAPORTOINNIN KEHITYSTEHTÄVÄ

Koosteet tietovarastojärjestelmissä ja koosteiden toteutus materialisoiduilla näkymillä

Mikko Mäkelä KONEHUOLTOJEN TIETOKANNAN SUUNNITTELU JA TOTEUTUS

MUITA TIETOKANTAOBJEKTEJA NÄKYMÄT, SYNONYYMIT, INDEKSOINTI, VALTUUDET JA SYSTEEMIHAKEMISTO

Lupapiste verkkopalvelun tietovarastoja raportointiratkaisu

Tietovarastossa olevan tiedon laatu ja sen käsittely. Ari Helin

BUSINESS INTELLIGENCE -RAPORTOINNIN KEHITYS

TIETOKANNAN JÄRKEISTÄMINEN

Power Pivotin hyödyntäminen myynnin analysoinnissa ja raportoinnissa

Tietokantojen suunnittelu, relaatiokantojen perusteita

Paksut indeksit ja summataulut

Web-seminaari

ETL-DEMO. Esimerkki ETL-kuvauskielen käyttöstä

Ari Hovi & Jouni Huotari M3-1

TIEDONHALLINTA - SYKSY Luento 11. Hannu Markkanen /10/12 Helsinki Metropolia University of Applied Sciences

IIO30200 TIETOKANNAN HALLINTA (5 OP)

IIO30220 Database Management / Tietokannan hallinta TAPAHTUMIEN HALLINTA JOUNI HUOTARI ( )

IIO30200 Tietokannan hallinta (5 op)

TIETOMALLI JA TIETOVARASTO PALVELUKONSEPTI

Analyysiraportointi. Kieku-tietojärjestelmähankkeen infotilaisuus. Juho Ajo Valtiokonttori Juho Ajo

TIETOKANTOJEN SUUNNITTELU

Internet tietovaraston lähteenä. Markku Kasila

LIIKETOIMINTATIEDON HALLINNAN MAHDOLLISUUDET OPPILAITOSYMPÄRISTÖSSÄ

Tietojärjestelmä tuotantoympäristössä. Sovellusohjelmat Helsingin ammattikorkeakoulu Stadia / Tekniikka ja liikenne Vesa Ollikainen

Parantaako Data Vault -menetelmä tietovarastoratkaisun skaalautuvuutta ja muutosjoustavuutta? Tapaustutkimus, Yritys A

TIEDONHALLINNAN PERUSTEET - SYKSY 2013

Timo Mustakangas QLIKVIEW RAPORTOINTI- JA ANALYSOINTISOVELLUKSEN TOTEUTTAMI- NEN

KÄSITEANALYYSI JA -MALLINNUS HOVI, HUOTARI, LAHDENMÄKI: TIETOKANTOJEN SUUNNITTELU & INDEKSOINTI DOCENDO (2003, 2005) LUKU 3

TIEDONHALLINTA - SYKSY Luento 1. Saapumisryhmä: TXQ16ICT, TXQ16S1 ja TXQ16PROS. 27/8/17 Helsinki Metropolia University of Applied Sciences

Tietoarkkitehtuuri nyt!

Haaga-Helia HeTi-09 1 (20) Outi Virkki, Tiina Mikkola ICT05 Tiedonhallinta ja tietokannat Johdanto

TIETOKANNAT JOHDANTO JOUNI HUOTARI & ARI HOVI

Excel PowerPivot

TIETOVARASTON MUODOSTAMINEN AUTOMAATTISESTI LÄHDETIETOKANNOISTA

Kuva 7.2 vastaustaulu harjoitukseen 7.2

Tietokantojen perusteet

Kirjoita jokaiseen erilliseen vastauspaperiin kurssin nimi, tenttipäivä, oma nimesi (selkeästi), opiskelijanumerosi ja nimikirjoituksesi

Tietovaraston ETL-prosessin testiautomaatiotyökalun suunnittelu ja toteutus. Panu Schutschkoff

Vastaajatunnusten luonti edellyttää, että käyttäjällä on joko AIPAL-koulutustoimijan vastuukäyttäjän tai AIPAL-koulutustoimijan käyttäjän oikeudet.

HOJ Haja-aiheita. Ville Leppänen. HOJ, c Ville Leppänen, IT, Turun yliopisto, 2012 p.1/10

OLAP-tekniikoiden käyttömahdollisuudet teollisuusprosessien analysoinnissa

TIETOKANNAN NORMALISOINTI JA NORMAALIMUODOT

OpenOffice.org Base 3.1.0

T Vaatimusmäärittelydokumentti. ETL-työkalu

Jan Ågren LIIKETOIMINTATIETO

Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia.

TIEDONHALLINNAN PERUSTEET - SYKSY 2013

Eihän yksittäinen opettaja voi vaikuttaa yliopiston tuloksiin ja opiskelijan valmistumiseen! Tarve skaalautuville sähköisille seurantatyövälineille?

Valtionhallinnon käyttäjäpäivä - IBM Cognosin tulevaisuuskatsaus ja nykypäivä

Muita tietokantaobjekteja. Näkymät, synonyymit, indeksointi, valtuudet ja systeemihakemisto

Hyödyt irti XDW:stä. Kim Johnsson Projektipäällikkö/Cerion Solutions Oy

Kuukausiraportoinnin kehittäminen PowerPivotilla

TIEDONHALLINTA - SYKSY Luento 10. Hannu Markkanen /10/12 Helsinki Metropolia University of Applied Sciences

Datasta arvoaliiketoiminnalle. Kirsi Pietilä Business Intelligence Lead

Transkriptio:

IIO30120 DATABASE DESIGN / TIETOKANTOJEN SUUNNITTELU TIETOVARASTOJEN SUUNNITTELU KIRJAN HOVI, HUOTARI, LAHDENMÄKI: TIETOKANTOJEN SUUNNITTELU & INDEKSOINTI, DOCENDO (2003, 2005) LUKU 8 JOUNI HUOTARI & ARI HOVI

MÄÄRITTELY- JA POHDISKELUTEHTÄVÄ Mikä on tietovarasto (data warehouse)? Miten termi Business Intelligence liittyy tietovarastointiin? Miten käsite data mart liittyy tietovarastoihin? Entä OLAP (online analytical processing)? Mikä on ETL-tekniikan perusidea? Mistä sanoista ETL tulee?

TIETOVARASTOKANNAN SUUNNITTELUPERIAATTEITA Tietovarastotietokannan tavoitteena on tukea tietojen kyselyä, analysointia ja raportointia Tämä on operatiivisissa kannoissa usein hankalaa (mutta ratkaisujakin on; osaatko mainita mitä?) => on tärkeää, että: historia säilytetään: käyttäjät haluavat tehdä trendianalyysiä eri operatiivisista järjestelmistä tulevat tiedot yhdenmukaistaan: yhdenmukaiset koodit ja perusavaimet tietorakenne on selkeä ja intuitiivinen: ymmärrettävät taulujen ja sarakkeiden nimet, kyselyjä on helppo tehdä

BACK ROOM AND FRONT ROOM OF A DATA WAREHOUSE Kimball, Caserta: The Data Warehouse ETL Toolkit (2004)

THE FOUR STAGING STEPS OF A DATA WAREHOUSE Kimball, Caserta: The Data Warehouse ETL Toolkit (2004)

RATKAISUJA TIETOVARASTOKANNAN SUUNNITTELUUN Tiedon "jalostus": tietoa on summattu valmiiksi, yleisiä tunnuslukuja on laskettu valmiiksi Tiedot on tallennettu riittävän tarkalla tasolla (esim. viikkotaso) denormalisointi ja summaus => saadaan riittävän hyvä vastausaika kyselyille (tähtimalli)

TÄHTIMALLI Tähtimalli (star schema, dimensional modelling) eli dimensiomalli on tietovarastojen yhteydessä esitetty uusi tapa soveltaa käsiteanalyysiä Tähtimallissa on luovuttu osittain kolmannesta normaalimuodosta kyselyjen yksinkertaistamiseksi ja nopeuttamiseksi (denormalisointi) Hintana tästä on levytilan tietty lisätarve (yleensä melko vähäinen) sekä se, että tietovaraston lataaminen monimutkaistuu jonkin verran

TÄHTIMALLI Tähtimalli sopii hyvin erityisesti numeerisen ja moniulotteisen tietoaineksen mallintamiseen (esim. päiväys voidaan jakaa monelle tasolle => aikaulottuvuus) Tähtimallia käytetään etenkin pienempien tietovarastokantojen, ns. paikallisvarastojen (data mart) suunnittelussa. Nimi tähtimalli tulee siitä, että rakenne muistuttaa tähteä sakaroineen (ks. kirjan kuva 8.1); jos sakarat jakautuvat edelleen pienempiin osiin, puhutaan lumihiutalemallista (kuva 8.2) Tähtimallin avulla suunnitellaan myös ns. OLAP-kantoja (Online Analytical Processing) ja ns. kuutioita (cube), jotka eivät ole tavanomaisia relaatiokantoja vaan tietojen analysointiin tarkoitettuja erikoiskantoja

KUVA 8.1: TÄHTIMALLI

TÄHTIMALLI: FAKTATAULU JA DIMENSIOTAULUT Tähtimallissa on keskellä iso taulu, ns. faktataulu, ja ympärillä useita pienempiä dimensiotauluja eli ulottuvuustauluja Faktataulun tiedot ovat luonteeltaan tapahtumatyyppisiä, kuten myyntitapahtumia Numeroarvoja (esimerkiksi myynti, kpl, vero, saldo) sisältäviä sarakkeita kutsutaan faktoiksi Faktataulun perusavain koostuu dimensiotaulujen perusavaimista yhdisteltynä Faktataulun numeroarvoja lasketaan yleensä yhteen erilaisilla dimensioista saaduilla tasoilla; voidaan myös laskea keskiarvoja ja lukumääriä eri dimensioilla

TÄHTIMALLI: FAKTATAULU JA DIMENSIOTAULUT Faktataulu on karkeisuudestaan riippuen yleensä iso, esim. miljoonia rivejä Tähtimallikyselyä tehtäessä dimensiotaulut yhdistetään faktatauluun liitoksilla Dimensiotauluissa säilytetään tapahtumiin verrattuna staattisia tietoja, joista saadaan erilaisia ryhmittelyjä ja hakukenttiä faktataulun rivejä summaaville kyselyille Tyypillisiä faktatauluja ovat asiakas, tuote, pvm, organisaatioyksikkö, Dimensiotaulut ovat faktatauluun verrattuna pieniä, usein sadoista tuhansiin riveihin.

KUVA 8.2: LUMIHIUTALEMALLI

HARJOITUS: OLAP-KUUTION LUONTI http://homes.jamk.fi/~huojo/opetus/iio30100/olapkuution_teko.pdf

LOPUT ESIMERKIT, KS. KIRJA JA LINKIT http://www.dmreview.com/channels/dw_basics.html http://en.wikipedia.org/wiki/data_warehouse http://en.wikipedia.org/wiki/data_mart http://en.wikipedia.org/wiki/star_schema http://en.wikipedia.org/wiki/snowflake_schema http://en.wikipedia.org/wiki/olap