Tiedon esitys tietokoneessa. Jyry Suvilehto T-110.1100 Johdatus tietoliikenteeseen ja multimediatekniikkaan kevät 2010

Samankaltaiset tiedostot
Tiedon esitys tietokoneessa. Jyry Suvilehto T Johdatus tietoliikenteeseen ja multimediatekniikkaan kevät 2014

Tiedon esitys tietokoneessa. Jyry Suvilehto T Johdatus tietoliikenteeseen ja multimediatekniikkaan kevät 2012

Tiedon esitys tietokoneessa. Jyry Suvilehto T Johdatus tietoliikenteeseen ja multimediatekniikkaan kevät 2013

XML prosessori. XML prosessointi. XML:n kirjoittaminen. Validoiva jäsennin. Tapahtumaohjattu käsittely. Tapahtumaohjattu käsittely.

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

OHJ-1010 Tietotekniikan perusteet 4 op Syksy 2012

Johdatus rakenteisiin dokumentteihin

Sisältö. XML, XHTML ja CSS XML XML. XML:n ja HTML:n ero. XML kieliä XML XHTML CSS XSL. T Hypermediadokumentin laatiminen 2002

Tutkitaan sitten HTML-dokumenttien anatomiaa, jotta päästään käsiksi rakenteisten dokumenttien käsitteistöön esimerkkien kautta.

Vaasan yliopiston toimintaa tukevat informaatiopalvelut ovat käytettävissä WWW:n kautta.

Kojemeteorologia. Sami Haapanala syksy Fysiikan laitos, Ilmakehätieteiden osasto

XHTML - harjoitus. Tehtävä1: Tee xhtml tiedosto käyttäen notepad (muistio) ohjelmaa. Tiedoston tallennus notepad (muistio) ohjelmassa:

Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka. Vfo135 ja Vfp124 Martti Vainio

Multimedia. Petri Vuorimaa

HTML & CSS. HTML (HyperText Markup Language) Antti Koivisto. ! HTML on sivujen kuvauskieli.

Luento 12: XML ja metatieto

Kojemeteorologia. Sami Haapanala syksy Fysiikan laitos, Ilmakehätieteiden osasto

2. PEHMEÄ XHTML XRAJAHTML

XML johdatus: DTD. Jaana Holvikivi

XML / DTD / FOP -opas Internal

Digitaalinen media. Petri Vuorimaa

Digitaalisen median tekniikat. JSP ja XML Harri Laine 1

Digitaalisen median tekniikat. JSP ja XML

Tiedonsiirron perusteet ja fyysinen kerros. Tietoliikenne kohtaa todellisuuden OSI-mallin alimmainen kerros Kirja sivut 43-93

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Avoimet standardit ja asiakirjamuodot Suomen julkisessa hallinnossa: teoriasta käytäntöön

6. Analogisen signaalin liittäminen mikroprosessoriin Näytteenotto analogisesta signaalista DA-muuntimet 4

TIEP114 Tietokoneen rakenne ja arkkitehtuuri, 3 op. Assembly ja konekieli

W3C-teknologiat ja yhteensopivuus

Laajuus 5 op Luennot: 12 x 2t Harjoitukset: 7 viikkoharjoitusta harjoitusten tekemiseen saatavissa apua 2 ryhmää / harjoitus

Muuntavat analogisen signaalin digitaaliseksi Vertaa sisääntulevaa signaalia referenssijännitteeseen Sarja- tai rinnakkaismuotoinen Tyypilliset

SISÄLLYS - DIGITAALITEKNIIKKA

XML rakenteen suunnittelu. Jaana Holvikivi

3 Verkkosaavutettavuuden tekniset perusteet

Käytännön järjestelyt. T Johdatus tietoliikenteeseen ja multimediatekniikkaan kevät 2012

TIETOKANTOJEN PERUSTEET MARKKU SUNI

P e d a c o d e ohjelmointikoulutus verkossa

6 XML-työkalut 1. 6 XML-työkalut

Heikki Helin Metatiedot ja tiedostomuodot

ELEC-C5070 Elektroniikkapaja (5 op)

4. Lausekielinen ohjelmointi 4.1

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet

Tiedon esitysmuodot. Luento 6 (verkkoluento 6) Lukujärjestelmät Kokonaisluvut, liukuluvut Merkit, merkkijonot Äänet, kuvat, muu tieto

TIEP114 Tietokoneen rakenne ja arkkitehtuuri, 3 op. FT Ari Viinikainen

Kuvankäsi*ely 1. Digitaaliset kuvat ja niiden peruskäsi3eet. Kimmo Koskinen

Web-teknologiat. XML-datan kysely Topi Sarkkinen

Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto

DOORSin Spreadsheet export/import

HELIA TiKo-05 1 (10) Outi Virkki ICT03D Tieto ja tiedon varastointi yrityksessä

Tietoliikenteen fyysinen kerros. Tietoliikenne kohtaa todellisuuden Kirja sivut 43-93

Luento 2: Tiedostot ja tiedon varastointi

Mul$media. Jyry Suvilehto Alkuperäiset kalvot Petri Vuorimaa

TIEDEJUTTUKURSSI FM VILLE SALMINEN

Tutkija Mikko Salmenperä. huone: sd109. TTY / Systeemitekniikan laitos. puh: mikko.salmenpera@tut.fi

T Multimediatekniikka

CLT131: Tekstityökalut 2010, toinen luento

JWT 2016 luento 11. to klo Aulikki Hyrskykari. PinniB Aulikki Hyrskykari

Tietokanta.java Luokka tarjoaa välineet tietokannan lukemiseen. Haetuista tiedoista muodostetaan kurssi- ja opetus-olioita.

Sivuston tiedotqbooksupportpho nenumber.com

Näin järjestän ohjelmointikurssin, vaikka en ole koskaan ohjelmoinut

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

LAS-TIEDOSTON SISÄLTÖ LIITE 2/1

PIKSELIT JA RESOLUUTIO

StanForD-XML. Juha-Antti Sorsa, Tapio Räsänen, Vesa Imponen

Tiedonsiirron perusteet ja fyysinen kerros. Tietoliikenne kohtaa todellisuuden OSI-mallin alimmainen kerros "Miten siirretään yksi bitti"

Johdatus XML teknologioihin

LOAD R1, =2 Sijoitetaan rekisteriin R1 arvo 2. LOAD R1, 100

Tähtitieteen käytännön menetelmiä Kevät 2009

Sivuston tiedotreviewproducts.org

11. kierros. 1. Lähipäivä

Notepad++ on ilmaisohjelma ja sen voi ladata osoitteesta:

2 Rakenteisten dokumenttien perusteet

Ohjeita kirjan tekemiseen

CR m CR m CR m CR m CR ,5 m CR m CR m CR m. CR m CR m CR m CR m

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Kuvan pakkaus JPEG (Joint Photographic Experts Group)

Flash AD-muunnin. Ominaisuudet. +nopea -> voidaan käyttää korkeataajuuksisen signaalin muuntamiseen (GHz) +yksinkertainen

Luento 6 Tiedon esitysmuodot

Luento 6 Tiedon esitysmuodot

Sivuston tiedotprintersupportnu mbercare.com

Johdanto. Kiinteistöhuoltoyhtiö tarvitsee järjestelmän huoltopyyntöjen hallinnointiin

Luku- ja merkkikoodit. Digitaalitekniikan matematiikka Luku 12 Sivu 1 (15)

sfrm software for requirements management

Luento 5. Timo Savola. 28. huhtikuuta 2006

Sivuston tiedotwixaccounting.com

Ylläpitoalue - Etusivu

Luento 6 Tiedon esitysmuodot

XML, XHTML ja CSS. T Hypermediadokumentin laatiminen. Mikko Pohja

Luento 6 Tiedon esitysmuodot. Tiedon esitys laitteistossa (3)

AV-muotojen migraatiotyöpaja - video. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Sivuston tiedotqbsupportcustom erservice.com

Digitaalisen median tekniikat. Luento 3: CSS

TIETOTEKNIIKKA Koodi Vanha opintojakso op ov Vastuuhenkilö LV vastaavat opinnot tai korvaava suoritustapa TTE.

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

XML johdanto, uusimmat standardit ja kehitys

Sivuston tiedotakcpshop.de.websiteoutlook.com

Sivuston tiedotmysiteworthcheck.com

XML - perusteet. Ctl230: Luentokalvot Miro Lehtonen

Luento 6 Tiedon esitysmuodot. Tiedon esitys laitteistossa (3)

Transkriptio:

Tiedon esitys tietokoneessa Jyry Suvilehto T-110.1100 Johdatus tietoliikenteeseen ja multimediatekniikkaan kevät 2010

Luennon sisältö 1. Kurssin loppupuolen rakenne 2. Tiedon binääriluonne AD-muunnos 3. Tekstitiedostot ASCII XML 4. Binääritiedostot BMP Vähän väriavaruuksista 2

Multimediaosuus Tekstidata (XML) Tiedon esitys koneessa Yksinkertaiset mediatallenteet (BMP) Häviölliset tallenteet (.mp3,.jpeg) Multimedia, video (MPEG,) AD-muunnos Todellisuuden peittäminen (VR) Tietokonegrafiikan perusteet Todellisuuden lisääminen (AR) 5.3. Luento Jyry Suvilehto 19.3. Luento Petri Vuorimaa 26.3. Luento Timo Tossavainen 09.4. Luento Kai Puolamäki 3

Synteesiosuus Tiedonsiirto Multimedia Tuotteiden konseptointi Tiedonsiirto Multimedia Verkkoliiketoiminta (multimedian ehdoilla) 16.4. Luento Vesa Kantola 23.04. Luento Sakari Luukkainen 4

TIEDON BINÄÄRILUONNE 5

Bitti Atomi = pienin jakamaton osanen Kreik Reaalimaailmassa on olemassa atomia pienempiä osasia Tietokoneissa bitti on ihan oikeasti pienin jakamaton osa Jakamattomuudella järisyttäviä seurauksia Bitti voi olla kahdessa tilassa, esim. Jännitteenä ilmaistuna 0 on 0v 1 on +5v Kun bitin arvo on 1, sanomme että bitti on päällä tai tosi, 0 vastaavasti on pois päältä tai epätosi Biteille on olemassa luonnollinen laskujärjestelmä, nk. Boolen logiikka 1 and 1 = 1 1 or 0 = 1 0 and 1 = 0 etc. 1 or 1 = 1! 6

Binääriaritmetiikka Monta bittiä peräkkäin laittamalla ja normaalilla yhteenlaskuoperaatiol la saadaan aikaiseksi algebrallinen rengas Formaalisti Z + mod 2 k kun käytössä on k bittiä Tarkemmin, kyseessä on äärellinen kunta eli ns. Galois-kunta Peräkkäin asetetuille, sähköisesti esitetyille biteille on mahdollista Boolen logiikalla muodostaa sähköinen piiri joka tekee arbitäärisiä laskutoimituksia Claude Shannonin diplomityö 7

Lukujärjestelmämuunnos Ei kuulu tähän kurssiin varsinaisesti Kuuluu yleissivistykseen osata Jos tarvitaan muistin virkistystä 13 in bin =? 00011011 8

Suurempia mittoja Bitit ryhmitellään usein tavuiksi (8 bittiä) Tietokoneen alijärjestelmät käsittelevät monen tavun mittaisia sanoja (tyypillisesti 16-64 bittiä) Monimutkaisemman konstruktion kautta on mahdollista määritellä desimaalilukuja, joita ovat kiinteän ja liukuvan pilkun luvut Olennaista on se, että tarkkuus näilläkin äärellinen! 9

AD-muunnos Joskus tieto tarvitsee muuttaa analogisesta digitaaliseksi Suurin ongelma muodostuu äärellisyydestä Joudutaan määrittelemään joku minimi, jota pienempi informaatio hävitetään Aikasarjoissa näytteenottotaajuus, kuvissa tiheys (dots per inch) Alkuperäistä ei usein voida konstruoida takaisin tallenntusta Joskus voidaan, ns. Nyquistin taajuus 10

Yksiulotteisesta signaalista otetaan näytteitä ajanhetkillä 0, t, 2t, 3t Näytteenottotaajuus f s = 1 t Shannon-Nyquistin näytteenottoteoreema: Signaali, jonka kaistanleveys on B voidaan rekostruoida täysin jos f s < 2B Näytteenotto 11

Yleensä ei ole järkevää käyttää arbitääristä tarkkuutta jokaiselle mittauspisteelle, vaan näytteet kvantisoidaan Arvot pyöristetään tasaväliselle asteikolle Kvantisointi lisää virhettä selkeästi Kvantisointi 12

Edistyneitä AD-muunnoksia Tyypillisin esimerkki AD-muunnoksesta on yksiulotteinen suure ajassa (esim. Ääni) Kameran CCD-kenno suorittaa 2Dmuunnoksen kahdessa tilaulottuvuudessa Videokamera suorittaa muunnoksen kahdessa tilaulottuvuudessa ja ajassa Perusperiaatteet ja ominaisuudet säilyvät 13

Toisinpäin Digitaalisesta analogiseksi muunnettaessa askeleet käännetään Toisaalta voi olla signaaleja, jotka on generoitu suoraan digitaalisessa muodossa AD-muunnoksen ongelmia ei ole Tietokoneiden ensimmäisiä käyttötarkoituksia oli maailman simulointi 14

Simulointi Jännä simulaatio Jännempi 15

Tiedon jäsentämisen terminologiaa Kenttä on yksittäinen pala tietoa opiskelijanumero tai nimi Tietue on kokoelma kenttiä Yhdistetty opiskelijanumero, nimi ja ikä Tiedosto on kokoelma tietueita Listaus kurssin opiskelijoiden opiskelijanumeroista, nimistä ja i istä Tietokanta kokoelma kenttiä, joiden välillä on relaatioita 16

Tiedostotyypeistä Tiedostoja voidaan luokkiin monella tavalla Unixin file-työkalun filosofian mukaan on olemassa Tekstitiedostoja Binääritiedostoja Ajettavia ohjelmia (binääritiedostojen erikoistapaus) Ei käsitellä 17

TEKSTITIEDOSTOT 18

Teksti Luku- ja kirjoitustaito ovat aika vanhoja juttuja Syvälle yhteiskuntaan juurtunut vuorovaikutustapa Tietokoneiden tekstissä ensimmäinen ja laajimmalle levinnyt standardi on alunperin lennättimiä varten kehitetty American Standard for Code for Information Interchange (ASCII) 7 bittiä koska haluttiin säästää Englannin kirjoittamiseen tarvittavat aakkoset, erikoismerkkejä Paljon lennättimen ohjaamiseen erikoistuneita ns. Non-printable merkkejä 19

Ei-tulostuvat ja tulostuvat merkit 20

ASCIIn jälkeen Englannin kirjoittamiseen tarvittavat merkit eivät riitä kovin pitkälle suuri määrä erilaisia merkistöjä Lännessä yleensä taaksepäin yhteensopivia ASCIIn kanssa Unicode merkistö tullut pysyäkseen 32 bittinen osoiteavaruus Eri tapoja koodata sama merkistö, UTF-8, UTF-16, UTF-32 21

Tekstitiedostoformaatit Mikäli teksitiedostossa on rakenne, voidaan tehdä ohjelma joka osaa lukea sitä Erittäin yksinkertainen esimerkki: Comma Separated Values 25, Jyry, 191 23, Teemu, 165 19, Fuksi, 180 Monimutkaisempi ratkaisu yleiseen tapaukseen: XML 22

XML extended Markup Language Vanhan SGML-standardin uudet vaatteet Kehittynyt irrallaan HTML:stä, ottanut oppia HTML:n virheistä XHTML on XML-speksin mukainen HTML Perusidea on sama <tag attribute= example > This is tagged text <tag /> XML:ää pidetään välillä liiankin helppolukuisena 23

XML-dokumentin runko koostuu elementeistä (tag), joilla voi olla attribuutteja Elementtien välistä suhdetta kuvataan jollain tavalla XML schema Document Type Description XML-dokumentti 24

DTD ja sen mukainen dokumentti <!ELEMENT kirjasto (hylly*)> <!ELEMENT hylly (hyllynro, kirja*)> <!ELEMENT hyllynro (#PCDATA> <!ELEMENT kirja (nimi, kirjailija?, vuosi) > <!ELEMENT kirja (#PCDATA)> <!ELEMENT kirjailija (#PCDATA)> <!ELEMENT vuosi (#PCDATA)> DTD on sopimus dokumentin rakenteesta: ohjelma voidaan tehdä käsittelemään DTD:n mukaista dokumenttia. Kaikille itseään kunnioittaville ohjelmointialustoille on jo olemassa XML-parsereita valmiina. <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE kirjasto PUBLIC "KIRJASTO" "http://www.cse.tkk.fi/u/jsuvileh/jotime/esim.dtd"> <?xml-stylesheet type="text/xsl" href="hyllykko.xsl"?> <kirjasto> <hylly> <hyllynro>1</hyllynro> <kirja> <nimi>hobitti</nimi> <kirjailija>j.r.r. Tolkien</kirjailija> <vuosi>1937</vuosi> </kirja> <kirja> <nimi>silmarillion</nimi> <kirjailija>j.r.r. Tolkien</kirjailija> <vuosi>1977</vuosi> </kirja> </hylly> <hylly> <hyllynro>2</hyllynro> <kirja> <nimi>1984</nimi> <kirjailija>george Orwell</kirjailija> <vuosi>1949</vuosi> </kirja> <kirja> <nimi>suomen laki</nimi> <vuosi>2009</vuosi> </kirja> </hylly> </kirjasto> 25

XSL ja XPath Mm. verkkoselaimet osaavat näyttää XMLdokumentteja Muista, että XHTML on XML-kieli Xpath on tapa viitata dokumentin osiin XSLT-kuvauskielellä voidaan kuvata eri tapoja kuvata sama kerran määritelty data Kuin CSS HTML:lle, paitsi äärettömästi voimakkaampi Demo http://www.cse.hut.fi/~jsuvileh/jotime/kirjasto. xml Katso myös esim.dtd ja hyllykko.xsl 26

BINÄÄRITIEDOSTOT 27

Binääritiedostot Binääritiedostoja ei yleensä ole tarkoitettu ihmisten luettavaksi Tarvitaan heksaeditori tai jotain muuta ikävää lukemiseen Binääritiedostot tarjoavat usein kompaktimman tavan esittää tietoa 28

Värimallit Värejä voidaan yhdistää pääväreistä Värimallit voivat olla joko Additiivisia (RGB) Subtraktiivisia (CMYK) Koko väriavaruutta on käytännössä mahdotonta näyttää tietyllä laitteella Kuva: Mike Horvath/Wikipedia Kuva: Mirsav Todorac/Wikipedia 29

BMP -perusidea Koska R, G ja B kuvaavat koko kuvan, ilmaistaan jokainen näistä n bitillä (2, 4, 6 bittiä) per pikseli 0 on musta, 2^n-1 on maksimi ao. väriä Lisäksi tallennetaan hieman otsaketietoja Alkuun magic number kertomaan että kyseessä on BMP-kuva Kuvan koko Teknisyyksiä (helpottavat ohjelman tekoa) Kuva voi antaa väärän käsityksen. BMP:ssä pikselin värit tallennetaan yhdessä. Ei kolmessa kuvassa. 30

Lena Miss Marraskuu 1972 Käytetty siitä saakka esimerkkinä kuvankäsittelyssä Maailman toisiksi kuuluisin Playboykuva Koska BMP-tiedostot tuppaavat olemaan kookkaita, käsittelemme vain Lenan vasenta silmää 31

oko tiedoston koko Korkeus/leveys BMP Tavua/pikseli Magic number Osoitin kuvan alkuun Ensimmäisenä alavasen pikseli 85 85 dc hex = 132 (G), 133 (B), 220 (R) Tästä eteenpäin riveittäin ylöspäin. 32

BMP -huomioita BMP ei tässä tapauksessa pakannut tietoa mitenkään Kuvassa on redundanssia, joka voidaan poistaa häviöttömästi Kuvassa on paljon ihmissilmälle tarpeetonta informaatiota, voidaan poistaa häviöllisesti Näistä ensi viikolla 33

Yhteenvetoa Tietokoneet äärellisiä, jänniä kapistuksia Mikäli kiinnostaa enemmän, T-106.1150 Tietokone ja käyttöjärjestelmä Yleissivistävä, ei liian rankka Pitäisi mennä kaikkiin opintoihin Tiedostot voidaan jakaa karkeasti teksti- ja binääritiedostoihin XML on human readable sisällönkuvauskieli RGB on erittäin yksinkertainen binääriformaatti kuvien tallentamiseen 34