1 HTML HyperText Markup Language

Samankaltaiset tiedostot
Mikä on internet, miten se toimii? Mauri Heinonen

ATK yrittäjän työvälineenä

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

HTML & CSS. HTML (HyperText Markup Language) Antti Koivisto. ! HTML on sivujen kuvauskieli.

URL-osoitteiden suunnittelu

Sisältö. XML, XHTML ja CSS XML XML. XML:n ja HTML:n ero. XML kieliä XML XHTML CSS XSL. T Hypermediadokumentin laatiminen 2002

Tutkitaan sitten HTML-dokumenttien anatomiaa, jotta päästään käsiksi rakenteisten dokumenttien käsitteistöön esimerkkien kautta.

1.1 Internetistä lyhyesti. Mikä Internet on? 1.2 Maailmanlaajuinen verkko

ATK yrittäjän työvälineenä

TIEDEJUTTUKURSSI FM VILLE SALMINEN

Entiteetit erotetaan muusta tekstistä & ja puolipiste. esim. copyright-merkki näkyy sivulla

OSI ja Protokollapino

KYMENLAAKSON AMMATTIKORKEAKOULU Tietotekniikan koulutusohjelma / Tietoverkkotekniikka. Joni Korjala APACHE WWW-PALVELIN Seminaarityö 2012

Laajuus 5 op Luennot: 12 x 2t Harjoitukset: 7 viikkoharjoitusta harjoitusten tekemiseen saatavissa apua 2 ryhmää / harjoitus

10 Nykyaikainen WWW-arkkitehtuuri

M. Merikanto 2012 XML. Merkkauskieli, osa 2

3 Verkkosaavutettavuuden tekniset perusteet

SUOMEN KUNTALIITTO Sairaalapalvelut

T Hypermediadokumentin laatiminen. Sisältö. Tavoitteet. Mitä on www-ohjelmointi? Arkkitehtuuri (yleisesti) Interaktiivisuuden keinot

XHTML - harjoitus. Tehtävä1: Tee xhtml tiedosto käyttäen notepad (muistio) ohjelmaa. Tiedoston tallennus notepad (muistio) ohjelmassa:

HOW-TO: Kuinka saan yhdistettyä kaksi tulospalvelukonetta keskenään verkkoon? [Windows XP]

Ohjeita informaation saavutettavuuteen

Teknisiä käsitteitä, lyhenteitä ja määritelmiä

Tiedostojen siirto ja FTP - 1

TeleWell TW-EA711 ADSL modeemi & reititin ja palomuuri. Pikaohje

Laitteessa tulee olla ohjelmisto tai uudempi, tarvittaessa päivitä laite

VMU-C EM. Asennus ja käyttö

Code Camp for Girls. Sanna Nygård. Lokakuussa

S Tietoliikennetekniikan perusteet. Pakettikytkentäiset verkot. Helsinki University of Technology Networking Laboratory

Julkaiseminen verkossa

Pika-aloitusopas. Haku Voit etsiä sivustoja, henkilöitä tai tiedostoja. Sivuston tai uutisviestin luominen

Tietoliikenne II (2 ov)

DNS- ja DHCPpalvelut. Linuxissa. Onni Kytönummi & Mikko Raussi

Linux palomuurina (iptables) sekä squid-proxy

W3C-teknologiat ja yhteensopivuus

CSS - tyylit Seppo Räsänen

H T M L eli kuinka laadin itselleni päheät kotisivut. Janne Käki

NTG CMS. Julkaisujärjestelm. rjestelmä

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Siltojen haitat. Yleisesti edut selvästi suuremmat kuin haitat 2/19/ Kytkin (switch) Erittäin suorituskykyisiä, moniporttisia siltoja

HTML perusteita (ei julkiseen jakeluun)

VERKON ASETUKSET SEKÄ WINDOWSIN PÄIVITTÄMINEN

Luento 12: XML ja metatieto

Saavutettavuus > Tapio Haanperä Saavutettavuusasiantuntija tel

TCP/IP-protokollat ja DNS

Yleinen ohjeistus Linux tehtävään

6 XML-työkalut 1. 6 XML-työkalut

WWW-sivu. Miten Internet toimii? World Wide Web. HTML-koodi. HTTP-istunto URL <#>

Kuva maailmasta Pakettiverkot (Luento 1)

Notepad++ on ilmaisohjelma ja sen voi ladata osoitteesta:

XML / DTD / FOP -opas Internal

Kuva 1 Internet on pakettivälitteinen

Järjestelmäarkkitehtuuri (TK081702)

DL SOFTWARE Uumajankatu 2 Umeågatan FIN VAASA/VASA FINLAND +358-(0) Fax +358-(0)

,QWHUQHWVHODLPHQNl\WWlPLQHQ±,QWHUQHW([SORUHU

Antti Vähälummukka 2010

Salausmenetelmät (ei käsitellä tällä kurssilla)

Hajautettujen sovellusten muodostamistekniikat, TKO_2014 Johdatus kurssiin

Suvi Junes Tietohallinto / Opetusteknologiapalvelut 2012

VIENET JULKAISUJÄRJESTELMÄLLÄ TOTEUTETTUJEN INTERNET-SIVUJEN YLLÄPITO-OHJE

Dokumentin nimi LOGO:) Tampereen teknillinen yliopisto. Ryhmä XXX: Projektiryhmän nimi Projektin nimi

Sähköposti ja uutisryhmät

Netemul -ohjelma Tietojenkäsittelyn koulutusohjelma

S Teletekniikan perusteet

XML johdanto, uusimmat standardit ja kehitys

Tietoliikenne I (muuntokoulutettaville) 2 ov Syksy 2002 Luennot Liisa Marttinen 11/6/2002 1

Tärkeimmät toiminnot. Kertausta ja uusia toimintoja Wordistä sekä tiedostonhallinnasta. Tärkeimmät toiminnot jatkuu...

XML, XHTML ja CSS. T Hypermediadokumentin laatiminen. Mikko Pohja

dyntäminen rakennusautomaatiossa Jussi Rantanen Myyntipää äällikkö Fidelix Oy

Webkoulutus

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

XML prosessori. XML prosessointi. XML:n kirjoittaminen. Validoiva jäsennin. Tapahtumaohjattu käsittely. Tapahtumaohjattu käsittely.

Skype for Business ohjelman asennus- ja käyttöohje Sisällys

Vaasan yliopiston toimintaa tukevat informaatiopalvelut ovat käytettävissä WWW:n kautta.

Yritysturvallisuuden perusteet. 11. Luento Tietotekninen turvallisuus

Tee html-sivu, jossa on yllä olevat kaksi taulukkoa.

Web sovelluksen kehittäminen sähkönjakeluverkon suojareleisiin

Internetin hyödyt ja vaarat. Miten nettiä käytetään tehokkaasti hyväksi?

Avoimet standardit ja integraatio

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

1 www-sivujen teko opetuksessa

Digitaalisen median tekniikat. JSP ja XML Harri Laine 1

Tehtävä 2: Tietoliikenneprotokolla

H T M L eli kuinka laadin itselleni päheät kotisivut. Janne Käki

3 Internet & WWW. 3 Internet & WWW

Paikkatiedot ja Web-standardit

Artikkelien muokkaaminen sekä sisältöeditorin peruskäyttö

Verkkosisällön saavutettavuusohjeet 2.0: hyviä ohjeita monimuotoisen sisällön suunnitteluun ja arviointiin

VERKKOKÄYTTÄJÄN OPAS. Tulostuslokin tallennus verkkoon. Versio 0 FIN

HTML5 -elementit jatkuu

Verkkopalveluiden saavutettavuus

XPages käyttö ja edut Jarkko Pietikäinen toimitusjohtaja, Netwell Oy

Web-palveluiden toteutus älykortille

Siltojen haitat Yleisesti edut selvästi suuremmat kuin haitat

TIES460 OPPIMATERIAALITUOTANTO,

Pertti Pennanen OSI 1 (4) EDUPOLI ICTPro

4. Lausekielinen ohjelmointi 4.1

Google-dokumentit. Opetusteknologiakeskus Mediamylly

TIEDONHAKU INTERNETISTÄ

Transkriptio:

1 HTML HyperText Markup Language 7 1 HTML HyperText Markup Language HTML-kieli on tullut kuuluisaksi internetin graafisen palvelun, www:n, yleistymisen myötä. Se on yksikertaisimmillaan helppo, mutta myös monipuolinen www-sivujen kuvauskieli. 1.1 Internetin historiaa Tässä luvussa käydään aluksi läpi internetin historia, sen kehittyminen pienestä yliopistojen välisestä verkosta massiiviseksi koko maailman kattavaksi tiedonvaltatieksi sekä luodaan silmäys tulevaisuuteen. 1.1.1 Alku Erään teorian mukaan internetin idea olisi syntynyt kylmän sodan jälkipeleissä. USA:n hallitus säikähti silloisen Neuvostoliiton laukaistua Sputnikin 1957 ja otettua avaruuden herruuden itselleen. Vihamielisen hyökkäyksen ensimmäisinä kohteina olisivat tietysti viestintäjärjestelmät. Niinpä USA:n hallitus halusi tietoliikennejärjestelmän, joka kestäisi avaruudesta tulevan hyökkäyksen. Tämän järjestelmän, eli verkon tuli toimia niin, ettei muutaman solmun tuhoutuminen estäisi tiedon perille menoa. Olipa kylmällä sodalla osansa asiaan tai ei USA:n hallitus perusti ARPAn (Advanced Research Projects Agency). Vuonna 1969 ARPA loi ensimmäisen kokeellisen verkon, jonka nimeksi tuli ARPANET. Verkko oli täysin kokeellinen ja sitä käytettiin lähinnä verkkoteknologian tutkimiseen ja kehittämiseen. Aluksi verkossa oli vain neljä solmua eli neljä isäntäkonetta, jotka olivat yliopistojen koneita eri puolilta USA:ta. Nämä koneet pystyivät siirtämään tietoa koneiden välillä, ja koneita pystyttiin jopa ohjaamaan toiselta koneelta. Vuonna 1972 ARPANET-verkkoon oli kytketty jo 37 konetta. Myös ARPAn nimi muutettiin kyseisenä vuonna DARPAksi (Defence Advanced Research Projects Agency). ARPANETin tavoitteena oli kehittyä verkoksi, joka toimisi edelleen vaikka osa verkosta kaatuisi. Verkon protokollana oli aluksi ollut NCP (Network Control Protocol), mutta se oli sittemmin vaihdettu TCP/IP:ksi, joka osoittautui hyväksi protokollaksi.

8 1 HTML HyperText Markup Language 1.1.2 Kehitys Samaan aikaan käyttäjät olivat huomanneet, miten hyvä verkko oli kommunikoinnin välineenä. Jo toisena toimintavuonna ARPANETin liikenne koostui suurelta osin sähköpostiviesteistä. Verkko mahdollisti kätevän ja nopean viestinnän eri kohteiden välillä. Tutkijat kommunikoivat keskenään ja julkaisivat merkittäviä (ja miksei myös vähemmän tärkeitä) tutkimustuloksia verkon kautta, jolloin ne olivat heti muiden tutkijoiden käytössä. Vuonna 1973 keksittiin ensimmäinen lähiverkko ja tietokoneita alettiin liittää paikallisesti toisiinsa. ARPANET toimi selkärankaverkkona johon nämä lähiverkot voitiin liittää. Näin verkon käyttäjien määrä alkoi pikkuhiljaa nousta. Samoihin aikoihin kehitettiin myös telnet (1972) ja FTP (1973). Verkko pystyi nyt tarjoamaan hyviä palveluita kuten sähköposti ja tiedostojensiirto. Sen käyttäjämäärä alkoi nousta. Vuonna 1984 verkossa oli jo yli 1000 konetta. NSF (National Science Foundation) halusi tarjota supertietokoneiden käyttömahdollisuuden kaikille tutkijoille. Siihen asti supertietokoneita olivat saaneet käyttää ainoastaan asesuunnittelijat sekä suurimpien yritysten tutkijat. NSF rakensi viisi (erään lähteen mukaan kuusi) supertietokonekeskusta 80-luvun puolivälissä ja liitti ne toisiinsa (NSFNET). Sitten NSF:n tarvitsi jakaa tietokoneensa muulle maailmalle; se yritti ensin käyttää jo olemassa olevaa ARPANETiä, mutta yritys kaatui byrokratiaan ja henkilökuntaongelmiin. Niinpä NSF päätti rakentaa oman verkkonsa ja käytti verkossa ARPANETissä kehitettyä TCP/IP-teknologiaa. Seuraavaksi täytyi ratkaista ongelma, miten muut koneet (yliopistot, tutkimuskeskukset jne.) saataisiin liitettyä verkkoon. Olisi tullut aivan liian kalliiksi vetää kaapelit kaikkiin kohteisiin, ja siksipä NSF päätti tukea alueellisten verkkojen rakennusta. Nämä alueelliset verkot liitettiin sitten lähimpään naapuriin, jotka liitettiin lähimpään naapuriin ja lopulta NSFNET:iin eli supertietokoneverkkoon. Näin kaikki keskukset pystyivät kommunikoimaan toistensa kanssa. Tämän verkon yhteydessä alettiin käyttää nimitystä Internet. Internetin käyttäjät huomasivat, kuinka suuri tietovarasto heillä oli käytettävissään, ja ei mennyt kauaakaan, kun verkko oli liian hidas (vuonna 1987 jo 10 000 konetta). Tästä alkoi päivitysrumba, joka jatkuu yhä näinä päivinä. ARPANET jäi NSFNETin eli Internetin jalkoihin ja niinpä se kuihtui pois vuoteen 1990 mennessä.

1 HTML HyperText Markup Language 9 1.1.3 Www:n läpimurto Vuonna 1993 Tim Berners-Lee CERNistä (The European Laboratory for Particle Physics in Switzerland) julkaisi www:n (World Wide Web), joka käyttää HTTPprotokollaa sekä linkitettyä hypertekstiä. Tämä muutti tavan, jolla tieto oli järjestetty, esitetty ja haettu. Www:n hypertekstimuoto oli HTML. Hyperteksti on tekstiä, johon voidaan upottaa linkkejä toisille sivuille, kuvia, tiedostoja jne. Tämä mullisti Internetin käytön. Enää ei tarvinnut tietää toisista koneista mitään muuta kuin osoite, URL. Edes osoite ei ollut pakollinen, mielenkiintoisille sivuille pystyi löytämään myös selaamalla Internetiä seuraamalla mielenkiintoisia linkkejä sivuilta toisille. Tämä helpotti Internetin käyttöä ja niinpä Internetin koko kasvoi vuonna 1993 n. 340 000%. Vuosina 1993 ja 1994 ilmestyivät ensimmäiset graafiset www-selaimet Mosaic ja Netscape. Ne levisivät nopeasti Internetin kautta ja saavuttivat suurta suosiota. 90-luvun puolivälissä kaupallisuus alkoi näyttäytyä verkossa: eri palveluista laskutettiin luottokorttinumerolla tai postissa lähetettävällä laskulla, myöhemmin verkkorahalla. Kaupallistumisen alkuaikoina oli helposti havaittavissa, että uusi laaja markkinapaikka oli löydetty, mutta ei oikein tiedetty, mitä siellä voisi myydä ja miten. Verkosta tuli eräänlainen postimyyntiluettelo, joka ei tarjonnut perinteiseen luetteloon verrattuna muita etuja kuin sen, että tilaus oli perillä nopeammin. 1.1.4 Nykyaika ja tulevaisuus Vuosituhannen loppua kohti Internetissä alettiin myydä sähköisiä tuotteita: ohjelmia, kirjoja, jne. Esimerkiksi DataClubin sähköiseen kirjakauppaan voi käydä tutustumassa osoitteessa http://www.dataclub.fi josta voi tilata kirjoja sekä tutustua uusiin julkaisuihin. Nykyään Internetissä voi käydä tutustumassa erilaisiin museoihin, kansallispuistoihin, (tietysti) yrityksiin, siellä voi lukea uusimmat uutiset, sanomalehdet, sarjakuvat, kuunnella musiikkia, katsella musiikkivideoita, käydä videoneuvotteluita, puhua nettipuheluja, töllistellä nakukuvia, pelata uhkapeliä jne. Palveluita tulee koko ajan lisää ja niiden rajoitteena on teknologian lisäksi ainoastaan mielikuvitus. Tiedon paljouden (ja turhan tiedon) vuoksi tiedon löytäminen voi osoittautua vaikeaksi ellei jopa mahdottomaksi tehtäväksi. Käyttäjämäärän suuruuden vuoksi

10 1 HTML HyperText Markup Language anarkiset rynnäköt paikkoihin, jotka ovat in, saattavat jumiuttaa verkon. Siksi Internetin rinnalle on suunniteltu Internet 2 (I 2) -verkkoa, jonka siirtokapasiteetti on 2,4 gigabittiä sekunnissa (noin 39000 kertaa nopeampi kuin ISDN-yhteys). Tässä uudessa I 2:ssa tärkeällä tiedolla on etuajo-oikeus, mikä tarkoittaa sitä, että esim. kirurgin suorittaman leikkauksen vaatima yhteys on tärkeämpi kuin on-line pelin vaatima yhteys. 1.2 Kuinka Internet toimii Tässä luvussa käydään läpi internetin toiminta hyvin yleisellä tasolla. Ensin tutustutaan siihen, kuinka tietokoneet kommunikoivat verkossa, sitten tarkastellaan, kuinka tieto liikkuu verkossa ja lopuksi tutustutaan koneiden osoitteisiin. 1.2.1 Kommunikointi Internet toimii asiakas/palvelin-periaatteella. Palvelin on www-palvelin, FTPpalvelin, uutispalvelin tms. ja asiakas on tavallisen Internetin käyttäjän käyttämä www-selain, FTP-tiedonsiirto-ohjelma tms. Asiakkaan ja palvelimen kommunikoidessa ne eivät varaa jatkuvaa yhteyttä verkosta vaan yhteys muodostetaan ainoastaan tiedonsiirron ajaksi. Kun tieto on siirretty asiakkaalta palvelimelle tai päinvastoin, yhteys puretaan. Tyypillinen kommunikointi, jossa www-sivuja selaava käyttäjä haluaa selaimeensa sivun http://www.cs.uku.fi/ tapahtuu näin: 1. Käyttäjä kirjoittaa selaimensa URL-kenttään (Address tai Osoite) haluamansa osoitteen. 2. Selain ottaa yhteyden haluttuun palvelimeen ja lähettää sivupyynnön. 3. Palvelin ottaa vastaan sivupyynnön ja lähettää sivun vastaanottajalle. 4. Käyttäjän selain vastaanottaa palvelimen lähettämän ja tulkkaa sen luettavaan muotoon. Tämä oli erittäin paljon yksinkertaistettu malli käytännöstä. Todellisuudessa selaimen täytyy ensin kysyä nimipalvelimelta osoitetta vastaava IP-osoite (joka voisi esim. olla 204.123.2.69). Tämän jälkeen, kun selain tietää palvelimen oikean osoitteen, se pystyy lähestymään sitä pyyntöineen.

1.2.2 Tiedonsiirto 1 HTML HyperText Markup Language 11 Koska verkossa liikkuu paljon tietoa ja koska kaikki tieto on keskenään tasaarvoista, täytyy tieto siirtää pienissä paloissa, jotteivät isokokoiset siirrettävät tiedostot omi verkkoa itselleen ja näin ruuhkauta sitä. Verkossa liikkuva tieto liikkuu siis paketteina. Tätä kutsutaan pakettivälitteiseksi tiedonsiirroksi. Siirrettävä tiedosto pilkotaan paketeiksi jotka sisältävät kohdeosoitteen, lähdeosoitteen, itse datan, sekä tiedon siitä, missä järjestyksessä perille saapuneet paketit kootaan. Pakettia kutsutaan myös nimellä kehys. Tavallaanhan paketti kehystää sisältämänsä tiedot. Kehyksien rakenne riippuu käytettävästä standardista (esim. Ethernet, Token Ring, 802.x, jossa x:iä on useita). 802.x:stä, joista yleisin on ehkä 802.3, löytyy lisää tietoa IEEE:n kotisivuilta. IEEE:n kotisivuilta osoitteesta standards.ieee.org/index.html löytyy tietoa eri standardeista.

12 1 HTML HyperText Markup Language 1.2.3 Osoitteet Internetissä olevilla koneilla on siis kahdenlaisia osoitteita: IP-osoitteita ja DNSosoitteita. IP-osoite on muotoa 204.123.2.69 Osoitteessa on siis neljä numeroa, jotka erotetaan toisistaan pisteillä. Koska kone käsittelee kaikkea ykkösinä ja nollina, se näkee yllä olevan osoitteen binäärimuodossa 11001100 01111011 00000010 01000101 Koska ihmiset muistavat ja ymmärtävät paremmin tekstiä kuin numeroita, on koneilla myös IP-osoitteita vastaavat aluenimet (domain name). Nimipalvelin on se kone, joka tietää DNS-osoitteita vastaavat IP-osoitteet. Ylläolevan IPosoitteen DNS-osoite on altavista.digital.com Altavistan kotisivut, joilta voi etsiä tietoa joko hakusanalla tai aihealueittain.

1 HTML HyperText Markup Language 13 1.3 URL Tässä luvussa tarkastellaan URL:lia, mitä se on ja mistä se koostuu. Lisäksi luodaan silmäys virtuaalinen osoite käsitteeseen. 1.3.1 URL URL:n (Universal Resource Locator) avulla voidaan jokaisen verkossa olevan resurssin eli sivun, kuvan, videon jne. sijainti määritellä. URL koostuu kolmesta osasta: 1. Protokollaosa, joka kertoo millä menettelyllä (http, ftp, mailto, gopher, news, nntp, telnet, wais, file) resurssia voidaan käsitellä. 2. Isäntäkone, eli DNS- tai IP-osoite, jossa tavoiteltava palvelin sijaitsee. 3. Resurssin nimi ja polku. Esimerkki URL:sta http://www.mp3.com/artists/0/bjorn_lynne.html jossa protokollaosa on http, isäntäkone on www.mp3.com ja resurssin eli sivun polku ja nimi on artists/0/bjorn_lynne.html. Jos isäntäkoneen nimen ja/tai polun jälkeen ei ole resurssin eli tiedoston nimeä, viittaa kyseinen URL silloin index.html-tiedostoon (palvelimen konfiguraatiosta riippuen hakemiston oletustiedosto voi olla myös default.htm tai index.htm). 1.3.2 Virtuaalinen osoite Virtuaalinen osoite tarkoittaa sitä, että kaksi eri osoitetta (www.pankki.fi ja www.konehuolto.fi) voivat sijaita fyysisesti samalla palvelimella. Ne ovat eri hakemistoissa ja eri hakemistoihin viitataan vain eri osoitteella. DNS-osoitteita ei voi noin vain päättää ja kirjoittaa omalle palvelimelle vaan ne täytyy anoa ja rekisteröidä. Useat yritykset rekisteröivät haluamasi nimen (jos se on mahdollista) 2000 3000 markan summasta ja näin ollen sinun ei itse tarvitse uhrata aikaa tai rahaa rekisteröimiskäytännön selvittämiseen.

14 1 HTML HyperText Markup Language 1.4 HTML:n historia Olisi väärin olla kertomatta HTML:ää käsittelevässä kirjassa mitään HTML:n historiasta. HTML pohjautuu rakenteisiin dokumentteihin ja siksipä heti aluksi tutustutaan niihin. Seuraavaksi käydään pikaisesti läpi HTML:n eri kehitysversiot sekä tutustutaan yhden yhteisen määritelmän etuun. Lopuksi tarkastellaan tulevaisuutta sekä XML:ää. 1.4.1 Rakenteiset dokumentit Rakenteinen dokumentti tarkoittaa sitä, että dokumentti ei sisällä ohjaustietoa (esim. lihavointi tai fonttikoko) vaan se sisältää tiedon tekstin tyypistä (otsikko, normaaliteksti jne.). Lihavoinnit ja muut ohjaustiedot on yleensä koodattu dokumenttiin sovelluskohtaisesti. Tällöin ne eivät ole helposti siirrettävissä toiseen muotoon. Rakenteisilla dokumenteilla saavutetaan se etu, että dokumentti voidaan helposti esittää eri kielioppien avulla eri muodoissa (esim. HTML ja PostScript). HTML ei ole puhdas rakenteisen dokumentoinnin kieli, koska siinä on tageja, jotka ohjaavat tiedon esitystä (<B>=bold=lihavoitu), mutta tieto esitetään HTMLdokumentissa rakenteisesti. HTML:ssä rakenteet esitetään elementeillä. Elementti koostuu alkutagista, sisällöstä ja mahdollisesta lopputagista. Elementin alkua tai loppua (<HTML> tai </HTML>) kutsutaan siis tagiksi, kun taas tagit sisältönsä kanssa muodostavat elementin. Vaikka näitä sanoja yleisesti käytetään toistensa synonyymeinä, tässä kirjassa elementillä tarkoitetaan koko elementtiä ja tagilla alku- tai lopputagia. <TITLE>Tämä on dokumentin otsikko.</title> Ylläolevassa esimerkissä TITLEä kutsutaan tagiksi ja koko rakennetta elementiksi. 1.4.2 Versiot HTML esiteltiin 1993. Sen oli kehittänyt Tim Berners-Lee CERNistä (The European Laboratory for Particle Physics in Switzerland). Sen jälkeen sitä on kehitetty monilla eri tavoilla ja monien eri kehittäjien toimesta. Koska kaikkien tietoa Internetissä julkaisevien täytyisi kuitenkin käyttää samaa kieltä (jotta selaimet pystyisivät tulkitsemaan sen tarkoitettuun muotoon) onnistuttiin HTML:n myöhempienkin versioiden määritelmät pitämään hallittavissa.

1 HTML HyperText Markup Language 15 Vuonna 1995 julkaistiin IETF:n (Internet Engineering Task Force) kehittämä HTML 2.0, joka oli tehty HTML-dokumenttien teossa vuoden 1994 lopulla käytetyn yleisen käytännön mukaan. Vuoden 1996 tammikuussa julkaistiin HTML 3.2. Se toi jälleen uusia ominaisuuksia edeltäjäänsä verrattuna. Tällä hetkellä uusin versio on HTML 4.0. Mm. W3C on julkaissut HTML 4.0 -määritykseksi suosituksen, jonka uusin versio löytyy osoitteesta http://www.w3.org/tr/1998/rec-html40 1.4.3 Yhteisen määritelmän etu Jo varhaisessa vaiheessa huomattiin kuinka tärkeää on, että sivujen tekijät tekevät sivuja yhden yhteisen määritelmän mukaan. Tällöin sivujen pitäisi näyttää kaikilla selaimilla katsottuna samanlaiselta. Kuitenkin suosituimmat selaimet tukevat yhteisen määritelmän lisäksi myös muutamia omia tagejaan. Sivuntekijän täytyy yleensä optimoida sivunsa jommallekummalle (Netscape tai Microsoft) suosituimmalle selaimelle. 1.4.4 Tulevaisuus ja XML HTML:n ongelma on siinä, ettei sillä voi määritellä uusia tageja. Olemassa olevien tagien määrityksiä voi toki muuttaa joko style sheetsien avulla tai muokkaamalla DTD:tä (Document Type Definition) suoraan HTML-sivulla. HTML on lisäksi melko rajoitettu ilmaisuvoimaltaan. Suurin ongelma ei kuitenkaan ole tiedon esittäminen vaan sen löytäminen. Jokainen, joka on joskus käyttänyt jotain Internetin hakukonetta (esim. Altavista), tietää ettei tiedon löytäminen nykyisestä Internetistä ole aina helppoa. Tämä johtuu lähinnä siitä, ettei tietoa voi etsiä dokumenttien rakenteista (esim. haettaisiin kaikki ne dokumentit, joissa on taulukko, jonka otsikkona on videokamerat). Suurelta osin hakua vaikeuttavat myös www:n tavat käsitellä ja hakea tietoa. Hakukoneet (esim. Altavista) nimittäin keräävät dokumentit tekstitiedostoksi ja kohdistavat haun tähän tiedostoon. Ratkaisuiksi näihin ongelmiin on tarjottu XML:ää (Extensible Markup Language). Se on metakieli, joka soveltuu kaikenlaisen tiedon esittämiseen ja on helposti laajennettavissa. XML:n avulla voidaan siis määritellä uusia kieliä, itse

16 1 HTML HyperText Markup Language asiassa ääretön määrä (joista yksi voisi olla nykyinen HTML). XML:n periaate on, että muotoilu erotetaan sisällöstä. Tällöin sisältötiedostossa lukee ainoastaan OTSIKKO1 ja muotoilutiedostossa on määritelty, kuinka OTSIKKO1 esitetään (millä fontilla, koolla, asettelulla jne.). XML mahdollistaa myös tehokkaan haun dokumentin eri rakenteista.