5 Kertaluokkamerkinnät

Samankaltaiset tiedostot
4 Tehokkuus ja algoritmien suunnittelu

f(n) = Ω(g(n)) jos ja vain jos g(n) = O(f(n))

TIE Tietorakenteet ja algoritmit 25

Algoritmit 1. Luento 2 Ke Timo Männikkö

Algoritmit 2. Luento 1 Ti Timo Männikkö

9 Erilaisia tapoja järjestää

1 Erilaisia tapoja järjestää

Pikalajittelu: valitaan ns. pivot-alkio esim. pivot = oikeanpuoleisin

Algoritmit 1. Luento 11 Ti Timo Männikkö

1.4 Funktioiden kertaluokat

Algoritmit 1. Luento 12 Ti Timo Männikkö

811312A Tietorakenteet ja algoritmit Kertausta kurssin alkuosasta

Algoritmit 1. Luento 12 Ke Timo Männikkö

811312A Tietorakenteet ja algoritmit Kertausta kurssin alkuosasta

Algoritmit 1. Demot Timo Männikkö

Algoritmit 1. Luento 3 Ti Timo Männikkö

Algoritmit 2. Luento 14 Ke Timo Männikkö

Algoritmit 2. Luento 8 To Timo Männikkö

Tämä on helpompi ymmärtää, kun tulkitaan keko täydellisesti tasapainotetuksi binääripuuksi, jonka juuri on talletettu taulukon paikkaan

811312A Tietorakenteet ja algoritmit III Lajittelualgoritmeista

Algoritmit 2. Luento 7 Ti Timo Männikkö

Algoritmit 1. Demot Timo Männikkö

Algoritmit 2. Demot Timo Männikkö

A TIETORAKENTEET JA ALGORITMIT

On annettu jono lukuja tai muita alkioita, joiden välille on määritelty suuruusjärjestys. Tehtävänä on saattaa alkiot suuruusjärjestykseen.

Tietorakenteet ja algoritmit - syksy

1 Puu, Keko ja Prioriteettijono

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

58131 Tietorakenteet ja algoritmit (kevät 2016) Ensimmäinen välikoe, malliratkaisut

Algoritmit 1. Luento 1 Ti Timo Männikkö

Algoritmien suunnittelu ja analyysi (kevät 2004) 1. välikoe, ratkaisuja

58131 Tietorakenteet (kevät 2009) Harjoitus 9, ratkaisuja (Antti Laaksonen)

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

Olkoon S(n) kutsun merge-sort(a, p, q) tilavaativuus kun p q + 1 = n. Oletetaan merge toteutetuksi vakiotyötilassa (ei-triviaalia mutta mahdollista).

Tietorakenteet, laskuharjoitus 2,

ALGORITMIT 1 DEMOVASTAUKSET KEVÄT 2012

Algoritmit 2. Luento 2 To Timo Männikkö

Algoritmianalyysin perusteet

Lähteet. OHJ-2010 TIETORAKENTEIDEN KÄYTTÖ lukuvuosi Terhi Kilamo

Tarkennamme geneeristä painamiskorotusalgoritmia

811312A Tietorakenteet ja algoritmit, , Harjoitus 7, ratkaisu

58131 Tietorakenteet ja algoritmit (syksy 2015)

Algoritmit 2. Luento 13 Ti Timo Männikkö

TAMPEREEN TEKNILLINEN YLIOPISTO

Algoritmit 1. Luento 14 Ke Timo Männikkö

Algoritmit 2. Luento 2 Ke Timo Männikkö

Tietorakenteet, laskuharjoitus 7, ratkaisuja

Tiraka, yhteenveto tenttiinlukua varten

(p j b (i, j) + p i b (j, i)) (p j b (i, j) + p i (1 b (i, j)) p i. tähän. Palaamme sanakirjaongelmaan vielä tasoitetun analyysin yhteydessä.

Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms.

811312A Tietorakenteet ja algoritmit, , Harjoitus 3, Ratkaisu

Algoritmit 2. Luento 3 Ti Timo Männikkö

Algoritmit 2. Luento 3 Ti Timo Männikkö

Algoritmit 1. Demot Timo Männikkö

Tietorakenteet, laskuharjoitus 3, ratkaisuja

8. Lajittelu, joukot ja valinta

Algoritmit 1. Demot Timo Männikkö

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

811312A Tietorakenteet ja algoritmit , Harjoitus 2 ratkaisu

Tutkimusmenetelmät-kurssi, s-2004

Algoritmit 2. Luento 6 To Timo Männikkö

811312A Tietorakenteet ja algoritmit I Johdanto

4. Algoritmien tehokkuus

Diskreetin matematiikan perusteet Laskuharjoitus 2 / vko 9

58131 Tietorakenteet (kevät 2009) Harjoitus 6, ratkaisuja (Antti Laaksonen)

Algoritmit 1. Luento 10 Ke Timo Männikkö

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

Hakupuut. tässä luvussa tarkastelemme puita tiedon tallennusrakenteina

Nopea kertolasku, Karatsuban algoritmi

TAMPEREEN TEKNILLINEN YLIOPISTO

Luku 6. Dynaaminen ohjelmointi. 6.1 Funktion muisti

1 Raja-arvo. 1.1 Raja-arvon määritelmä. Raja-arvo 1

Tietorakenteet, laskuharjoitus 10, ratkaisuja. 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Algoritmit 2. Luento 13 Ti Timo Männikkö

9.3 Algoritmin valinta

Vaihtoehtoinen tapa määritellä funktioita f : N R on

811120P Diskreetit rakenteet

Algoritmit 2. Luento 14 To Timo Männikkö

Rekursio. Funktio f : N R määritellään yleensä antamalla lauseke funktion arvolle f (n). Vaihtoehtoinen tapa määritellä funktioita f : N R on

Tietorakenteet ja algoritmit. Järjestäminen. Ari Korhonen

58131 Tietorakenteet Erilliskoe , ratkaisuja (Jyrki Kivinen)

Rekursioyhtälön ratkaisutapa #1: iteratiivinen korvaus

Algoritmit 2. Luento 13 Ti Timo Männikkö

4.3. Matemaattinen induktio

811120P Diskreetit rakenteet

3. Laskennan vaativuusteoriaa

811312A Tietorakenteet ja algoritmit, VI Algoritmien suunnitteluparadigmoja

Tietorakenteet ja algoritmit syksy Laskuharjoitus 1

Algoritmit 2. Luento 6 Ke Timo Männikkö

811120P Diskreetit rakenteet

AVL-puut. eräs tapa tasapainottaa binäärihakupuu siten, että korkeus on O(log n) kun puussa on n avainta

Kohdissa 2 ja 3 jos lukujen valintaan on useita vaihtoehtoja, valitaan sellaiset luvut, jotka ovat mahdollisimman lähellä listan alkua.

2. Eukleideen algoritmi

Tietorakenteet (syksy 2013)

Tietorakenteet ja algoritmit

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

ICS-C2000 Tietojenkäsittelyteoria Kevät 2016

1.1 Tavallinen binäärihakupuu

Johdatus diskreettiin matematiikkaan Harjoitus 5, Ratkaise rekursioyhtälö

4. Joukkojen käsittely

Transkriptio:

TIE-20100 Tietorakenteet ja algoritmit 75 5 Kertaluokkamerkinnät Tässä luvussa käsitellään asymptoottisessa analyysissa käytettyjä matemaattisia merkintätapoja Määritellään tarkemmin Θ, sekä kaksi muuta saman sukuista merkintää O ja Ω.

TIE-20100 Tietorakenteet ja algoritmit 76 5.1 Asymptoottinen aika-analyysi Edellisessä luvussa yksinkertaistimme suoritusajan lauseketta melkoisesti: jätimme jäljelle ainoastaan eniten merkitsevän termin poistimme sen edestä vakiokertoimen kuvastavat algoritmin käyttäytymistä, kun syötekoko kasvaa kohti ääretöntä siis kuvaavat asymptoottista suorituskykyä antavat käyttökelpoista tietoa vain jotain rajaa suuremmilla syötteillä todettiin, että usein raja on varsin alhaalla Θ- yms. merkintöjen mukaan nopein on myös käytännössä nopein, paitsi aivan pienillä syötteillä

TIE-20100 Tietorakenteet ja algoritmit 77 Θ-merkintä Kuva 8: Θ-merkintä

TIE-20100 Tietorakenteet ja algoritmit 78 eli matemaattisesti olkoon g(n) funktio luvuilta luvuille Θ(g(n)) on niiden funktioiden f(n) joukko, joille on olemassa positiiviset vakiot c 1, c 2 ja n 0 siten, että aina kun n n 0, niin 0 c 1 g(n) f(n) c 2 g(n) Θ(g(n)) on joukko funktioita tulisi kirjoittaa esim. f(n) Θ(g(n)) ohjelmistotieteessä vakiintunut käytäntö kuitenkin on käyttää = -merkintää

TIE-20100 Tietorakenteet ja algoritmit 79 Funktion f(n) kuuluvuuden kertaluokkaan Θ(g(n)), voi siis todistaa etsimällä jotkin arvot vakioille c 1, c 2 ja n 0 ja osoittamalla, että funktion arvo pysyy n:n arvoilla n 0 :sta alkaen arvojen c 1 g(n) ja c 2 g(n) välillä (eli suurempana tai yhtäsuurena kuin c 1 g(n) ja pienempänä tai yhtäsuurena, kuin c 2 g(n)). Esimerkki: 3n 2 + 5n 20 = Θ(n 2 ) valitaan c 1 = 3, c 2 = 4 ja n 0 = 4 0 3n 2 3n 2 + 5n 20 4n 2 kun n 4, koska silloin 0 5n 20 n 2 yhtä hyvin olisi voitu valita c 1 = 2, c 2 = 6 ja n 0 = 7 tai c 1 = 0,000 1, c 2 = 1 000 ja n 0 = 1 000 tärkeää on vain, että voidaan valita jotkut positiiviset, ehdot täyttävät c 1, c 2 ja n 0

TIE-20100 Tietorakenteet ja algoritmit 80 Tärkeä tulos: jos a k > 0, niin a k n k + a k 1 n k 1 + + a 2 n 2 + a 1 n + a 0 = Θ(n k ) toisin sanoen, jos polynomin eniten merkitsevän termin kerroin on positiivinen, Θ-merkintä sallii kaikkien muiden termien sekä e.m. kertoimen abstrahoinnin pois Vakiofunktiolle pätee c = Θ(n 0 ) = Θ(1) Θ(1) ei kerro, minkä muuttujan suhteen funktioita tarkastellaan sitä saa käyttää vain kun muuttuja on asiayhteyden vuoksi selvä yleensä algoritmien tapauksessa on

TIE-20100 Tietorakenteet ja algoritmit 81 O-merkintä Kuva 9: O-merkintä

TIE-20100 Tietorakenteet ja algoritmit 82 O-merkintä on muuten samanlainen kuin Θ-merkintä, mutta se rajaa funktion ainoastaan ylhäältä. asymptoottinen yläraja Määritelmä: O(g(n)) on niiden funktioiden f(n) joukko, joille on olemassa positiiviset vakiot c ja n 0 siten, että aina kun n n 0, niin 0 f(n) c g(n)

TIE-20100 Tietorakenteet ja algoritmit 83 pätee: jos f(n) = Θ(g(n)), niin f(n) = O(g(n)) päinvastainen ei aina päde: n 2 = O(n 3 ), mutta n 2 Θ(n 3 ) tärkeä tulos: jos k m, niin n k = O(n m ) jos hitaimman tapauksen suoritusaika on O(g(n)), niin jokaisen tapauksen suoritusaika on O(g(n))

TIE-20100 Tietorakenteet ja algoritmit 84 Usein algoritmin hitaimman (ja samalla jokaisen) tapauksen suoritusajalle saadaan pelkällä vilkaisulla jokin O-merkinnällä ilmoitettava yläraja. Usein vain yläraja onkin kiinnostava O-merkinnällä on suuri käytännön merkitys

TIE-20100 Tietorakenteet ja algoritmit 85 Esimerkki: INSERTION-SORT rivi kerta-aika for j := 2 to A.length do O(n) key := A[j] O(1) i := j 1 O(1) while i > 0 and A[i] > key do O(n) A[i + 1] := A[i] O(1) i := i 1 O(1) A[i + 1] := key O(1) Jolloin pahimmalle tapaukselle saadaan suoritusaika O(n) O(n) O(1) = O(n 2 )

TIE-20100 Tietorakenteet ja algoritmit 86 Ω-merkintä (äännetään iso oomega ) Kuva 10: Ω-merkintä

TIE-20100 Tietorakenteet ja algoritmit 87 Ω-merkintä on muuten täysin samanlainen kuin Θ-merkintä, mutta se rajaa funktion vain alhaalta. asymptoottinen alaraja määritelmä: Ω(g(n)) on niiden funktioiden f(n) joukko, joille on olemassa positiiviset vakiot c ja n 0 siten, että aina kun n n 0, niin 0 c g(n) f(n)

TIE-20100 Tietorakenteet ja algoritmit 88 määritelmistä seuraa tärkeä tulos: f(n) = Θ(g(n)) jos ja vain jos f(n) = O(g(n)) ja f(n) = Ω(g(n)). jos nopeimman tapauksen suoritusaika on Ω(g(n)), niin jokaisen tapauksen suoritusaika on Ω(g(n)) Käytännön hyötyä Ω-merkinnästä on lähinnä tilanteissa, joissa jonkin ratkaisuvaihtoehdon parhaan tapauksenkin tehokkuus on epätyydyttävä, jolloin ratkaisu voidaan hylätä välittömästi.

TIE-20100 Tietorakenteet ja algoritmit 89 Merkintöjen keskinäiset suhteet f(n) = Ω(g(n)) ja f(n) = O(g(n)) f(n) = Θ(g(n)) Kertaluokkamerkinnöillä on samankaltaisia ominaisuuksia kuin lukujen vertailuilla: f(n) = O(g(n)) f(n) = Θ(g(n)) f(n) = Ω(g(n)) a b a = b a b Eli, jos f(n):n korkeimman asteen termi, josta on poistettu vakiokerroin g(n): n vastaava, f(n) = O(g(n)) jne. Yksi merkittävä ero: reaaliluvuille pätee aina tasan yksi kaavoista a < b, a = b ja a > b, mutta vastaava ei päde kertaluokkamerkinnöille. Kaikkia funktioita ei pysty mielekkäällä tavalla vertaamaan toisiinsa kertaluokkamerkintöjen avulla (esim. n ja n 1+sin n ).

TIE-20100 Tietorakenteet ja algoritmit 90 Hieman yksinkertaisten: Jos algoritmi on Ω(g(n)), sen resurssien kulutus on ainakin kertaluokassa g(n). vrt. kirja maksaa ainakin noin kympin. Jos algoritmi on O(g(n)), sen resurssien kulutus on korkeintaan kertaluokassa g(n). vrt. kirja maksaa korkeintaan noin kympin. Jos algoritmi on Θ(g(n)), sen resurssien kulutus on aina kertaluokassa g(n). vrt. kirja maksaa suunnilleen kympin.

TIE-20100 Tietorakenteet ja algoritmit 91 Kaikkien algoritmien kaikkien tapausten suoritusajalle ei välttämättä voida antaa mitään ratkaisua Θ-notaatiolla. Esimerkkinä Insertion-Sort: paras tapaus on Ω(n), mutta ei Ω(n 2 ) pahin tapaus on O(n 2 ), mutta ei O(n) kaikille tapauksille yhteistä Θ-arvoa ei voida määrittää

TIE-20100 Tietorakenteet ja algoritmit 92 Esimerkki 800 700 f(n) Otetaan funktio f(n) = 3n 2 + 5n + 2. Suoritetaan sille aiemmin sovitut yksinkertaistukset: alemman asteen termit pois vakiokertoimet pois f(n) = Θ(n 2 ) Vakuuttuaksemme asiasta etsimme kertoimet c 1 ja c 2 : 3n 2 3n 2 + 5n + 2 4n 2, kun n 6 c 1 = 3, c 2 = 4 ja n 0 = 6 toimivat f(n) = O(n 2 ) ja Ω(n 2 ) f(n) = Θ(n 2 ) 600 500 400 300 200 100 0 0 5 10 15 800 700 600 500 400 300 200 100 n0 4n² 0 0 5 10 15 n² 3n²

TIE-20100 Tietorakenteet ja algoritmit 93 800 Selvästi kerroin c2 = 4 toimii myös kun g(n) = n3, sillä kun n 6, n3 > n2 f (n) = O(n3) sama pätee kun g(n) = n4... 4n³ 600 3n² 500 400 n0 300 Ja alapuolella kerroin c1 = 3 toimii myös kun g(n) = n lg n, sillä kun n 6, n2 > n lg n f (n) = Ω(n lg n) sama pätee kun g(n) = n tai g(n) = lg n 4n² 700 3nlog(n) 200 100 0 3n 0 5 10 15

TIE-20100 Tietorakenteet ja algoritmit 94 5.2 Suorituskykykäsitteitä Tähän mennessä algoritmien suorituskykyä on arvioitu lähinnä suoritusajan näkökulmasta. Muitakin vaihtoehtoja kuitenkin on: Voidaan mitata myös esimerkiksi muistinkulutusta tai kaistanleveyttä. Lisäksi käytännössä tulee ottaa huomioon ainakin seuraavat seikat: Millä mittayksiköllä resurssien kulutusta mitataan? Miten syötekoko määritellään? Mitataanko huonoimman, parhaan vai keskimääräisen tapauksen resurssien kulutusta? Millaiset syötekoot tulevat kysymykseen? Riittääkö kertaluokkamerkintöjen tarkkuus vai tarvitaanko tarkempaa tietoa?

TIE-20100 Tietorakenteet ja algoritmit 95 Ajoajan mittayksiköt Valittaessa ajoajan mittayksikköä askelta pyritään yleensä mahdollisimman koneriippumattomaan ratkaisuun: Todelliset aikayksiköt kuten sekunti eivät siis kelpaa. Vakiokertoimet käyvät merkityksettömiksi. Jäljelle jää kertaluokkamerkintöjen tarkkuustaso. askeleeksi voidaan katsoa mikä tahansa enintään vakioajan vievä operaatio. Vakioaikaiseksi tulkitaan mikä tahansa operaatio, jonka ajankulutus on riippumaton syötekoosta. Tällöin on olemassa jokin syötteen koosta riippumaton aikamäärä, jota operaation kesto ei milloinkaan ylitä. Yksittäisiä askeleita ovat esimerkiksi yksittäisen muuttujan sijoitus, if-lauseen ehdon testaus etc. Askeleen rajauksen kanssa ei tarvitse olla kovin tarkka, koska Θ(1) + Θ(1) = Θ(1).

TIE-20100 Tietorakenteet ja algoritmit 96 Muistin käytön mittayksiköt Tarkkoja yksiköitä ovat lähes aina bitti, tavu (8 bittiä) ja sana (jos sen pituus tunnetaan). Eri tyyppien muistin käyttö on usein tunnettu, joskin se vaihtelee vähän eri tietokoneiden ja kielten välillä. kokonaisluku on yleensä 16 tai 32 bittiä merkki on yleensä 1 tavu = 8 bittiä osoitin on yleensä 4 tavua = 32 bittiä taulukko A[1... n] on usein n <alkion koko> Tarkka muistin käytön arvioiminen on usein mahdollista, joskin huolellisuutta vaativaa.

TIE-20100 Tietorakenteet ja algoritmit 97 Kertaluokkamerkinnät ovat käteviä silloin, kun tarkka tavujen laskeminen ei ole vaivan arvoista. Jos algoritmi säilyttää yhtäaikaa koko syöteaineiston, niin arvioinnissa kannattaa erottaa syöteaineiston kuluttama muisti muusta muistin tarpeesta. Θ(1) lisämuistin tarve vs. Θ(n) lisämuistin tarve Kannattaa kuitenkin huomata, että esimerkiksi merkkijonon etsintä syötetiedostosta ei talleta yhtäaikaa koko syöteaineistoa, vaan selaa sen läpi.

TIE-20100 Tietorakenteet ja algoritmit 98 6 Pikalajittelu ja satunnaistaminen MERGE-SORTilla osaongelmiin jako oli helppoa ja ratkaisujen yhdistämisessä nähtiin paljon työtä. Tutustutaan seuraavaksi keskimäärin erittäin nopeaan järjestämisalgoritmiin QUICKSORT, jossa työ tehdään jakovaiheessa. QUICKSORTin kautta kohdataan uusi suunnitteluperiaate: satunnaistaminen.

TIE-20100 Tietorakenteet ja algoritmit 99 6.1 QUICKSOR T Ongelman jakaminen pienemmiksi osaongelmiksi Valitaan jokin taulukon alkioista jakoalkioksi eli pivot-alkioksi. Muutetaan taulukon alkioiden järjestystä siten, että kaikki jakoalkiota pienemmät tai yhtäsuuret alkiot ovat taulukossa ennen jakoalkiota ja suuremmat alkiot sijaitsevat jakoalkion jälkeen. Jatketaan alku ja loppuosien jakamista pienemmiksi, kunnes ollaan päästy 0:n tai 1:n kokoisiin osataulukoihin.

TIE-20100 Tietorakenteet ja algoritmit 100 Kertaus: QUICKSORT-algoritmi QUICKSORT( A, left, right ) 1 if lef t < right then (triviaalitapaukselle ei tehdä mitään) 2 p := PARTITION( A, lef t, right )(muuten jaetaan alkuosaan ja loppuosaan) 3 QUICKSORT( A, lef t, p 1 ) (järjestetään jakoalkiota pienemmät) 4 QUICKSORT( A, p + 1, right ) (järjestetään jakoalkiota suuremmat) Kuva 11: Jako pienempiin ja suurempiin

TIE-20100 Tietorakenteet ja algoritmit 101 Pienet osaongelmat: 0:n tai 1:n kokoiset osataulukot ovat valmiiksi järjestyksessä. Järjestyksessä olevien osataulukoiden yhdistäminen: Kun alkuosa ja loppuosa on järjestetty on koko (osa)taulukko automaattisesti järjestyksessä. kaikki alkuosan alkiothan ovat loppuosan alkioita pienempiä, kuten pitääkin Ositus- eli partitiointialgoritmi jakaa taulukon paikallaan vaaditulla tavalla. PARTITION( A, left, right ) 1 p := A[ right ] (otetaan pivotiksi viimeinen alkio) 2 i := left 1 (merkitään i:llä pienten puolen loppua) 3 for j := left to right 1 do (käydään läpi toiseksi viimeiseen alkioon asti) 4 if A[ j ] p (jos A[ j] kuuluu pienten puolelle...) 5 i := i + 1 (... kasvatetaan pienten puolta...) 6 exchange A[ i ] A[ j ] (... ja siirretään A[j] sinne) 7 exchange A[ i + 1 ] A[ right ] (sijoitetaan pivot pienten ja isojen puolten väliin) 8 return i + 1 (palautetaan pivot-alkion sijainti)

TIE-20100 Tietorakenteet ja algoritmit 102 Kuinka nopeasti PARTITION toimii? For-silmukka tekee n - 1 kierrosta, kun n on right - left Kaikki muut operaatiot ovat vakioaikaisia. Sen suoritusaika on Θ(n). Kuten MERGE-SORTilla QUICKSORTin analyysi ei ole yhtä suoraviivainen rekursion vuoksi

TIE-20100 Tietorakenteet ja algoritmit 103 Koska PARTITIONIA ja rekursiivista kutsua lukuunottamatta kaikki QUICKSORTIN operaatiot ovat vakioaikaisia, keskitymme tarkastelemaan PARTITIONIN instanssien käyttämää aikaa. n n 1 n n 1 1 n n n 1 2 1 2 1 1 1 1 1 1 1

TIE-20100 Tietorakenteet ja algoritmit 104 Kokonaisaika on edellisen kuvan esittämän puun solmujen aikojen summa. 1 kokoiselle taulukolle suoritus on vakioaikaista. Muille suoritus on lineaarista osataulukon kokoon nähden. Kokonaisaika on siis Θ(solmujen numeroiden summa).

TIE-20100 Tietorakenteet ja algoritmit 105 Pahimman tapauksen suoritusaika Solmun numero on aina pienempi kuin isäsolmun numero, koska jakoalkio on jo oikealla paikallaan, eikä se kuulu kumpaankaan järjestettävään osataulukkoon puussa voi siis olla kerroksia enintään n kappaletta pahin tapaus realisoituu, kun jakoalkioksi valitaan aina pienin tai suurin alkio näin tapahtuu esimerkiksi valmiiksi järjestetyllä taulukolla solmujen numeroiden summa on n + n - 1 + + 2 + 1 QUICKSORTIN suoritusaika on O(n 2 ) n n 1 n 2 k 2 1

TIE-20100 Tietorakenteet ja algoritmit 106 O(n) O(n) O(n) Paras tapaus realisoituu kun taulukko jakautuu aina tasan. Alla oleva kuva näyttää kuinka osataulukoiden koot pienenevät. harmaat ruudut ovat jo oikealla paikallaan olevia alkioita Jokaisella tasolla tehtävä työ on kertaluokassa Θ(n). tästä saamme pessimistisen arvion suorituspuun korkeudelle parhaassa tapauksessa O(lg n) Parhaan tapauksen suoritusajan yläraja on O(n lg n). O(n) O(lg n) O(n)

TIE-20100 Tietorakenteet ja algoritmit 107 QUICKSORTIN kohdalla parhaan ja huonoimman tapauksen suoritusajat eroavat toisistaan selvästi. Olisi mielenkiintoista tietää keskimääräinen suoritusaika. Sen analysoiminen menee tämän kurssin tavoitteiden ulkopuolelle, mutta on osoitettu, että jos aineisto on tasajakautunutta, keskimääräinen suoritusaika on Θ(n lg n). Keskimääräinen suoritusaika on siis varsin hyvä.

TIE-20100 Tietorakenteet ja algoritmit 108 QUICKSORTIIN liittyy kuitenkin se kiusallinen seikka, että sen pahimman tapauksen suoritus on hidasta ja sen esiintyminen on käytännössä varsin todennäköistä. On helppoa kuvitella tilanteita, joissa aineisto on jo järjestyksessä tai melkein järjestyksessä. Tarvitaan keino, jolla pahimman tapauksen systemaattisen esiintymisen riskiä saadaan pienennettyä. Satunnaistaminen on osoittautunut tässä varsin tehokkaaksi.

TIE-20100 Tietorakenteet ja algoritmit 109 QUICKSORTIN etuja ja haittoja Etuja: järjestää taulukon keskimäärin erittäin tehokkaasti ajoaika on keskimäärin Θ(n lg n) vakiokerroin on pieni tarvitsee vain vakiomäärän lisämuistia sopii hyvin virtuaalimuistiympäristöön käyttää tehokkaasti välimuistia Haittoja: ajoaika on hitaimmillaan Θ(n 2 ) hitaimman tapauksen tuottava syöte on kiusallisen tavallinen ilman satunnaistamista rekursiivisuus tarvitsee lisämuistia pinolle epävakaus

TIE-20100 Tietorakenteet ja algoritmit 110 6.2 Suunnitteluperiaate: Satunnaistaminen Satunnaista on eräs algoritmien suunnitteluperiaatteista. Sen avulla voidaan usein estää huonoimpien tapausten patologinen ilmeneminen. Parhaan ja huonoimman tapauksen suoritusajat eivät useinkaan muutu, mutta niiden esiintymistodennäköisuus käytännössä laskee. Huonot syötteet ovat täsmälleen yhtä todennäköisiä kuin mitkä tahansa muut syötteet riippumatta alkuperäisestä syötteiden jakaumasta. Satunnaistaminen voidaan suorittaa joko ennen algoritmin suoritusta satunnaistamalla sen saama syöteaineisto tai upottamalla satunnaistaminen algoritmin sisälle. jälkimmäisellä tavalla päästään usein parempaan tulokseen usein se on myös helpompaa kuin syötteen esikäsittely

TIE-20100 Tietorakenteet ja algoritmit 111 Satunnaistaminen on hyvä ratkaisu yleensä silloin, kun algoritmi voi jatkaa suoritustaan monella tavalla on vaikea arvata etukäteen, mikä tapa on hyvä suuri osa tavoista on hyviä muutama huono arvaus hyvien joukossa ei haittaa paljoa Esimerkiksi QUICKSORT voi valita jakoarvoksi minkä tahansa taulukon alkion hyviä valintoja ovat kaikki muut, paitsi lähes pienimmät ja lähes suurimmat taulukossa olevat arvot on vaikea arvata valintaa tehdessä, onko ko. arvo lähes pienin / suurin muutama huono arvaus silloin tällöin ei turmele QUICKSORTin suorituskykyä satunnaistaminen sopii QUICKSORTille

TIE-20100 Tietorakenteet ja algoritmit 112 Satunnaistamisen avulla voidaan tuottaa algoritmi RANDOMIZED-QUICKSORT, joka käyttää satunnaistettua PARTITIONIA. Ei valita jakoarvoksi aina A[ right ]:tä, vaan valitaan jakoarvo satunnaisesti koko osataulukosta. Jotta PARTITION ei menisi rikki, sijoitetaan jakoarvo silti kohtaan right taulukkoa Nyt jako on todennäköisesti melko tasainen riippumatta siitä, mikä syöte saatiin ja mitä taulukolle on jo ehditty tehdä.

TIE-20100 Tietorakenteet ja algoritmit 113 RANDOMIZED-PARTITION( A, lef t, right ) 1 p := RANDOM(lef t, right) (valitaan satunnainen alkio pivotiksi) 2 exchange A[ right ] A[ p ] (asetetaan se taulukon viimeiseksi) 3 return PARTITION( A, lef t, right ) (kutsutaan tavallista partitiointia) RANDOMIZED-QUICKSORT( A, lef t, right ) 1 if left < right then 2 p := RANDOMIZED-PARTITION( A, lef t, right ) 3 RANDOMIZED-QUICKSORT( A, left, p 1 ) 4 RANDOMIZED-QUICKSORT( A, p + 1, right ) RANDOMIZED-QUICKSORTIN ajoaika on keskimäärin Θ(n lg n) samoin kuin tavallisenkin QUICKSORTIN.

TIE-20100 Tietorakenteet ja algoritmit 114 RANDOMIZED-QUICKSORTILLE kuitenkin varmasti pätee keskimääräisen ajankäytön analyysin yhteydessä tehtävä oletus, jonka mukaan pivot-alkio on osataulukon pienin, toiseksi pienin jne. aina samalla todennäköisyydellä. Tavalliselle QUICKSORTILLE tämä pätee ainoastaan, jos aineisto on tasaisesti jakautunutta. RANDOMIZED-QUICKSORT on yleisessä tapauksessa tavallista QUICKSORTIA parempi.

TIE-20100 Tietorakenteet ja algoritmit 115 QUICKSORTIA voidaan tehostaa myös muilla keinoilla: Voidaan järjestää pienet osataulukot pienille taulukoille tehokkaalla algoritmilla (esim. INSERTIONSORT) avulla. voidaan myös jättää ne vain järjestämättä ja järjestää taulukko lopuksi INSERTIONSORTIN avulla Jakoarvo voidaan valita esimerkiksi kolmen satunnaisesti valitun alkion mediaanina. On jopa mahdollista käyttää aina mediaanialkiota jakoalkiona.

TIE-20100 Tietorakenteet ja algoritmit 116 Mediaani on mahdollista etsiä nopeasti niin sanotun laiskan QUICKSORTIN avulla. Jaetaan taulukko pienten alkioiden alaosaan ja suurten alkioiden yläosaan kuten QUICKSORTissa. Lasketaan, kumpaan osaan i:s alkio kuuluu, ja jatketaan rekursiivisesti sieltä. Toiselle osalle ei tarvitse tehdä enää mitään. RANDOMIZED-SELECT( A, lef t, right, goal ) 1 if lef t = right then (jos osataulukko on yhden kokoinen...) 2 return A[ lef t ] (... palautetaan ainoa alkio) 3 p := RANDOMIZED-PARTITION( A, lef t, right ) (jaetaan taulukko pieniin ja isoihin) 4 k := p left + 1 (lasketaan monesko jakoalkio on) 5 if i = k then (jos jakoalkio on taulukon i:s alkio...) 6 return A[ p ] (...palautetaan se) 7 else if i < k then (jatketaan etsintää pienten puolelta) 8 return RANDOMIZED-SELECT( A, left, p 1, goal ) 9 else (jatketaan etsintää suurten puolelta) 10 return RANDOMIZED-SELECT( A, p + 1, right, goal k )

TIE-20100 Tietorakenteet ja algoritmit 117 RANDOMIZED-SELECTIN suoritusajan alaraja: Jälleen kaikki muu on vakioaikaista paitsi RANDOMIZED-PARTITION ja rekursiivinen kutsu. Parhaassa tapauksessa RANDOMIZED-PARTITIONIN valitsema jakoalkio on taulukon i:s alkio, ja ohjelman suoritus loppuu. RANDOMIZED-PARTITION ajetaan kerran koko taulukolle. Algoritmin suoritusaika on Ω(n). RANDOMIZED-SELECTIN suoritusajan yläraja: RANDOMIZED-PARTITION sattuu aina valitsemaan pienimmän tai suurimman alkion, ja i:s alkio jää suuremmalle puoliskolle työmäärä pienenee vain yhdellä askeleella joka rekursiotasolla. Algoritmin suoritusaika on O(n 2 ).

TIE-20100 Tietorakenteet ja algoritmit 118 Keskimääräisen tapauksen ajoaika on kuitenkin O(n). Algoritmi löytyy esimerkiksi STL:stä nimellä nth_element. Algoritmi on mahdollista muuttaa myös toimimaan aina lineaarisessa ajassa.