ABHELSINKI UNIVERSITY OF TECHNOLOGY

Samankaltaiset tiedostot
805306A Johdatus monimuuttujamenetelmiin, 5 op

Pianon äänten parametrinen synteesi

Oma nimesi Tehtävä (5)

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Johdatus verkkoteoriaan 4. luento

KASVIATLAS 2011: TILASTOKARTTOJA, Raino Lampinen

Demo 1: Simplex-menetelmä

KASVIATLAS 2012: TILASTOKARTTOJA (Raino Lampinen )

Latinalaiset neliöt ja taikaneliöt

Lineaarialgebra ja matriisilaskenta I, HY Kurssikoe Ratkaisuehdotus. 1. (35 pistettä)

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

n! k!(n k)! n = Binomikerroin voidaan laskea pelkästään yhteenlaskun avulla käyttäen allaolevia ns. palautuskaavoja.

metsämatikkaa Sata käpyä Lukuja metsästä Laskutarina Mittaaminen punaisella narulla Päin mäntyä (metsän yleisin puu)

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

KASVIATLAS 2015: TILASTOKARTTOJA (Raino Lampinen )

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

KASVIATLAS 2017: TILASTOKARTTOJA (Raino Lampinen )

KASVIATLAS 2018: TILASTOKARTTOJA (Raino Lampinen )

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

2. TILASTOLLINEN TESTAAMINEN...

Sovellettu todennäköisyyslaskenta B

Kuva 1: Funktion f tasa-arvokäyriä. Ratkaisu. Suurin kasvunopeus on gradientin suuntaan. 6x 0,2

Näihin harjoitustehtäviin liittyvä teoria löytyy Adamsista: Ad6, Ad5, 4: 12.8, ; Ad3: 13.8,

1 Kannat ja kannanvaihto

Königsbergin sillat. Königsberg 1700-luvulla. Leonhard Euler ( )

Kahden laboratorion mittaustulosten vertailu

Seuratiedote 2/09 LIITE 4

Talousmatematiikan perusteet: Luento 9. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Transponointi Matriisitulo

Tietotekniikan valintakoe

Determinantti. Määritelmä

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Tietorakenteet, laskuharjoitus 7, ratkaisuja

9 Matriisit. 9.1 Matriisien laskutoimituksia

Jäsennysaiheesta lisää Täydentäviä muistiinpanoja TIEA241 Automaatit ja kieliopit, syksy 2016

Määrällisen aineiston esittämistapoja. Aki Taanila

Liikenneongelmien aikaskaalahierarkia

Luento 6: 3-D koordinaatit

11. laskuharjoituskierros, vko 15, ratkaisut

Jukka Tulkki 8. Laskuharjoitus (ratkaisut) Palautus torstaihin 3.4 klo 12:00 mennessä. x 2

Tampereen yliopisto Tietokonegrafiikka 2013 Tietojenkäsittelytiede Harjoitus

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

Determinantti. Määritelmä

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Ortogonaalisen kannan etsiminen

Puzzle SM Pistelasku

Matematiikan tukikurssi, kurssikerta 3

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

Algoritmit 1. Luento 10 Ke Timo Männikkö

10 Matriisit ja yhtälöryhmät

2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)

2.8. Kannanvaihto R n :ssä

5.3 Ensimmäisen asteen polynomifunktio

YLEISKUVA - Kysymykset

Vanhankaupunginkosken ultraäänikuvaukset Simsonar Oy Pertti Paakkolanvaara

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

9. Vektorit. 9.1 Skalaarit ja vektorit. 9.2 Vektorit tasossa

PYHTÄÄN KUNTA RUOTSINPYHTÄÄN KUNTA

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Kombinatorinen optimointi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

6. Etäisyydenmittari 14.

keskenään isomorfiset? (Perustele!) Ratkaisu. Ovat. Tämän näkee indeksoimalla kärjet kuvan osoittamalla tavalla: a 1 b 3 a 5

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

isomeerejä yhteensä yhdeksän kappaletta.

1.1. Määritelmiä ja nimityksiä

Helsingin keskustan läpiajoliikenteen tutkimus

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Matemaatikot ja tilastotieteilijät

Iitin kunta Pöytäkirja 3/ Keskusvaalilautakunta Aika klo 19:00-21:52. Kunnanhallituksen huone.

Lataa Linnut - Pertti Koskimies. Lataa

Mielipiteet ydinvoimasta Maaliskuu 2014

Kaksirivisen matriisin determinantille käytämme myös merkintää. a 11 a 12 a 21 a 22. = a 11a 22 a 12 a 21. (5.1) kaksirivine

8 Joukoista. 8.1 Määritelmiä

1 Laske ympyrän kehän pituus, kun

Ohjelmointi 1 C#, kevät 2014, 2. uusintatentti NIMI:

Salausmenetelmät. Veikko Keränen, Jouko Teeriaho (RAMK, 2006)

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

Koko maan ilveskanta-arvion taustasta ja erityisesti Etelä-Hämeen arviosta. Tiedosta ratkaisuja kestäviin valintoihin

Kliininen arviointi ja kliininen tieto mikä riittää?

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

Hierarkkinen klusterointi

Liite 1. Rekisteröimättömän majoituksen arviointi vedenkulutuksen perusteella

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Lineaarinen yhtälöryhmä

Cubature Integration Methods in Non-Linear Kalman Filtering and Smoothing (valmiin työn esittely)

Seuraavassa taulukossa on annettu mittojen määritelmät ja sijoitettu luvut. = 40% = 67% 6 = 0.06% = 99.92% 6+2 = 0.

finnish BOI 2015, päivä 1. Muistiraja: 256 MB

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Algoritmit 1. Demot Timo Männikkö

Mat Tilastollisen analyysin perusteet, kevät 2007

Graafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA

JAKSO 2 KANTA JA KOORDINAATIT

JHS 160 Paikkatiedon laadunhallinta Liite I: Esimerkkejä mitattavien laatutekijöiden osatekijöiden sovelluskohteista. 1. Johdanto...

Ilmakanaviston äänenvaimentimien (d= mm) huoneiden välisen ilmaääneneristävyyden määrittäminen

Mikrobiologisten tulosten laskeminen

Kokonaislukuaritmetiikka vs. logiikkaluupit

Transkriptio:

ABHELSINKI UNIVERSITY OF TECHNOLOGY Phylloscopus-suvun lintujen laulujen elementtien vertailu Aihe: Tekijät: Aki Härmä, Akustiikan ja äänenkäsittelytekniikan laboratorio, Teknillinen korkeakoulu, Espoo. Tiedoksi: Avesound-työryhmä Hanke: Linnuntunnistinhanke Päiväys: 17. maaliskuuta 2004 1 Johdanto Tämä muistio perustuu Juhani Lokin ehdotukseen tutkia viiden uunilintulajin (Phylloscopus-suku) laulun elementtien eroja. Ajatuksena on pyrkiä arvioimaan kyseisten lajien välisiä sukulaisuussuhteita elementtien yksinkertaiseen sinimalliin perustuvien parametristen välisten Euklidisten etäisyyksien avulla. 2 Menetelmät Tässä tarkasteltavat lajit on lueteltu taulukossa 1, josta ilmenee myös tarkastelussa käytetty yksilöiden lukumäärä ja elementtien kokonaismäärä. Äänitteistä irroitettiin elementit ja ne parametrisoitiin käyttäen sinimallinnusta [1, 2]. Varsinainen algoritmi oli sama jota käytettiin artikkelin [2] luokan I elementtien mallinnukseen. Parametriset mallit tallennettiin äänitetietokannasta johdettuun XML-pohjaiseen parametritietokantaan. Varsinainen elementtien välisten etäisyyksien mittaus tehtiin käyttäen EuqDtimealign c-funktiota 1, joka laskee kahden taajuustrajektorin välisen Euklidisen etäisyyden niin, että etäisyyden mittaamisessa käytetään painotusfunktiona testattavan elementin magnituditrajektoria. Lisäksi etäisyydeksi funktiossa valitaan löydetty minimietäisyys, kun testattavaa trajektoria siirretään ajassa eteen ja taakse päin niin, että trajektorit kuitenkin menevät aikatasossa vähintään 85 prosenttisesti päällekkäin. Etäisyys lasketaan aina vain trajektorien ajallisesti päällekkäisistä osista ja etäisyysmitta hylätään jos tavut ovat jo alunperin niin eri pituisia, että etäisyyden mittaaminen ei ole mielekästä. Koska tietokannassa on eri lajeille eri määrät yksilöjä ja elementtejä, vertailussa päädyttiin menetelmään, jossa kustakin lajista poimitaan satunnaisesti sama määrä elementtejä ja tehdään vertailu näille. Tämä elementtien poiminta toistetaan 20 kertaa ja lasketaan tulokset näiden otantojen keskiarvona. Seuraavassa esitetyissä tuloksissa tietyn yksilön elementtejä ei koskaan verrata samalta yksilöltä saatuihin muihin elementteihin. Vertailu tapahtuu aina suhteessa eri yksilöihin. 1 Avesound/RecogTools 1

Abbr. Latin name Finnish name #individuals #elements PHYLUS Phylloscopus trochilus Pajulintu 15 1309 PHYDES Phylloscopus trochiloides Idänuunilintu 6 762 PHYCOL Phylloscopus collybita Tiltaltti 14 1106 PHYBOR Phylloscopus borealis Lapinuunilintu 6 1383 PHYSIB Phylloscopus sibilatrix Sirittäjä 9 1075 Taulukko 1: Phylloscopus-suvun lajit ja tietokannasta löytyvät yksilömäärät sekä parametrisoitujen elementtien lukumäärä. Pajulintu 58 11 21 4 6 Idänuunilintu 11 59 9 17 10 Tiltaltti 22 6 60 8 3 Lapinuunilintu 2 7 8 70 1 Sirittäjä 7 17 2 1 80 Taulukko 2: Phylloscopus-suvun lajien tunnistusprosentit kun kriteerinä käytetään parasta osumaa. Toisin sanoen, prosenttiluvut ilmaisevat sen kuinka suurelle osalle sarakkeen lajin elementeille pienin etäisyysmitan arvo saatiin rivillä olevan lajin elementille. Tulokset ovat keskiarvo 20 arvonnan ylitse. 3 Tunnistuskokeilut Tyypillinen yhden ajon tuloksena saatava etäisyysmatriisi on esitetty kuvassa 1. Kuvassa kukin sarake ilmaisee harmaasävynä sen kuinka lähellä kyseisen sarakkeen edustama elementti on kaikkia muita elementtejä. Huomaa, että saman yksilön elementit on jätetty pois vertailusta ja ne näkyvät kuvassa valkoisella. Tumma väri ilmaisee, että kyseinen elementti on lähellä jotain riviä vastaavaa elementtiä. Esimerkiksi kuvassa oikeassa reunassa keskellä PHYSIB/PHYCOL-lokerossa olevat tummat pystysuorat viivat kertovat, että kyseistä saraketta vastaava Sirittäjän elementti on hyvin lähellä useita Tiltaltin elementtejä. Vastaavasti alarivissä keskellä oleva PHYCOL/PHYSIBlokero sisältää vastaavan vaakasuoran viivan joka kertoo, että monet Tiltaltin elementit on varsin lähellä erästä Sirittäjän tietystä laulusta lyötyvää elementtiä. Huomaa kuitenkin, että matriisi ei ole lävistäjän suhteen täysin symmetrinen. Epäsymmetria johtuu siitä, että etäisyyden laskennassa huomioidaan vain saraketta vastaava elementin amplituditrajektori. Kuvan 1 etäisyysmatriisista voidaan laskea monia erilaisia mittoja lajien välisille eroille. Taulukossa 2 on prosentuaaliset osuudet sille minkä lajin elementtejä lähinnä jonkin lajin elementit ovat, jos kriteerinä pidetään parasta osumaa, eli kutakin kuvan 1 matriisin saraketta vastaavaa pienintä etäisyyttä (tummin väri). Taulukossa 3 on taas esitetty vastaavat prosenttiosuudet kun katsotaan miten lähellä kunkin lajin elementit ovat keskimäärin kunkin toisen lajin elementtejä. Kuvan 1 mielessä voidaan ajatella, että prosenttiluku taulukossa 3 kertoo siitä miten tumma tietty laji-laji-lokero matriisissa on. Pajulintu 36 13 26 7 10 Idänuunilintu 13 24 16 21 18 Tiltaltti 35 23 42 13 5 Lapinuunilintu 10 28 13 57 3 Sirittäjä 7 11 3 2 63 Taulukko 3: Phylloscopus-suvun lajien tunnistusprosentit kun kriteerinä käytetään elementtien keskimääräistä likeisyyttä kyseisen lajin elementteihin. Toisin sanoen, prosenttiluvut ilmaisevat sen missä suhteessa kyseisen sarakkeen lajin tavuilla on läheisyyttä riveillä olevien lajien elementteihin nähden. Tulokset ovat keskiarvo 20 arvonnan ylitse. 2

a) Kuva 1: Etäisyysmatriisi viiden taulukon 1 lajilta satunnaisesti poimitun sadan elementin välillä. Matriisissa on siis 500 500 pistettä vastaten elementtien välisiä etäisyyksiä. Mitä tummenpi väri on, sitä lähempänä elementit ovat toisiaan. Taulukon 2 perusteella nähdään, että kaikilla lajeilla yksittäinen elementti laulusta irroitettuna tunnistuu oikein vähintään 58% todennäköisyydellä. Taulukon 3 mukaisissa tuloksissa oikein tunnistuminen ei ole niin selvää. Tuloksiin selvästi vaikuttaa se, että eräillä lajeilla on laajempi kirjo erilaisia elementtejä, jotka ovat lähellä useiden lajien muita elementtejä. Taulukon 2 tulokset kertovat mahdollisesti enemmän lajien fysikaalisesta samankaltaisuudesta, mutta taulukon tuloksia lajien välistä vertailua ajatellen voi vääristää se, että ylivoimaisesti suurin osa elementeistä tunnistuu samaan lajiin. Tällöin voi käydä niin, että osumat muihin kuin saman lajin yksilöihin tapahtuvat kyseiselle lajille epätyypillisten elementtien kohdalla. Taulukossa 4 on tarkasteltu lajien elementtien samankaltaisuutta etsimällä parasta osumaa vain muista kuin saman lajin yksilöistä. Tämä vertailu kertoo ehkä eniten lajien välisistä eroista. Vertailun kriteerit taulokoissa ovat varsin erilaisia, mutta tulokset ovat samansuuntaisia. Kuvan 1 ja taulukoiden 2, 3 ja 4 perusteella voidaan esittää seuraavia alustavia havaintoja: 1. Pajulintu ja tiltaltti ovat lähellä toisiaan. 2. Idänuunilintu ja lapinuunilintu vaikuttavat olevan lähellä toisiaan. 3. Sirittäjä on lähellä idänuunilintua. 4. Lapinuunilintu on lähellä tiltalttia. 3

Pajulintu 0 10 44 13 30 Idänuunilintu 15 0 18 63 33 Tiltaltti 56 8 0 19 32 Lapinuunilintu 1 35 33 0 5 Sirittäjä 28 47 5 5 0 Taulukko 4: Phylloscopus-suvun lajien tunnistusprosentit kun kriteerinä käytetään parasta osumaa muille kuin saman lajin yksilöille. Prosenttiluvut ilmaisevat sen kuinka suurelle osalle sarakkeen lajin elementeille pienin etäisyysmitan arvo saatiin rivillä olevan lajin elementille. Tulokset ovat keskiarvo 20 arvonnan ylitse. Pajulintu 0 13 50 7 29 Idänuunilintu 13 0 13 49 40 Tiltaltti 50 13 0 26 19 Lapinuunilint 7 49 26 0 5 Sirittäjä 29 40 19 5 0 Taulukko 5: Taulukon 4 tulokset symmetrisoituna siten, että kustakin lajiparista on laskettu keskiarvo molempiin suuntiin laskettujen tunnistusprosenttien kesken. Pareittaisen T-testin perusteella voidaan tarkastella sitä miten luotettavia saadut keskiarvotulokset 20 ajokerran välillä ovat. Tällä voidaan esimerkiksi testeta, että miten tilastollisesti luotettavaa on väittää, että tiltaltin äänet ovat keskimäärin lähempänä pajulintua kuin mitään muuta lajia. Taulukkoja 3 ja 4 vastaavia tuloksia verrattaessa todettiin, että kaikki kolme yllä olevaa havaintoa ovat tilastollisesti uskottavia. Tyypillisesti mittana käytetty p-arvo on pienempi kuin p = 0.001, kun tilastollisen luotettavuuden ylärajana pidetään yleensä arvoa p = 0.01. Ainoa tilastollisesti hieman heikommin uskottava on idänuunilinnun ja lapinuunilinnun vertailun tulos taulukon 2 tapauksessa, joka osoittaa, että joissain tapauksissa sirittäjä voi olla lähempänä idänuunilintua kuin lapinuunilintu (p = 0.08) ja toisaalta tiltaltti voi olla lähellä lapinuunilintua. Tämä sopii kuitenkin yhteen havaintojen 3 ja 4 kanssa. Tämä tarkastelu on kuitenkin aivan alustava. 4 Päätelmät Juhani Lokki pyysi helmikuussa 2004 pidetyssä palaverissa tekemään matriisin josta ilmenee Phylloscopus-suvun lajien väliset tunnistustulokset elementtien Euklidisten etäisyyksien avulla arvioituna. Tämä on tehty tässä muistiossa. Kuten todettua, prosentit voidaan laskea monella eri tavalla ja saada aina hieman erilaisia tuloksia. Itse pidän taulukon 4 tuloksia tässä mielessä ehkä kiinnostavimpina. Kuten taulukoista voidaan todeta, tulosmatriisit eivät näin tarkasteltuna ole symmetrisiä. Esimerkiksi taulukossa 4 idänuunilinnun tavuista 10 % oli lähinnä pajulinnun tavuja, mutta pajulinnun tavuista 15% oli kaikista muista lajeista lähinnä idänuunilinnun tavuja. Tulokset voidaan symmetrisoida laskemalla keskiarvot ylä- ja alakolmimatriisin vastaavista alkioista. Taulukon 4 tapauksessa tästä saadaan tuloksena taulukko 5. Tämä symmetrisoitu matriisi tukee myös selvästi edellä esitettyjä väitteitä lajien lähekkäisyydestä. Lisäksi näemme myös, että pajulintu ja sirittäjä ovat varsin lähellä toisiaan. Tuloksissa on tietenkin vielä useita mahdollisia virhetekijöitä. Vaikka suvun lajien elementit ovat varsin sinimäisiä, kaikki elementtien parametriset esitykset eivät ehkä ole täysin onnistuneita. Lisäksi alkuperäisissä äänitteissä voi olla virheellisesti tunnistettuja yksilöitä. Viitteet [1] A. Härmä, Automatic recognition of bird species based on sinusoidal modeling of syllables, in IEEE Int. Conf. Acoustics, Speech, Signal Processing (ICASSP 2003), (Hong Kong), April 2003. 4

[2] A. Härmä and P. Somervuo, Classification of the harmonic structure in bird vocalization, in IEEE Int. Conf. Acoustics, Speech, Signal Processing (ICASSP 2004), (Montreal, Canada), May 2003. 5