SUUNTAKUULON TOIMINNALLISUUDEN MALLINTAMINEN NEURO- FYSIOLOGISELLA TASOLLA 1 JOHDANTO 2 BINAURAALINEN AUDITORINEN MALLI



Samankaltaiset tiedostot
ÄÄNILÄHDERYHMIEN TILAJAKAUMAN HAVAITSEMINEN 1 JOHDANTO 2 MENETELMÄT

HRTFN MITTAAMINEN SULJETULLA VAI AVOIMELLA KORVA- KÄYTÄVÄLLÄ? 1 JOHDANTO 2 METODIT

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN

ÄÄNEN TULOSUUNNALLE HERKKIEN TUMAKKEIDEN TOIMINNAL- LISTEN MALLIEN ULOSTULOJEN YHDISTÄMINEN

800 Hz Hz Hz

Binauraalinen äänentoisto kaiuttimilla

ERILLISMIKROFONIÄÄNITYSTEN KÄYTTÖ PARAMETRISESSA TILAÄÄNEN KOODAAMISESSA

PSYKOAKUSTINEN ADAPTIIVINEN EKVALISAATTORI KUULOKEKUUNTELUUN MELUSSA

Kuulohavainnon perusteet

2.1 Ääni aaltoliikkeenä

RAKENNUSAKUSTIIKKA - ILMAÄÄNENERISTÄVYYS

Kuulohavainto ympäristössä

3D-äänitystekniikat ja 5.1-äänentoisto

Kohti uuden sukupolven digitaalipianoja

Kuuloaistin ominaisuuksia

1 Olkoon suodattimen vaatimusmäärittely seuraava:

SGN-4200 Digitaalinen audio

5 Akustiikan peruskäsitteitä

PILVILASKENTA AKUSTISESSA MALLINNUKSESSA 1 JOHDANTO. Tomi Huttunen 1), Antti Vanne 1), Timo Avikainen 2), Leo Kärkkäinen 2)

Antti Kelloniemi, Kalle Koivuniemi, Jarkko Punnonen, Sari Suomela. Tiivistelmä

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

YKSILÖLLINEN HRTF 1 JOHDANTO. Tomi Huttunen 1, Antti Vanne 1. Haapaniemenkatu 40 E 1, Kuopio

1 Johdanto. 1.2 Psykofysiikka, psykoakustiikka. 1.1 Kuulon toiminta. Sisältö:

Dynaamiset regressiomallit

AKTIIVISEN ÄÄNENHALLINNAN PSYKOAKUSTINEN ARVIOINTI

Mediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin

Ilmavaihtoäänen taajuusjakauma ja ääniympäristötyytyväisyys

VAASAN YLIOPISTO TEKNILLINEN TIEDEKUNTA SÄHKÖTEKNIIKKA. Lauri Karppi j SATE.2010 Dynaaminen kenttäteoria DIPOLIRYHMÄANTENNI.

LASKOSTUMISEN HAVAITSEMINEN SAHA-AALLOSSA

MATKAPUHELINKAIUTTIMIEN TAAJUUSVASTEISTA JA SÄRÖKÄYT- TÄYTYMISESTÄ 1 JOHDANTO 2 ANALYYSIMENETELMÄT

Laskuharjoitus 9, tehtävä 6

ELEC-C6001 Sähköenergiatekniikka, laskuharjoitukset oppikirjan lukuun 10 liittyen.

KONSERTTISALIAKUSTIIKAN SUBJEKTIIVINEN ARVIOINTI PERUSTUEN BINAURAALISIIN IMPULSSIVASTEISIIN 1 JOHDANTO

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

SAVONLINNASALI, KOY WANHA KASINO, KONSERTTISALIN AKUSTIIKKA. Yleistä. Konserttisali

Kuva 1. Mallinnettavan kuormaajan ohjaamo.

PAKOPUTKEN PÄÄN MUODON VAIKUTUS ÄÄNENSÄTEILYYN

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.

FYSIIKAN LABORATORIOTYÖT 2 HILA JA PRISMA

Tulevaisuuden kameravalvontaa SUBITO (Surveillance of Unattended Baggage including Identification and Tracking of the Owner)

Tekijä MAA2 Polynomifunktiot ja -yhtälöt = Vastaus a)

HUONEAKUSTIIKAN MALLINNUS JA AURALISAATIO - KATSAUS NYKYTUT- KIMUKSEEN 2 DIFFRAKTION MALLINNUS KUVALÄHDEMENETELMÄSSÄ

Tuulivoimaloiden ympäristövaikutukset

A/D-muuntimia. Flash ADC

20 Kollektorivirta kun V 1 = 15V Transistorin virtavahvistus Transistorin ominaiskayrasto Toimintasuora ja -piste 10

Åbo Akademi klo Mietta Lennes Nykykielten laitos Helsingin yliopisto

TILAIMPULSSIVASTEIDEN ANALYYSI JA SYNTEESI HUONEAKUS- TIIKASSA

Säätötekniikan matematiikan verkkokurssi, Matlab tehtäviä ja vastauksia

IMPULSSIVASTEEN ANALYSOINTI AALLOKEMENETELMIN TIIVISTELMÄ 1 AALLOKEANALYYSI. Juha Urhonen, Aki Mäkivirta

TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen

Organization of (Simultaneous) Spectral Components

Kommunikaatioakustiikan perusteet. Ville Pulkki

S Laskennallinen Neurotiede

KIELEN PITKITTÄISTEN VÄRÄHTELYJEN HAVAITSEMINEN PIANON ÄÄNESSÄ 1 JOHDANTO 2 KUUNTELUKOKEET

1 Vastaa seuraaviin. b) Taajuusvasteen

ÄÄNEKKÄÄMMÄN KANTELEEN SUUNNITTELU JA ANALYYSI 1 JOHDANTO

Hannu Nykänen, Marko Antila, Panu Maijala, Seppo Uosukainen

HUONEAKUSTIIKAN MALLINNUS VIRTUAALISELLA AALTOKENT- TÄSYNTEESILLÄ 1 JOHDANTO 2 VIRTUAALISEN AALTOKENTTÄSYNTEESIN TEORIA

KOLMIULOTTEISEN TILAN AKUSTIIKAN MALLINTAMINEN KAKSIULOTTEISIA AALTOJOHTOVERKKOJA KÄYTTÄEN

Kommunikaatioakustiikan perusteet. Ville Pulkki

Tilastotiede ottaa aivoon

SWEPT SINE MITTAUSTEKNIIKKA (NOR121 ANALYSAATTORILLA)

Moniaistisuus. Moniaistinen havaitseminen. Mitä hyötyä on moniaistisuudesta? Puheen havaitseminen. Auditorisen signaalin ymmärrettävyyden vaikutukset

KAIKUPEDAALIN VAIKUTUKSET PIANON ÄÄNEEN: ANALYYSI JA SYNTEESI 1 JOHDANTO 2 ÄÄNITYKSET JA SIGNAALIANALYYSI

TL5503 DSK, laboraatiot (1.5 op) Suodatus 1 (ver 1.0) Jyrki Laitinen

LIITE 1 VIRHEEN ARVIOINNISTA

Pilkku merkitsee, että kysymyksessä on rakennusmittaus (in situ) R W (db) vaaka/pysty. L n,w (db) Rakennus

Tilastotiede ottaa aivoon

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely)

Dynaamisten systeemien identifiointi 1/2

S Laskennallinen Neurotiede

SAMETTIKOHINA 1 JOHDANTO 2 SAMETTIKOHINAN SYNTEESI. Vesa Välimäki 1, Heidi-Maria Lehtonen 1 ja Jari Kleimola 2

OPERAATIOVAHVISTIN. Oulun seudun ammattikorkeakoulu Tekniikan yksikkö. Elektroniikan laboratoriotyö. Työryhmä Selostuksen kirjoitti

Missä mennään. systeemi. identifiointi. mallikandidaatti. validointi. malli. (fysikaalinen) mallintaminen. mallin mallin käyttötarkoitus, reunaehdot

Projektisuunnitelma ja johdanto AS Automaatio- ja systeemitekniikan projektityöt Paula Sirén

Akustointiratkaisujen vaikutus taajuusvasteeseen

Mitä on konvoluutio? Tutustu kuvankäsittelyyn

LIITE 1 VIRHEEN ARVIOINNISTA

Signaalit ja järjestelmät aika- ja taajuusalueissa

ö ø Ilmaääneneristävyys [db] 60 6 mm Taajuus [Hz]

Digitaalinen audio

AKUSTINEN KAMERA ILMAÄÄNENERISTÄVYYSONGELMIEN SEL- VITTÄMISESSÄ

NURKKAPISTEMENETELMÄN VAIKUTUS ÄÄNENERISTÄVYYSMITTAUKSISSA - HAVAINTOJA KENTTÄMITTAUKSISTA 1 JOHDANTO. Olli Santala

Pinces AC/DC-virtapihti ampèremetriques pour courant AC

Seurantalaskimen simulointi- ja suorituskykymallien vertailu (valmiin työn esittely) Joona Karjalainen

Elektroniikka, kierros 3

LABORATORIOTYÖ 3 VAIHELUKITTU VAHVISTIN

1. Määritä pienin näytelauseen ehdon mukainen näytetaajuus taajuus seuraaville signaaleille:

REUNAEHTOJEN TOTEUTUSTAPOJA AALTOJOHTOVERKOSSA

3 Raja-arvo ja jatkuvuus

TELEKONFERENSSISOVELLUS JA SUUNTAMIKROFONITEKNIIKKA DIRAC-MENETELMÄLLE 1 JOHDANTO 2 YKSINKERTAISEN DIRAC-VERSION PERIAATE

Yleistä. Digitaalisen äänenkäsittelyn perusteet. Tentit. Kurssin hyväksytty suoritus = Harjoitustyö 2(2) Harjoitustyö 1(2)

Y Yhtälöparista ratkaistiin vuorotellen siirtofunktiot laittamalla muut tulot nollaan. = K K K M. s 2 3s 2 KK P

Numeeriset menetelmät

Vesiviljelystä menestyvä elinkeino Saaristomerelle utopiaako?


Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Transkriptio:

SUUNTAKUULON TOIMINNALLISUUDEN MALLINTAMINEN NEURO- FYSIOLOGISELLA TASOLLA Marko Takanen, Olli Santala, Ville Pulkki Aalto-yliopisto, Sähkötekniikan korkeakoulu, Signaalinkäsittelyn ja akustiikan laitos PL 13000, 00076 Aalto marko.takanen@aalto.fi 1 JOHDANTO Auditorisia malleja on kehitetty 1980-luvulta lähtien mallintamaan ihmiskuulon toimintaa laskennallisten operaatioiden avulla [1]. Tämän kehitystyön tavoitteena on luoda malleja, joiden antamat arviot jostakin äänitapahtumasta vastaavat ihmisen tekemää havaintoa. Tavoitteen saavuttamisen jälkeen voitaisiin käyttää auditorista mallia arvioimaan tutkittavia ääniä ilman aikaa vievien kuuntelukokeiden järjestämistä ja/tai vaarantamatta koehenkilön kuuloa. Koko kuuloaistimuksen taustalla olevan prosessoinnin mallintaminen on kuitenkin osoittautunut hyvin haastavaksi tehtäväksi, minkä johdosta auditoristen mallien kehittelyssä on yleensä keskitytty johonkin yksittäiseen osa-alueeseen kuten äänekkyyden havainnoinnin mallintamiseen [2]. Yksi eniten tutkituista osa-alueista on ollut suuntakuulo, jota on perinteisesti mallinnettu käyttäen korviin saapuvien signaalien väliseen ristikorrelaatioon pohjautuvaa laskentaa [3]. Viimeisimmät auditoriset mallit pyrkivät kuitenkin kuulojärjestelmän tarkempaan kuvaukseen mallintaen myös kuulojärjestelmän neurofysiologisia osia toiminnallisella tasolla. Tässä artikkelissa esitellään viimeksi mainittua periaatetta noudattava malli, jossa on mallinnettu kuulojärjestelmän osien toimintaa ulkokorvalta alemmalle nelikukkulatumakkeelle (Inferior Colliculus, IC) asti. Esiteltävän mallin rakenteen ja toiminnallisuuden taustalla ovat tiedot psykoakustiikasta ja ihmisen kuulojärjestelmän neurofysiologiasta sekä eläinkokeista saadut tulokset. Artikkelissa esitellään, kuinka malli muodostaa binauraalisesta signaalista prosessoinnin lopputuloksena binauraalisen aktivaatiokartan, joka osoittaa äänten tulosuunnat taajuuksittain kullakin ajanhetkellä. Lisäksi artikkelissa osoitetaan vastaavuudet mallin ulostulon ja ihmisten tekemien kuulohavaintojen välillä. 2 BINAURAALINEN AUDITORINEN MALLI Mallin yleisrakenne on esitettynä kuvassa 1. Mallin sisääntulosignaalina oleva binauraalinen signaali prosessoidaan ensin vasemman ja oikean korvan ääreiskuulon mallien läpi, jonka jälkeen näiden kahden mallin ulostulot johdetaan keskimmäisen ylemmän oliivitumakkeen (Medial Superior Olive, MSO) ja ja laitimmaisen ylemmän oliivitumakkeen (Lateral Superior Olive, LSO) malleihin. Nämä MSO:n ja LSO:n mallit suorittavat binauraalisten vihjeiden laskennan ääreiskuulon mallien ulostuloista. Saatujen 1

binauraalisten vihjeiden ja kahden ääreiskuulon mallin ulostuloista laskettujen spektrivihjeiden avulla muodostetaan sitten binauraalinen aktivaatiokartta, joka havainnollistaa spektrivihjeet yksiulotteiselle akselille vasemmalta oikealle. Huomioitavaa on se, että ääreiskuulon, MSO:n ja LSO:n mallit pohjautuvat neuroanatomiseen ja neurofysiologiseen tietoon [4], mutta binauraalisen kartan muodostuksen taustalla on psykoakustinen informaatio. + Vasen korva Ääreiskuulon malli + MSO-malli Taajuusresoluution pienentäminen Skaalaus Vihjeiden vuorovaikutus ohjaus Vasen aivopuolisko LSO-malli Taajuusresoluution pienentäminen Skaalaus inhibitio inhibitio vasen 1-D binauraalinen aktivaatiokartta Oikea korva Oikea aivopuolisko Ääreiskuulon malli + LSO-malli MSO-malli spektri vertailu Vihjeiden vuorovaikutus oikea Spektrivihjeiden laskenta Kuva 1: Mallin rakenteen kuvaus, jossa on selvyyden vuoksi esitettynä vain vasemmalle aivopuoliskolle saapuvien signaalien muodostumiset. Binauraalisten vihjeiden laskenta mallissa pohjautuu niin sanottuun count-comparison -periaatteeseen [3] ja on toteutettu suurilta osin artikkelissa [5] esittyjä toteutuksia noudattaen. Seuraavat kappaleet esittelevät mallin eri osien toimintaa yleisellä tasolla. Ääreiskuulon mallin ensinmäisessä vaiheessa sisääntulevaa signaalia suodatetaan 141- kaistaisella gammatone-suodinpankilla, joka mallintaa basilaarikalvon taajuusselektiivisyyttä. Seuravassa vaiheessa suodinpankin ulostuloista muodostetaan impulssijonoja, joissa yksittäiset impulssit ovat voimakkuudeltaan signaalin tasosta riippuvia ja hiukan levinneitä. Tämä vaihe mallintaa simpukkatumakkeessa tapahtuvaa vaihelukittautumista. Viimeisessä vaiheessa kompensoidaan suodinpankin viiveet ja edellisen vaiheen vaikutus signaalin tasoon. MSO:n mallin tehtävänä on mallintaa kyseisen aivopuoliskon MSO:n neuronien yhteistä aktiivisuutta molempien aivopuoliskojen simpukkatumakkeista saapuville herätteille. Yleisesti ottaen voidaan todeta MSO:n olevan herkkä korvienvälisen aikaeron (ITD:n) suhteen [4]. MSO:n mallintaminen on toteutettu viisivaiheisena prosessina, jonka ensimmäisessä vaiheessa tulosignaalien arvoista vähennetään lyhyen aikavälin (10 ms) keskiarvo yli 1500 Hz:n keskitaajuutta vastaavilla kaistoilla impulssien terävöittämiseksi näillä kaistoilla. Toisessa vaiheessa ipsi- ja kontralateraaleista signaaleista lasketaan yhteisaktiivisuuden mallintamiseksi geometriset keskiarvot vierekkäisten kaistojen yli keskiarvoistaen. Kolmannessa vaiheessa kontralateraalilta puolelta saapuva signaali konvoloidaan taajuusriippuvalla signaalilla, jotta MSO:n mallin vaste on suurimmillaan 45 vaihe-eroa vastaavilla viiveillä. Samanaikaisesti ipsilateraalin puolen signaali normalisoidaan välille [0, 1]. Näin saadut signaalit kerrotaan sitten keskenään neljännessä vaiheessa binauraalisen vuorovaikutuksen mallintamiseksi ja lopulta saatu tulos normalisoidaan välille [0, 1] kontralateraalin sisääntulon avulla. 2

LSO:n on vastaavasti todettu olevan herkkä korvienvälisen tasoeron (ILD:n) suhteen, mutta myös ITD:n suhteen pienillä taajuuksilla [4]. LSO:n malli mallintaa LSO:n neuronien yhteisaktiivisuutta neljävaiheisen prosessin avulla. Ensimmäiseksi eri kaistojen yhteisvaikutusta mallinnetaan, kuten MSO:n mallissakin, geometrisen keskiarvon laskennan avulla. Toisessa vaiheessa mallinnetaan ajallista integraatiota suodattamalla kontraja ipsilateraalin puolen signaaleja ensimmäisen asteen IIR-suodattimella. Kolmannessa vaiheessa suodatettu ipsilateraali signaali jaetaan kontralateraalilla tasoeron laskemiseksi, jonka jälkeen tasoero normalisoidaan välille [0,1] siten, että se saturoituu arvoon 1 yli 18 db:n eroa vastaavilla arvoilla. Näin saadun signaalin lyhytkestoisia piikkejä korostetaan sitten viimeisessä vaiheessa painotetun keskiarvon laskennan avulla. Binauraalinen aktivaatiokartta muodostetaan MSO:n ja LSO:n mallien ulostuloista saatavien suuntavihjeiden ja ääreiskuulon mallien ulostuloista laskettavien spekrivihjeiden avulla. Edellä mainitut vihjeet kuvaavat IC-tasolla käytettävissä olevaa informaatiota. Kartan tavoitteena on havainnollistaa akustinen ympäristö samalla tavalla kuin ihmisen kuulohavainnossa hahmotetaan äänikentässä olevia objekteja sisäisellä esitystavalla. Varsinaisen kartan muodostamista ennen suoritetaan kuitenkin muutamia valmistelevia operaatioita, joista ensimmäisessä lasketaan spektrivihjeet ääreiskuulon mallien ulostuloista kymmenkantaisen logaritmin, liukuvan keskiarvon (10 ms) laskennan ja normalisoinnin avulla. Normalisoinnissa käytetään referenssinä 60 db äänenpainetasolla toistetun pinkin kohinan avulla laskettuja arvoja. Seuraavana operaationa on aineiston taajuusresoluution pienentäminen kartan selkeyden vuoksi. Tämä operaatio toteutetaan jakamalla suunta- ja spektrivihjeet kuuteen eri taajuusalueeseen niiden kaistojen keskitaajuuksien perusteella taulukon 1 rajataajuuksien mukaan ja laskemalla vihjeiden keskiarvot kyseisillä taajuusalueilla. Tämän jälkeen suuntavihjeet skaalataan käyttäen vertaisarvoja, jotka laskettiin käyttäen vapaan kentän siirtofunktioita pistemäisiltä äänilähteiltä tärykalvolle (head-related transfer function, HRTF). Skaalaus tehdään, jotta eri taajuusalueiden vihjeet ovat samankaltaisia laajakaistaisen äänilähteen tapauksessa. Viimeisessä operaatiossa MSO:n ja LSO:n välinen vuorovaikutus mallinnetaan yhdistämällä niiden skaalatut suuntavihjeet yhdeksi suuntavihjeeksi kummallakin aivopuoliskolla. Yhdistäminen tapahtuu valitsemalla kullakin ajanhetkellä ja taajuusalueella edellämainituista arvoista suurempi. Taulukko 1: Eri taajuusalueiden alarajataajuudet ja taajuusalueita vastaavat värit. Taajuus 124 Hz 337 Hz 811 Hz 1,56 khz 2,84 khz 5,04 khz Väri sininen violetti punainen keltainen vihreä syaani Binauraalisen aktivaatiokartan muodostamisessa suuntavihjeet ohjaavat spektrivihjeet vasemmalta oikealle ulottuvalle akselille. Näin ollen kartta osoittaa äänilähteen sijainnin lisäksi myös sen taajuussisällön, sillä värit kartalla ovat sitä kirkkaampia, mitä enemmän energiaa kullakin taajuusalueella on. Puoltenvälisen inhibition mallintamisen seurauksena toiselle aivopuoliskolle osoittavat suuntavihjeet kuitenkin heikentävät toiselle aivopuoliskolle meneviä spektrivihjeitä. Inhibition mallintaminen on toteutettu vertaamallla kyseisen puolen suuntavihjettä toisen puolen suuntavihjeeseen. Mikäli näiden vihjeiden 3

välinen erotus on negatiivinen, kerrotaan kyseisen aivopuoliskon spektrivihjeitä kertoimella, joka on sitä lähempänä nollaa, mitä pienempi erotuksen tulos on. 3 TOIMINNALLISUUDEN ARVIOINTI Kehitetyn mallin toiminnallisuuden arvioimiseksi luotiin kolme erilaista testisignaalia, jotka prosessoitiin mallin avulla. Testisignaalien sisältämät äänilähteet simuloitiin pistemäisinä äänilähteinä prosessoimallla niiden signaalit mitatuilla HRTF:illä (Cortex MK II -keinopää). Tämän jälkeen mallin toiminnallisuutta arvioitiin tarkastelemalla visuaalisesti mallin ulostulonaan antamia binauraalisia aktivaatiokarttoja. Testisignaalit valittiin sen perusteella, että niiden havaitsemista on tutkittu kuuntelukokeissa (esim. [6, 7]) ja että ne edustavat erilaisia tilanteita suuntakuulon kannalta. Ensimmäisenä testisignaalina käytettiin signaalia, jossa yksittäinen äänilähde liikkuu simuloituun kuuntelijaan nähden kymmenen asteen askelin kulmien 0 ja 90 välillä. Äänilähteen tuottamana signaalina käytettiin pinkkiä kohinaa. Toisen testisignaalin simuloidussa tilanteessa on kaksi samanaikaista puhujaa, jotka sijaitsevat simuloituun kuuntelijaan nähden ±30 kulmissa. Toinen puhujista on nainen, joka lausuu lauseen "in arithmetic, infinitely many numbers", ja toinen puhujista on mies, joka lausuu lauseen "three four five". Kolmannen testisignaalin tilanteessa on yhtaikaisesti läsnä useita samankaltaisia äänilähteitä. Äänilähteiden tuottamina signaaleina käytettiin korreloimattomia pinkin kohinan näytteitä. Äänilähteiden lukumäärä kasvoi asteittain testisigaalin aikana yhdestä kolmeentoista siten, että äänilähteet olivat jakautuneet tasaisesti 15 välein simuloidun kuuntelijan vasemmalle ja oikealle puolelle. 3.1 Tulokset ja analyysi Mallin ulostulonaan palauttamat binauraaliset aktivaatiokartat käytetyille testisignaaleille ovat esitettynä kuvassa 2. Alimpana esitetyn yksittäisen äänilähteen aktivaatiokartasta nähdään, kuinka aktivaation paikka siirtyy vasemmalle seuraten näin äänilähteen vaiheittaista siirtymistä simuloidun kuuntelijan oikealle puolelle. Aktivaatiokartasta huomataan myös, että mallin erottelukyky ja tarkkuus on parhaimmillaan äänilähteen ollessa edessä, alle 30 kulmassa kuuntelijaan nähden. Vastaavasti erottelukyky on huonoimmillaan äänilähteen ollessa kuuntelijan sivulla. Nämä tulokset korreloivat hyvin ihmisille tehtyjen kuuntelukokeiden tulosten kanssa [6]. Kuvassa ylimpänä esitetystä samanaikaisten puhujien binauraalisesta aktivaatiokartasta on erotettavissa yksi äänilähde kummallakin aivopuoliskolla. Esimerkiksi miehen lausumat sanat ovat selvästi nähtävissä oikean aivopuoliskon aktivaatiossa. Näin ollen voidaan todeta mallin kykenevän toimimaan myös samanaikaisten äänilähteiden tapauksessa. Levenevän, useasta samankaltaisesta äänilähteestä koostuvan, tilajakauman aktivaatiokartasta (kuvassa keskimmäisenä) nähdään, että aktivaatio levenee yhä laajemmalle alueelle tilajakauman leventyessä. Aktivaatio ei kuitenkaan ylety aivan niin laitaan kum- 4

1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 Aika Samanaikaiset puhujat [-90, 90 ] [-60, 60 ] [-30, 30 ] [-15,15 ] Levenevä tilajakauma 0 80 60 40 Liikkuva äänilähde 20 0 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 Aktivaation paikka Kuva 2: Binauraalinen aktivaatiokartta, jossa eri värit kuvaavat eri taajuusalueita taulukon 1 mukaisesti. Kartassa positiiviset aktivaation paikan arvot viittaavat aktivaatioon oikealla aivopuoliskolla. mallakaan aivopuoliskolla tilajakauman ollessa leveimmillään kuin olisi kuuntelukokeiden tulosten [7] ja yksittäisen äänilähteen aiheuttaman aktivaatiokartan perusteella odotettavissa. Näin ollen voidaan todeta mallin toiminnalllisuuden olevan lupaava myös useiden samankaltaisten äänilähteiden tapauksessa mutta vaativan myös joitakin muutoksia, jotta saavutetaan vielä parempi vastaavuus kuuntelukokeiden tulosten kanssa. 4 DISKUSSIO Tässä artikkelissa esiteltiin perinteisistä ristikorrelaatiomalleista poikkeava auditorinen malli, joka pyrkii mallintamaan ihmisen kuulojärjestelmän toiminnallisuutta neurofysiologisella tasolla laskennallisten operaatioiden avulla. Artikkelissa esitellyt tulokset osoittavat mallin toiminnallisuuden sekä yksittäisen että samanaikaisten äänilähteiden tapauksissa. Myös useasta samankaltaisesta äänilähteestä koostuvan tilajakauman ta- 5

pauksessa mallin tulokset ovat lupaavia. Viimeksi mainittuun tapaukseen liittyvän kehitystyön lisäksi mallin kehitystyössä tullaan jatkossa tutkimaan mallin toiminnallisuutta kaiuntaisissa ympäristöissä. 4.1 Kiitokset Tätä tutkimusta on rahoittanut Suomen Akatemia. The research leading to these results has received funding from the European Research Council under the European Community s Seventh Framework Programme (FP7/2007-2013) / ERC Grant agreement No. 240453. VIITTEET [1] KARJALAINEN M, A new auditory model for the evaluation of quality measurements and spatial hearing studies, in IEEE on Acoust., Speech and Sig. Proc., pages 608 611, Tampa, USA, 1985. [2] MOORE B, GLASBERG B, & BAER T, A model for the prediction of thresholds, loudness and partial loudness, J. Audio Eng. Soc., 45(1998) 4, 224 237. [3] COLBURN H S, Computational models of binaural processing, in H Hawkins & T McMullen, editors, Springer Handbook on Auditory Research, Springer, New York, 1996. [4] GROETHE B, New roles for synaptic inhibition in sound localization, Nat. Reviews Neurosci., 4(2003), 540 550. [5] PULKKI V & HIRVONEN T, Functional count-comparison model for binaural decoding, Acta Acustica united with Acustica, 95(2009), 883 900. [6] BLAUERT J, Spatial Hearing, MIT Press, Cambridge, MA, USA, revised edition, 1997. [7] SANTALA O & PULKKI V, Directional perception of distributed sound sources, J. Acoust. Soc. Am., 129(2011) 3, 1522 1530. 6