PASI JÄRVILEHTO HUONEVASTEEN MITTAUS JA MALLINNUS Kandidaatintyö Tarkastaja: lehtori Heikki Huttunen Tarkastaja ja aihe hyväksytty -
II TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Signaalinkäsittelyn ja multimedian koulutusohjelma JÄRVILEHTO, PASI: Huonevasteen korjaus Kandidaatintyö, 24 sivua Joulukuu 2011 Pääaine: Signaalinkäsittely ja multimedia Tarkastaja: lehtori Heikki Huttunen Avainsanat: Huonevaste, akustiikka, akustiset mittaukset, lineaarinen ennustus Työssä perehdytään huonevasteen mallintamiseen liittyviin tekniikoihin mittauksen sekä matemaattisen mallinnuksen pohjalta. Huonevasteella tarkoitetaan minkä tahansa tilan äänisignaaliin aiheuttamaa vääristymää. Näiden vääristymien syntyä tarkastellaan fysikaaliselta kannalta, minkä jälkeen esitellään erilaisia tapoja mallintaa vastetta mittausten pohjalta, ilman erillistä tietoa huoneen fysikaalisista ominaisuuksista. Menetelmät on valittu siten että ne soveltuisivat käytettäväksi huonevasteen korjauksessa. Huonevasteen korjauksella tarkoitetaan huoneen aiheuttamien vääristymien kumoamista.
III SISÄLLYS 1 Johdanto...1 2 Huoneen fysiikkaa...2 2.1 Heijastukset...2 2.2 Materiaalien absorptio...4 2.3 Seisovat aallot eli huonemoodit...5 3 Vasteen mittaaminen...7 3.1 Mittausjärjestelyt...8 3.2 Random Phase Multi Sine...9 3.3 Logaritminen sinipyyhkäisy...9 4 Mallinnus...12 4.1 Kohti matemaattista mallia...13 4.2 Taajuusresoluution valinta...15 4.3 Vasteen pehmennys...17 4.4 Lineaarinen ennustus mallinnuksen työkaluna...17 4.5 Akustiset navat (ja nollat)...20 5 Johtopäätökset...22 Lähteet...24
IV TERMIT JA NIIDEN MÄÄRITELMÄT Black-box mallinnus Presedenssi-ilmiö Jälkikaiunta-aika Huonemoodi Shroederin taajuus RPMS (Random Phase Multi Sine) Logaritminen sinipyyhkäisy RTF (Room Transfer Function) LTI järjestelmä Amplitudivaste Psykoakustiikka Bark-asteikko Kriittinen kaista Outlier Terssipehmennys AR-malli MA-malli ARMA-malli Akustinen napa Q-arvo Mallinnusmenetelmä joka ei nojaa fysikaaliseen tietoon mallinnettavasta kohteesta. Ihmisen kuulojärjestelmän ominaisuus, jossa varhaisia heijastuksia ei kuulla erillisinä ääninä suorasta äänestä. Aika joka kuluu äänilähteen vaimenemisesta, siihen että äänenpainetaso on laskenut 60 db. Merkitään usein T 60. Kahden pinnan välille syntyvä seisova aalto. Myös huoneen kriittinen taajuus. Taajuus jonka alapuolella huonemoodit ovat häiritseviä. Satunnaisen vaiheen, mutta määrätyn amplitudin omaava testisignaali. Testisignaali jonka taajuus kasvaa eksponentiaalisesti ajan funktiona. Huonevasteen matemaattinen kuvaus. Huonevasteen siirtofunktio z-tasossa. Lineaarinen, aikainvariantti järjestelmä Huonevasteen siirtofunktion esitys, joka kuvaa huoneen vaikutusta äänen voimakkuuteen taajuuden funktiona. Merkitään usein H RTF e j. Tieteenala joka tutkii ihmisen kuuloaistia ja kuulokokemusta. Ihmisen kuuloalueen jaottelu kriittisiin kaistoihin. Taajuuskaista jolla kaksi ääntä voivan maskata, eli peittää, toisensa. Poikkeava piste datajoukossa. Mittausvirhe. Amplitudivasteen keskiarvotusmenetelmä. Autoregressiivinen malli. Malli jonka ulostulo riippuu aikaisemmista ulostulon arvoista. Liikkuvan keskiarvon malli. Malli jonka ulostulo riippuu aikaisempien syötteiden arvoista. AR- ja MA-mallien yhdistelmä. Huonevasteen siirtofunktion napa joka on sama kaikille huoneesta mitatuille malleille. Resonanssipiikin kaistanleveyden ja keskitaajuuden suhde
1 JOHDANTO 1 1 JOHDANTO Kun ääntä toistetaan suljetussa tai osittain suljetussa tilassa, aiheuttaa tila siihen häiriöitä kaikujen ja resonanssien muodossa. Näitä häiriöitä nimitetään huonevasteeksi. Huonevastetta voidaan kuvata matemaattisella mallilla, jota voidaan käyttää erilaisiin käyttötarkoituksiin. Huonevasteen mallintaminen koostuu yleensä kahdesta vaiheesta; vastemittauksesta ja mallin laatimisesta mittausten pohjalta. Sekä mittaukselle, että mallintamiselle on esitetty useita menetelmiä jota poikkeavat toisistaan niin kompleksisuutensa kuin käyttökelpoisuutensa kannalta. Kuten mallinnusongelmissa yleensä, kaikissa tilanteissa hyvin toimivaa menetelmää ei ole olemassa. Mallin laatijan tehtäväksi jää arvioida eri menetelmien soveltuvuutta kulloinkin käsillä olevaan ongelmaan, eikä huonevasteen mallinnus ole tässä suhteessa poikkeus. Mallinnettavat huoneet saattavat poiketa toisistaan radikaalisti, eivätkä kaikki mallit ole yhtä käyttökelpoisia kaikissa tilanteissa. Tarkka malli voi esimerkiksi olla liian raskas tietokonepelin ääniä generoitaessa, kun taas liian yksinkertainen malli ei välttämättä tuota hyviä tuloksia äänitysstudion vastetta korjattaessa. Tässä työssä esitellään muutamia menetelmiä sekä vasteen mittaukseen, että yksinkertaistetun mallin laskemiseen mittauksesta. Koska mallintamisen lähtökohtana olisi aina syytä olla mallin käyttötarkoitus, on tämän työn kuvitteellisena tarkoituksena tuottaa malli joka soveltuu huonevasteen korjaukseen tavallisessa asuinhuoneistossa. Huonevasteen korjauksesta kerrotaan lisää luvussa 5. Luku 2 käsittelee kuuntelutilan akustisia ominaisuuksia ja niiden syntymekanismeja fysiikan kannalta. Luku 3 esittelee mahdollisen mittausjärjestelyn sekä kaksi huonevasteen mittaukseen hyvin soveltuvaa testisignaalia. Lopulta luvussa 4 tutustutaan itse mallinnukseen mittausten pohjalta.
2 HUONEEN FYSIIKKAA 2 2 HUONEEN FYSIIKKAA Kuuntelutila aiheuttaa muutoksia äänisignaaliin useilla eri tavoilla. Fysikaalinen teoria näiden muutosten taustalla on paljon tutkittu aihe, ja erilaisten vääristymien syntymekanismit ovat hyvin tunnettuja. Vaikka huonevasteen mallinnus on yleensä niin kutsuttua blackbox-mallinnusta, jossa mallinnusmenetelmä ei nojaa aikaisempaan fysikaaliseen tietoon mallinnettavasta kohteesta, on huoneakustiikan perusilmiöiden ymmärtäminen välttämätöntä. Joissakin tapauksissa mallinnusmenetelmän luotettavuus on voitu osoittaa myös fyysiseltä kannalta. Tässä luvussa tutustutaan niihin huoneakustiikan ominaisuuksiin jotka ovat relevantteja ihmisen kuuloaistimuksen kannalta. Tarkastelu tehdään yksinkertaistetusti, ja monet ääneen vaikuttavat tekijät rajataan tarkastelun ulkopuolelle vähäisen vaikutuksensa vuoksi. Tällaisia ilmiöitä ovat muun muassa ilman absorptio sekä äänen taittuminen. 2.1 Heijastukset Huone on rajattu alue jonka pinnoista ääniaallot heijastuvat. Heijastuksiin vaikuttavat tilan seinien, lattian ja katon lisäksi myös huoneessa mahdollisesti olevat esineet ja huonekalut. Heijastuminen on suurin huoneen akustiikkaan vaikuttava tekijä. Heijastuksia voidaan luokitella usealla eri tavalla. Useimmiten heijastukset jaotellaan joko aikatasossa sen mukaan milloin ne saavuttavat kuulijansa, tai taajuustasossa heijastuksista aiheutuvien seisovien aaltojen perusteella. Tässä luvussa esitetty malli perustuu ensimmäiseen luokitteluun. Seisovia aaltoja käsitellään erikseen luvussa 2.3. Kaiutin Varhainen heijastus Suora ääni Jälkikaiuntaa Toisen asteen heijastus Kuva 1: Ääniaaltojen heijastuminen huoneessa
2 HUONEEN FYSIIKKAA 3 Ääni voidaan jakaa kolmeen ryhmään sen mukaan milloin se saavuttaa kuulijansa; suora ääni, varhaiset heijastukset sekä jälkikaiunta. Kuva 1 selventää tilannetta. Keltainen pallo kuvaa joko kuuntelijaa ja nuolet ääniä jotka saapuvat eri suunnista. Suora ääni on ensimmäinen kuultava ääni. Se saavuttaa kuulijansa periaatteessa vääristymättömänä, ja ääni etenee lähteeltä kuulijalle heijastumattomana. Oletus ei ota huomioon aikaisempia ääniä jotka ovat yhä kuultavissa. Kun ääni heijastuu yhden tai useamman kerran jostain huoneen pinnasta, kutsutaan sitä varhaiseksi heijastukseksi. Varhaiset heijastukset saatetaan tulkita osaksi suoraa ääntä. Tämä edellyttää etteivät ne ole myöhästyneet liian paljon, ja että niiden spektri muistuttaa riittävästi suoran äänen spektriä. Tätä kutsutaan presedenssi-ilmiöksi, ja sillä on suuri vaikutus siihen, miten ihminen tulkitsee äänen tulosuunnan. Jotta ilmiö toimisi, on aikaero suoran äänen ja varhaisen heijastuksen välillä oltava alle 35ms [8]. Tällä aikaerolla on myös vaikutusta siihen, miten intiimiksi kuuntelutila koetaan. Kun ääni on heijastunut huoneessa useita kertoja, aletaan sitä kutsua jälkikaiunnaksi. Rajaveto heijastusten ja jälkikaiunnan välillä ei aina ole selkeä, kuten käy ilmi kuvasta 2. Kuvassa näkyvät impulssimaisen äänen jälkeen kuullut äänet. Korkein piikki on suora ääni. Sitä seuraavat varhaiset heijastukset ja lopulta jälkikaiunta. Kuvan mittausta voidaan pitää huoneen impulssivasteena. Huoneen vaste koostuu siis viivästetyistä ja vaimennetuista toistetun signaalin arvoista. Tämä vastaa tarkalleen FIR tyyppistä suodatinta, minkä vuoksi digitaalinen signaalinkäsittely soveltuu erinomaisesti huonevasteen mallintamiseen ja hallintaa. Mallintamiseen palataan tarkemmin luvussa 4. Äänenvoimakkuus Suora ääni Varhaiset heijastukset Jälkikaiunta kuva 2: Havaitut äänenvoimakkuudet impulssimaisen herätteen jälkeen Aika
2 HUONEEN FYSIIKKAA 4 Jälkikaiunta koostuu siis joukosta useasti heijastuneita ääniä jotka saavuttavat kuulijan useasta suunnasta samanaikaisesti. Jälkikaiunta on piirretty kuvaan 1 pienten nuolien muodossa, jotka ympäröivät kuulijansa. Jälkikaiunnan määrää kuvataan yleensä T 60 arvolla. T 60 tarkoittaa aikaa (sekunteina) joka kuluu äänilähteen hiljenemisestä siihen, että äänisignaali on vaimentunut 60 db. Jälkikaiunta-aikaa voidaan karkeasti arvioida kaavalla T 60 =0,161 V A (1) missä V on huoneen tilavuus neliömetreinä, ja A on huoneen kokonaisabsorptioala [8]. Kokonaisabsorptioala saadaan kaavan A=S 1 a 1 S n a n mukaisesti summaamalla absorboivien pintojen pinta-alat a i kerrottuina niiden absorptiokertoimilla S i. Materiaalien absorptiota käsitellään tarkemmin seuraavassa luvussa. On huomattava, että jälkikaiunta-aika ei ole sama kaikille taajuuksille, koska materiaalien absorptiokertoimet ovat riippuvaisia taajuudesta. Tästä huolimatta jälkikaiunta-aikaa pidetään yleisesti hyvänä mittarina kuuntelutilan ominaisuuksia arvioitaessa. Etenkin keskitaajuuksilla, noin 500 Hz, sen on todettu olevan hyvä indikaattori huoneen eloisuudesta. Pitkä jälkikaiunta-aika koetaan eloisaksi, kun taas lyhyt jälkikaiunta-aika koetaan selkeäksi. 2.2 Materiaalien absorptio Huoneen eri pinnat eivät heijasta kaikkea äänienergiaa yhtä tehokkaasti. Ääniaallon tehon johtumista materiaaliin, ja siitä seuraavaa äänen voimakkuuden heikentymistä kutsutaan absorboitumiseksi. Absorption määrään vaikuttaa materiaalin laatu jota määritetään niin sanotulla absorptiosuhteella. Absorptiosuhde 1 kuvastaa täydellistä absorboitumista ja 0 täydellistä heijastumista. Absorptio ei ole yhtä voimakasta kaikille taajuuksille, mikä voidaan selkeästi havaita taulukosta 1. Taulukon arvot on haettu [8, s 466]. Taulukko 1: Joidenkin materiaalien absorptiokertoimia eri taajuuksille Materiaali 125 Hz 250 Hz 500 Hz 1 khz 2 khz 4 khz Betoni (maalattu) 0.10 0.05 0.06 0.07 0.09 0.08 Matto (betonilla) 0.02 0.06 0.14 0.37 0.6 0.65 Puulattia 0.15 0.11 0.1 0.07 0.06 0.07 Akustiikkalevy 0.14 0.20 0.76 0.79 0.58 0.37 Taulukosta voidaan huomata muun muassa, että betoni, jonka absorptiokertoimet ovat pieniä, heijastaa kaikkia taajuuksia tehokkaasti. Vastaavasti huomataan, että akustiikka levy vaimentaa tehokkaasti ääniä joiden taajuus on välillä 500-1000 Hz.
2 HUONEEN FYSIIKKAA 5 Koska absorptio vaikuttaa äänen jälkikaiunta-aikaan, voidaan materiaalivalinnoilla vaikuttaa suoraan huonevasteeseen. Korkeilla, tyypillisesti yli muutaman sadan hertsin, taajuuksilla huonevastetta voidaan muokata kohtuullisen vaivattomasti, mutta matalilla taajuuksilla tarvittava absorptiopinta-ala kasvaa helposti liian suureksi [12]. Kuten käy ilmi Carini et. al. [7] suorittamista mittauksista, on huoneen materiaaleilla huomattava vaikutus eri taajuisten äänten jälkikaiunta-aikaan. 2.3 Seisovat aallot eli huonemoodit Huonemoodit, tai huoneen ominaistaajuudet, ovat seisovia aaltoja joita syntyy pääasiassa huoneen vastakkaisten seinien välille, sekä katon ja lattian välille. Ne ovat kuultavissa äänen voimistumisena joissain kohdissa huonetta, ja vastaavasti vaimentumisena toisissa kohdissa. Huonemoodin aiheuttama vahvistus voi olla jopa yli 10 db luokkaa. Ääniaalloille pätee niin sanottu superpositioperiaate, eli aaltojen vaikutukset voidaan summata. Huoneessa ääni ja vaikuttaa itseensä. Taajuuksilla joilla heijastuminen aiheuttaa seisovan aallon, sanotaan resonanssitaajuudeksi. Resonanssitaajuuksien riippuvuutta huoneen dimensioista voidaan kuvata kaavalla f ijk = c 2 i l 2 j w 2 k h 2 (2) missä c on äänen nopeus 1, l huoneen pituus, w huoneen leveys ja h huoneen korkeus. i, j ja k voivat saada mitä tahansa positiivisia kokonaislukuarvoja [9]. Näiden arvojen eri yhdistelmät kuvaavat huoneen kanssa resonoivia taajuuksia. Taulukossa 2 on laskettu muutamia resonanssitaajuuksia laatikolle jonka dimensiot metreinä ovat l =0.8, w =1.0 ja h =2.0, ja jossa c = 344 metriä sekunnissa. Taulukko 2: Resonanssitaajuuksia laatikolle jolle l=0.8, w=1.0 ja h=0.2 f 001 = 86 Hz f 010 =172 Hz f 100 =215 Hz f 002 =172 Hz f 011 =192 Hz f 101 =232 Hz f 111 =289 Hz f 020 =344 Hz f 200 =430 Hz Huonemoodeja syntyy siis, kun huoneen jokin dimensio vastaa puolta soivan äänen aallonpituudesta, tai on jokin sen monikerta. Tämä voidaan ottaa huomioon esimerkiksi kuuntelutilojen suunnittelussa. Vaikka suunnittelulla voidaan vaikuttaa pahimpiin moo- 1 Äänen nopeutta (metriä/sekunnissa) voidaan approksimoida kaavalla c=331,4 0,6 t, missä t on ilman lämpötila celsius asteina [9]. Tässä approksimaatiossa ilmankosteuden sekä mahdollisen ilman liikkeen vaikutus on jätetty huomiotta. Äänen nopeus huoneistossa jossa on 23 lämmintä on siis 345,2 m/s.
2 HUONEEN FYSIIKKAA 6 deihin, ei seisovista aalloista päästä kokonaan eroon. Ongelmaan on pyritty vastaamaan jo pitkään esimerkiksi taajuuskorjaimilla. Huonemoodien häiritsevä vaikutus on kuitenkin rajoittunut vain matalille taajuuksille. Korkeilla taajuuksilla seisovat aallot eivät erotu toisistaan ja niiden muodostamaa äänikenttää voidaan pitää tasaisesti jakautuneena. Tilastollisesti huonemoodien määrä ' N mode taajuudelle f voidaan laskea kaavalla ' N mode f =4 V f 2 /c 3, (3) missä V on huoneen tilavuus kuutiometreinä ja c on äänen nopeus [5]. Vastaavasti jälkikaiunnan aiheuttamien heijastusten määrä sekunnissa voidaan laskea kaavalla ' N refl ' N refl t =4 c 3 t 2 /V (4) Kaavoista huomataan, että moodien määrä kasvaa neliöllisesti taajuuden funktiona. Matalia taajuuksia lukuun ottamatta moodien määrä, sekä heijastusten esiintymisnopeus ylittävät ihmisen tarkan havaintokyvyn [5]. Korkeinta taajuutta, jonka jälkeen ihminen ei enää havaitse moodien aiheuttamaa häiriötä, kutsutaan huoneen kriittiseksi taajuudeksi joka tunnetaan myös Schroederin taajuutena. Tätä taajuutta voidaan approksimoida kaavalla f s =2000 T 60 /V, (5) missä T 60 on huoneen jälkikaiunta-aika, ja V on huoneen tilavuus [10]. Huoneen kriittisen taajuuden laskemisesta on huomattavasti apua myös huonevasteen mallinnuksen yhteydessä, sillä sitä korkeampia taajuuksia voidaan mallintaa pienemmällä tarkkuudella havaittavan laadun kuitenkaan heikkenemättä. Huonemoodien mallinnukseen palataan tarkemmin luvussa 4.5.
3 VASTEEN MITTAAMINEN 7 3 VASTEEN MITTAAMINEN Huoneen akustisia ominaisuuksia kuvataan usein impulssivasteella. Impulssivaste on täydellinen kuvaus huoneen dynamiikasta ja soveltuu siten käytettäväksi monissa eri sovelluksissa. Impulssivasteesta päästään myös helposti taajuusvasteeseen, joka on erityisesti huonevasteen korjauksessa paljon käytetty esitysmuoto. Yksinkertaisin tapa huoneen impulssivasteen määrittelemiseen on vasteen mittaaminen todellisesta ympäristöstä. Vaikka vasteita voidaan laskea myös teoreettisesti, on se mahdollista vain hyvin yksinkertaisille tiloille. Mittaaminen tapahtuu toistamalla sopiva testisignaali, ja mittaamalla se joko yhdestä tai useammasta pisteestä. Mittaus voidaan suorittaa myös useamman kerran samalle mittauspisteelle ja keskiarvottaa mittaustulos, jolloin mittauskohinan ja häiriöiden vaikutus pienenee. Vaikka mittauksen tarkoituksena on määrittää impulssivaste, ei impulssimaisen testisignaalin käyttö ole juuri koskaan perusteltua. Äärettömän korkean ja kapean signaalin generointi ja toistaminen on mahdotonta. Tällaista ns. deltasignaalia huomattavasti parempia tuloksia saavutetaan ristikorrelaatioon perustuvilla impulssivasteen määritysmenetelmillä. Tällaisissa menetelmissä testisignaalin valinnalla on suuri vaikutus mittausten luotettavuuteen. Eri tyyppiset signaalit eroavat toisistaan muun muassa häiriönsietokyvyltään, sekä robustiudeltaan huonevasteen ominaisuuksien muutoksia vastaan. Joillakin signaaleilla on lisäksi muita hyödyllisiä ominaisuuksia. Esimerkiksi logaritmisella sinipyyhkäisyllä voidaan mittauksesta erotella vasteen lineaarinen osa epälineaarisista harmonisista särökomponenteista [1]. Vaikka toiset testisignaaleista tuottavat selvästi parempia tuloksia kuin toiset, ei ole olemassa vain yhtä signaalia, joka toimisi optimaalisesti kaikissa olosuhteissa. Esimerkiksi mittauksen aikaiset häiriöt aiheuttavat häiriön tyypistä riippuen erilaisia ongelmia erilaisille signaaleille. On paljon tilanteita joissa häiriöihin ei voida vaikuttaa. Esimerkiksi liikenteen ääniin tai koneellisen ilmastoinnin aiheuttamaan huminaan on hyvin vaikeaa puuttua. Koska tässä työssä keskitytään huonevasteen määrittämiseen asuinhuoneistossa vasteen korjauksen kannalta, on mallin robustius pieniä muutoksia vastaan tärkeää. Asuinhuoneistoissa pienet muutokset ovat tavallisia esimerkiksi huonekalujen siirtämisen seurauksena, eikä uuden mallin jatkuva mittaaminen ole järkevää. Kuten Mateljan sekä Ugrinovic toteavat, robustius voidaan saavuttaa vain signaaleilla joilla on satunnainen vaihe [2]. Tässä työssä tarkempaan tarkasteluun on valittu ns. RPMS signaali (Random Phase Multi Sine, luku 3.2), sekä logaritminen sinipyyhkäisy (luku 3.3), jotka soveltuvat erinomaisesti huonevasteiden määritykseen todellisissa akustisissa ympäristöissä.
3 VASTEEN MITTAAMINEN 8 3.1 Mittausjärjestelyt Huonevaste mitataan toistamalla ja mittaamalla testisignaali. Kuva 3 havainnollistaa tilannetta, jossa generoidaan diskreetti testisignaali x n, joka D/A-muunnetaan ja toistetaan. Huonetta ja äänentoistojärjestelmää kuvataan yhteisellä siirtofunktiolla H RTF. Näin on luonnollista tehdä etenkin tilanteissa joissa tarkoituksena on korjata huonevastetta, koska myös äänentoistojärjestelmän aiheuttamat vääristymät halutaan korjata. Mittausjärjestelmän aiheuttamat vääristymät oletetaan vähäisiksi, eikä niitä ole tässä huomioitu. Mitattua ja diskretoitua vastetta kuvataan y n :llä. x(n) Huone D/A H RTF (w) A/D A/D y(n) y ref (n) Kuva 3: Mittausjärjestelmä Itse vasteen mittauksen lisäksi on mahdollista mitata myös referenssisignaali y ref n. Tämä signaali mitataan testisignaalin generoinnin ja D/A muunnoksen jälkeen ennen kuin se syötetään vahvistimelle. Menetelmän etuna sekä syöte, että vaste saadaan taltioitua synkronisesti. Lisäksi molemmilla on varmasti sama näytteenottotaajuus. Tällainen menettely ei kuitenkaan sovellu kovin hyvin kuluttajatason mittauksiin ja sillä menetelmä vaatii korkealuokkaisen äänikortin jonka tulot ovat yhtä tarkkoja. Yleisemmin käytetty menettely on suorittaa vain yksi mittaus ilman referenssisignaalia. Jos testisignaali on jaksollinen, saadaan impulssivasteen taajuusvasteen estimaatti jakamalla testisignaalin ja mittauksen ristispektri Y X * testisignaalin autospektrillä kaavan X X * H Y X * RTF = X X * (6) mukaisesti [2]. Suurimmalle osalle testisignaaleista mittausten keskiarvottaminen parantaa mittausten signaali-kohinasuhdetta. Usein on edullista suorittaa sama mittaus useaan otteeseen ja laskea niiden keskiarvo. Tällöin voidaan käyttää samaa signaalia herätteenä kaikille mittauksille, jolloin menetelmää kutsutaan aikatason synkroniseksi keskiarvottamiseksi.
3 VASTEEN MITTAAMINEN 9 Menetelmä torjuu satunnaista kohinaa, mutta ei poista epälineaarisia vääristymiä, eikä stationaarisia häiriöitä jotka ovat jaksollisia herätteen aikana. Parempi vaihtoehto on generoida jokaista mittausta varten uusi testisignaali, jolloin menetelmää nimitetään taajuustason synkroniseksi keskiarvottamiseksi. Menetelmä parantaa signaali-kohinasuhdetta kertoimella 10log N, missä N on keskiarvotettavien mittausten lukumäärä [2]. 3.2 Random Phase Multi Sine Random Phase Multi Sine, vapaasti suomennettuna satunnaisvaiheinen monisini, on jaksollinen signaali, jolla on määrätty amplitudi, mutta satunnainen vaihe [2]. RPMS signaalia jonka amplitudi on vakio kutsutaan valkoiseksi RPMS signaaliksi, sillä sen tehospektri on myös vakio yli koko taajuusalueen. Huonevasteen määrittämisessä vaaleanpunainen spektrin omaava signaali on kuitenkin käyttökelpoisempi, sillä järjestelmästä aiheutuva kohina on värittynyttä. Vaaleanpunainen spektri tarkoittaa sitä, että signaalin teho on kääntäen verrannollinen sen taajuuteen, eli matalilla taajuuksilla on enemmän tehoa. RPMS signaali voidaan generoida kaavalla N 1 g n = 1 N k=0 A k e j k e j2 kn/ N, (7) missä A k on k :nnen sinikomponentin amplitudi, ja k k :nnen sinikomponentin vaihe. Vaihe on satunnaisluku välillä k [0,2 ], ja täyttää ehdot N k = k, N /2 =0 [2]. RPMS signaalin on havaittu toimivat hyvin tilanteissa, joissa signaali-kohinasuhde on alhainen. Kohinaa voidaan poistaa myös suorittamalla mittaus useampaan otteeseen, ja keskiarvottamalla tulos (katso kappale 3.1). Keskiarvottaminen on erittäin tärkeää etenkin käytettäessä jatkuvaa RPMS herätettä, jolloin signaalin spektri ei ole tasainen kaikille taajuusalueille. On arvioitu, että tarvitaan jopa kahdeksan mittausta, jotta tulos olisi verrattavissa yhden jakson RPMS mittaukseen [2]. 3.3 Logaritminen sinipyyhkäisy Logaritmisella sinipyyhkäisyllä tarkoitetaan sinisignaalia jonka taajuus kasvaa eksponentiaalisesti ajan funktiona (kuva 4). Koska kutakin taajuutta esiintyy signaalissa vain hetkellisesti, on signaali luonteeltaan transientti. Logaritminen sinipyyhkäisy voidaan generoida kaavalla
3 VASTEEN MITTAAMINEN 10 x n =sin 2 f 1 T ln f 1 f 2 n T e ln f 2 f 1 1, (8) missä f 1 on pyyhkäisyn aloitustaajuus, f 2 lopetustaajuus ja T pyyhkäisyn kesto sekunteina [2, 9]. Todellista mittausta suorittaessa signaali kannattaa ikkunoida molemmista päistä esimerkiksi hanning-ikkunalla, joka takaa sopivan spektrin myös signaalin alussa että lopussa. Ikkunoinnin lisäksi signaalin perään on lisättävä nollia siten, että äänettömän, nollia sisältävän, osuuden kesto on pidempi kuin huoneen jälkikaiunta-aika T 60. Kuva 4: Logaritmisen sinipyyhkäisyn spektrogrammi (20-20 000 Hz) Kuva 5:Osa logaritmista sinipyyhkäisyä, jossa f 1 = 20 Hz, f 2 = 160 Hz
3 VASTEEN MITTAAMINEN 11 Huonevaste saadaan mitatusta signaalista suodattamalla se niin sanotulla dekonvoluutiosuodattimella, joka vastaa herätesignaalia käännettynä ajassa takaperin ja painottamalla sitä logaritmisesti. Painotus tarvitaan, sillä mitatun vasteen taajuuskaista ei ole tasainen [9]. Dekonvoluutio on laskennallisesti tehokkaampaa tehdä taajuustasossa, missä konvoluutio muuttuu kertolaskuksi. Tämä edellyttää, että signaaleille on laskettava diskreetit Fourier'n muunnokset (DFT:t). Herätesignaali nollineen on syytä valita siten, että sen pituus vastaa DTF:n ikkunan pituutta. Logaritmisen sinipyyhkäisyn suurin etu on sen kyky erotella epälineaariset särökomponentit lineaarisesta vasteesta. Dekonvoluution laskennan jälkeen epälineaariset komponentit ilmenevät impulssivasteessa ennen lineaarista osaa ja ne voidaan jättää huomioimatta. Sinipyyhkäisyn on myös osoitettu olevan robusti pieniä vasteen muutoksia kohtaan. Tästä on suuri etu etenkin asuinhuoneistoa mallintaessa. Lisäksi Logaritmisen sinipyyhkäisyn spektri on vaaleanpunainen, eli se sopii erinomaisesti akustisiin mittauksiin [2]. Sinipyyhkäisyn suurin heikkous ovat mittausympäristöt joissa ilmenee hetkittäisiä impulssimaisia häiriöitä. Häiriö ei jakaudu tasaisesti impulssivasteeseen, vaan aiheuttaa siihen vääristymän. Keskiarvottaminen ei poista ongelmaa, vaan saattaa päinvastoin pahentaa sitä [2]. Tällaisessa ympäristössä luvussa 3.2 käsitelty RPMS-signaali antaa parempia tuloksia.
4 MALLINNUS 12 4 MALLINNUS Huonevaste selvitetään usein toistamalla ja mittaamalla testisignaali. Kuten luvussa 3 todettiin, saadaan mittausten tuloksena huoneen impulssivaste. Vaikka impulssivaste itsessään on täydellinen malli huoneen akustisista ominaisuuksista, ei se käytännössä useinkaan ole sellaisenaan käyttökelpoinen. Yksinkertaisin tapa mallintaa huonetta on nähdä impulssivasteen kertoimet FIR tyyppisen suodattimen kertoimina, kuten luvussa 2.1 todettiin. Menettely aiheuttaa kuitenkin ongelmia sekä pituutensa että tarkkuutensa puolesta. Esimerkiksi kun huoneen jälkikaiunta-aika on 500ms, ja vaste mitataan näytteenottotaajuudella f s =44100 Hz, saadaan impulssivasteen pituudeksi 22050 näytettä. Huonevaste, tai ainakin sen merkittävimmät ominaisuudet, voidaan kuitenkin esittää huomattavasti yksinkertaistetummin. Tästä on etua muun muassa adaptiivisen suodatuksen sovelluksista joissa suotimen konvergoitumisnopeus voi olla riippuvainen parametrien määrästä [6]. Impulssivastetta on monesti myös edullista käsitellä eri tavoin ennen sen soveltamista vaikkapa korjaavan suotimen suunnitteluun. Tässä luvussa esitellään joitakin yleisesti käytettyjä menetelmiä huonevasteen mallintamiseen huomattavasti impulssivastetta vähemmillä kertoimilla. Lisäksi esitellään joitakin käsittelytoimenpiteitä, joilla vasteesta saadaan robustimpi pienille muutoksille kuunteluympäristössä. Mallintamiseen on esitetty useita toisistaan huomattavasti poikkeavia menetelmiä joita ei tässä työssä voida työn lyhyyden vuoksi käsitellä. Työssä rajoitutaan tarkastelemaan lähinnä amplitudivasteen mallintamista lineaariseen ennustukseen perustuvilla menetelmillä. Yleisesti paljon käytetyt parametrisiin suotimiin perustuvat mallit on rajattu laajuutensa vuoksi tämän työn ulkopuolelle.
4 MALLINNUS 13 4.1 Kohti matemaattista mallia Huonevastetta käsiteltäessä on huonevasteen siirtofunktio (RTF, eli Room Transfer Function) usein hyödyllinen apuväline. Koska huoneen akustisten ominaisuuksien vaikutus äänisignaaliin voidaan nähdä lineaarisena aikainvarianttina järjestelmänä (englanniksi LTI), voidaan huonevastetta kuvata diskreetillä yhtälöllä y n = k=1 a i y n i b i x n i, (9) i=0 missä y n on järjestelmän ulostulo ajanhetkellä n, ja vastaavasti x n on järjestelmän sisäänmeno ajanhetkellä n [6]. Yhtälön 9 kuvaama herätteen ja vasteen riippuvuus voidaan z-tasossa ilmaista kaavalla Y z =H RTF z X z. (10) Siirtofunktio z=e j H RTF z on taajuustason kuvaus huonevasteesta, ja sijoittamalla sekä ottamalla itseisarvo, saadaan amplitudivaste H RTF e j. Amplitudivaste on taajuuden funktio joka kuvaa kunkin taajuuden vaimenemisen tai voimistumisen määrää ko. pisteessä. Kuvassa 6 on esitetty esimerkki eräästä huoneen amplitudivasteesta. Kuvasta huomataan, että huone vaimentaa korkeita taajuuksia matalia taajuuksia enemmän mittauspisteessä. Kuva 6: Erään huoneen amplitudivaste taajuuksila 0 22050 Hz
4 MALLINNUS 14 Huonevastemittauksia suoritetaan yleensä useissa eri kohdissa huonetta. Näin saadaan parempi kuva huoneen yleisitä ominaisuuksista. Miksi näin on, tarkastellaan lähemmin luvussa 4.5. M:n mitatun vasteen joukkoa voidaan merkitä H RTF r j, z = Q i=0 P 1 i =1 b i r j z i a i r j z i, j=1,, M. (11) Missä r j kuvaa uniikkeja mittaussijainteja, ja a i ja b i ovat siirtofunktion painokertoimia. Mitatut vasteet kannattaa keskiarvottaa ennen muuta käsittelyä. On huomattava, että tässä kappaleessa tarkoitettu keskiarvottaminen ei suoranaisesti liity kappaleessa 3 esitettyyn mittausten keskiarvottamiseen, vaikka menetelmät sellaisenaan siihen soveltuisivatkin. Kappaleessa 3 esitetty keskiarvottaminen tehdään yhdestä pisteestä mitatuille vasteille mittauksen luotettavuuden takaamiseksi, eikä se poista tarvetta eri sijainneista mitattujen vasteiden käsittelylle. Carini et. al. [7] ehdottavat keskiarvottamiseen seuraavia menetelmiä: 1. Neliöllinen keskiarvo = H rms e j 1 M M H RTF r j,e j 2 (12) j=1 Carinin mukaan riittävän suurella määrällä vasteita menetelmä tulos vastaa yleistä trendiä sekä vähentää outlierien vaikutusta [7]. 2. Keskiarvo H mean e j = 1 M H M r,e j RTF j (13) j =1 Tavallinen keskiarvottaminen torjuu vasteen huippujen ja kuoppien vaikutusta, ja tuottaa usein neliöllisen keskiarvon menetelmään verrattuna paremman estimaatin huoneen yleisistä ominaisuuksista [7].
4 MALLINNUS 15 3. Min-Max H mm e j = 1 2 max H RTF r j,e j min H RTF r j,e j (14) r j r j Menetelmä on herkkä outliereille ja selkeästi virheellisille mittauksille [7]. 4. Mediaani Vaste lasketaan hieman monimutkaisemmalla menetelmällä kuin aikaisemmissa kohdissa; jokaiselle estimaatin taajuudelle lasketaan arvo joukon H RTF r j,e j vastaavien taajuuksien mediaanina. Mediaani otetaan järjestämällä tarkasteltavat taajuudet suuruusjärjestykseen ja valitsemalla keskimmäinen arvo. Jos mittauksia on parillinen määrä, lasketaan kahden keskimmäisen arvon keskiarvo. H median e j =median H RTF r j,e j (15) r j Outlierien vaikutus estimaattiin on esitellyistä menetelmistä kaikkein pienin. Mediaani torjuu tehokkaasti kaikki huiput ja kuopat, jotka esiintyvät vain pienessä osassa mittauksia [7]. Carini et. al. [7] mukaan kaikilla menetelmillä saadut tulokset olivat todella hyviä, mutta erityisesti mediaanin laskentaan perustuva menetelmä havaittiin tehokkaaksi. 4.2 Taajuusresoluution valinta Huonevastetta mallintaessa koko taajuusaluetta ei välttämättä kannata mallintaa täydellä resoluutiolla. Vasteelle voidaan laskea useita malleja eri taajuuskaistoille vaihtelevalla tarkkuudella. Tällaisesta menettelystä käytetään nimitystä Frequency Zooming [5, 7], eli vapaasti suomennettuna taajuus kohdennus. Etenkin huonevastetta korjauksen yhteydessä mallin yksinkertaistaminen on edullista, sillä suodatus on raskas operaatio joka saatetaan haluta toteuttaa reaaliajassa. Mallin yksinkertaistaminen ei kuitenkaan tarkoita, että sen kuultava laatu kärsisi. Kuinka tarkkaan mallinnus sitten pitäisi tehdä, ja millä perusteella tarkkuus valitaan? Ongelmaa voidaan lähestyä psykoakustiikan tarjoamien tutkimustulosten pohjalta. Ihmisen kuulojärjestelmä ei toimi samalla tarkkuudella koko kuultavalla taajuusalueella (noin 20-20000 Hz). Lisäksi ihmisen kuulon voidaan katsoa toimivan suunnilleen logaritmisesti. Tietoa kuulon herkkyydestä häiriöille eri taajuusa-
4 MALLINNUS 16 lueilla voidaan pitää pohjana mallin yksinkertaistamiselle. Samoja menetelmiä käytetään hyvin yleisesti muun muassa puheen pakkauksessa. Ihmisen kuulon voidaan katsoa jakautuneen taajuustasossa niin sanottuihin kriittisiin kaistoihin. Kriittisellä kaistalla soivista kahdesta signaalista hiljaisempaa ei kuulla. Tällöin voimakkaamman äänen sanotaan maskaavan hiljaisemman. Kriittiset kaistat ovat erilaisia eri ihmisillä, mutta yleisesti voidaan todeta, että kaistanleveys on pienempi matalilla taajuuksilla ja kasvaa kohti korkeita taajuuksia. Kaistat ovat lomittaisia, epäsymmetrisiä ja riippuvat mm. äänenvoimakkuudesta. Monimutkaisuudestaan huolimatta jo yksinkertainen kaistojen malli tuo huomattavaa etua. Usein [5, 7] käytetty malli on kaistojen jako niin sanotun Bark asteikon mukaan. Bark asteikko on jaettu vaihtelevan kokoisiin taajuuskaistoihin kuvan 7 mukaisesti 2. Kuva 7: Bark-asteikko Kriittisen kaistan kaistanleveyden kasvu tarkoittaa signaali kohinasuhteen heikkenemistä. Matalat taajuudet myös maskaavat korkeita taajuuksia paremmin kuin korkeat taajuudet matalia. Ihmisen kuulo toimii siis tarkemmin matalilla taajuuksilla. Tyypillinen tapa käyttää asteikkoa onkin muuttaa impulssivasteen taajuusresoluutio tarkemmaksi matalille taajuuksille jolloin voidaan esimerkiksi taata lineaariseen ennustukseen perustuvan mallin riittävä tarkkuus tälle taajuusalueelle [7]. 2 Kuvan arvot on haettu 18.12.2011 osoitteesta https://ccrma.stanford.edu/~jos/bbt/bark_frequency_scale.html
4 MALLINNUS 17 Korkeammilla taajuuksilla, yli 1-2 khz, ihmisen kuulojärjestelmä ei myöskään kykene luotettavasti erottamaan äänen vaihetta [5]. Näin ollen korkeiden taajuuksien mallintamiseen riittää pelkkä amplitudivaste. 4.3 Vasteen pehmennys Mitattu amplitudivaste on harvoin käyttökelpoinen ilman minkäänlaista käsittelyä. Yleisin käsittely on vasteen pehmennys. Tarkoituksena on poistaa amplitudivasteesta mahdolliset mittausvirheet jotka näkyvät vasteessa satunnaisina piikkeinä, sekä huonemoodeista johtuvat notkahdukset ja kapeat huiput. Pehmennystä käytetään usein myös helpottamaan amplitudivasteiden lukemista. Niin kutsuttu terssipehmennys on huonevasteita käsiteltäessä varmasti eniten käytetty menetelmä. Se tunnetaan myös kansainvälisesti paremmin 1/3 oktaavin pehmennyksenä. Ajatuksena on lakea amplitudivasteen arvo kullekin taajuudelle keskiarvona ympäröivien taajuuksien arvoista. Keskiarvoon lasketaan kaikki taajuudet jotka ovat enintään 3 2 päässä laskettavasta taajuudesta. Vaikka terssipehmennystä käytetään paljon, on sen soveltuvuutta mallinnuksen apuvälineenä kritisoitu, koska pehmennys on liian voimakasta [3]. Pehmennys voidaan vaihtoehtoisesti suorittaa esimerkiksi 1/20 oktaavin välein, jolloin se seuraa vastetta tarkemmin. Tässä kappaleessa esitetyn pehmennyksen huonona puolena on se, ettei se vaikuta mallin pituuteen. Mitatusta impulssivasteesta saatu malli on usein liian pitkä sellaisenaan käytettäväksi ja sen sisältämä informaatio voidaan esittää myös huomattavasti yksinkertaisemmin. Seuraavissa kappaleissa tutustutaan lineaariseen ennustukseen, jonka avulla saadaan pehmennystä vastaava tulos, sekä lyhyempi malli. Vaikka terssipehmennys sellaisenaan ei ole optimaalinen ratkaisu, on se houkutteleva vaihtoehto yksinkertaisuutensa vuoksi. Sitä voidaan käyttää myös osana monimutkaisempia algoritmeja [7]. 4.4 Lineaarinen ennustus mallinnuksen työkaluna Äänisignaaleja on jo pitkään ollut tapana mallintaa lineaarisen ennustuksen avulla. Menetelmä on saavuttanut huomattavan aseman etenkin puheen mallinnuksessa pakkausta varten. Lineaarisella ennustuksella tarkoitetaan nimensä mukaisesti lineaarisen järjestelmän ulostulon ennustamista aikaisemmista ulostuloista sekä syötteistä lineaarisen yhtälön avulla. Periaate selviää hyvin kaavasta P y n = i =1 Q a i y n i b i x n i (16) i =0 missä x n on järjestelmän syöte ajanhetkellä n, y n vastaavasti järjestelmän ulostulo ajanhetkellä ja y n ulostulon estimaatti. Mallinnuksen tavoitteena on löytää so-
4 MALLINNUS 18 pivat parametrit kertoimille a i ja b i siten että estimaatti vastaisi mahdollisimman tarkasti todellista ulostuloa. Mallin pituus on siis P Q 1, ja mallin laatija voi vapaasti valita arvot P :lle ja Q :lle. Järjestelmän siirtofunktion estimaatti on muotoa B z H z = A z = Q i =0 P 1 i=1 b i z i a i z i (17) Tässä muodossa funktion napoja, ja funktion A z nollakohdat eli kertoimet a i kuvastavat järjestelmän B z nollakohdat b i vastaavasti järjestelmän nollia. Jos kaavan 17 kertoimet b i =0, i 0 ja b 0 0, on kyseessä niin sanottu autoregressiivinen (eli AR) malli. Malli vastaa all-pole tyypistä suodinta, eli sillä on pelkkiä napoja sekä mahdollinen vahvistuskerroin g. Tällöin kaava 17 saa muodon H z = g A(z), missä A z =1 a 1 z 1 a p z p (18) Tällaisessa mallissa järjestelmän ulostulo pyritään laskemaan vain järjestelmän aikaisemmista ulostuloista ja senhetkisestä sisäänmenosta. Näin ollen ratkaistavaksi jäävät kertoimet a i, sekä b 0 joka on järjestelmän senhetkinen vahvistus. Kerroin b 0 vastaa siis g :tä kaavassa 18. Autoregressiiviset mallit soveltuvat hyvin huonevasteen mallintamiseen useista syistä. Ne kuvaavat hyvin etenkin huonemoodien vaikutuksia amplitudivasteeseen, kuten seuraavassa luvussa todetaan. Lisäksi AR mallit ovat minimivaiheisia, eli niillä on stabiili inverssi. Tästä on huomattavaa hyötyä etenkin huonevasteen korjauksen yhteydessä. Parametrien estimointi, eli mallin laskeminen mittauksen perusteella, on myös suhteellisen yksinkertaista. Yleisin menetelmä kertoimien laskemiseksi on niin kutsuttu pienimmän neliösumman menetelmä (englanniksi Least Squares), jonka pääperiaatteet esitellään seuraavaksi. Kaavojen tarkemmat johdot löytyvät [11]. Menetelmässä mallin parametrit a i haetaan siten että, estimaatin ja todellisen mittauksen välisen virheen e n = y n y n E P =e n 2 = n= neliö minimoituu. Ennustusvirheen energiaksi E P saadaan P 2 a i. (19) y n i i =0 E P on siis parametrien a i funktio, ja jotta se olisi mahdollisimman pieni, on sen kaikkien osittaisderivaattojen parametrien a i suhteen oltava nollia. Osittaisderivaatta yksittäisen parametrin suhteen on
4 MALLINNUS 19 P E p =2 a a i r y i k (20) k i=0 missä r i k on mitatun signaalin autokorrelaatio viiveellä i k, eli r y i k = y n i y n k. (21) n= Kaava 21 voidaan ilmaista myös yksinkertaisemmin autokorrelaation viiveen funktiona muodossa r y d = y n y n d, (22) n= missä d=i k. Kun yhtälön 20 mukaiset osittaisderivaatat lasketaan kaikkien parametrien a i suhteen, ja asetetaan nolliksi, päädytään muutaman välivaiheen jälkeen matriisiyhtälöön [ r 0 r 1 r 2 r P 1 a0 r 1 r 1 r 0 r 1 r p 2 a 1 r 2 Ra=r r 2 r 1 r 0 r p 3 a r P 1 r P 2 r P 3 r 0 ][ 2 r 3, (23) a P]= [ r P ] missä R :ää kutsutaan autokorrelaatiomatriisiksi. Koska mitatun signaalin autokorrelaatiot ovat tunnettuja, voidaan parametrit a i sisältävä vektori a ratkaista kääntämällä autokorrelaatiomatriisi ja kertomalla yhtälö 23 sillä vasemmalta. Tämä on kuitenkin hyvin raskas operaatio, ja parametrit voidaankin ratkaista yksinkertaisemmin. Suosituimmat menetelmät ovat niin kutsuttu Levinson-Durbin rekursio sekä Burgin menetelmä. Jos taas kaavan 17 kertoimet a i =0, on kyseessä liukuvan keskiarvon (eli MA, moving average) malli. Liukuvan keskiarvon mallit vastaavat FIR suotimia, ja niillä on pelkkiä napoja, sekä mahdollinen vahvistuskerroin g. H z =gb z, (24) missä B z =b 1 z 1 b Q z Q. Liukuvan keskiarvon mallit vastaavat FIR suotimia, ja niillä on pelkkiä napoja, sekä mahdollinen vahvistuskerroin g. Yhdistettyä mallia, joka sisältää sekä napoja, että nollia, kutsutaan ARMA malliksi. Kuten luvussa 4.5 todetaan, on sekä navoilla, että nollilla oma osuutensa huoneen akus-
4 MALLINNUS 20 tiikan kuvaamisessa, joten ARMA mallit ovat pelkkiä AR- tai MA malleja ilmaisuvoimaisempia. ARMA mallien laskentaan käytetään usein joko Pronyn menetelmää tai Steigliz-McBride menetelmää [5]. Lineaarisen ennustuksen etuna on kuvata mallinnettavaa järjestelmää pienellä määrällä parametreja. Mallille laskettavien parametrien määrä täytyy kuitenkin päättää ennen laskennan aloittamista, ja koska parametrien määrällä on suuri vaikutus mallin kykyyn kuvastaa kohdettaan, on usein tarpeellista laskea useita malleja ennen kuin sopivat määrät löydetään. Tämän lisäksi mallien laskenta on yleensä raskas operaatio, ja monet laskentamenetelmät ovat iteratiivisia. Kaikki menetelmät eivät myöskään takaa mallin stabiiliutta, vaan siitä on varmistuttava erikseen. 4.5 Akustiset navat (ja nollat) Haneda et. al. osoittavat [6], että kaikilla huoneesta mitatuilla vasteilla on yhteiset akustiset navat. Akustinen napa on siis huonevasteen osa, joka ei ole riippuvainen kuuntelusijainnista. Akustisilla navoilla on yhteys fysikaaliseen maailmaan, ja niitä voidaan laskea myös teoreettisesti (katso kaava 3). Asiaa voidaan havainnollistaa seuraavalla esimerkillä. Ajatellaan kaavaan 11 mukaista tilannetta jossa H RTF r j, z on joukko eri pisteissä mitattuja impulssivasteita. Muutokset näissä vasteissa johtuvat mittauspaikan muutoksesta. Kuva 8 esittää mitattua äänenvoimakkuutta kuvitteellisessa huoneessa kahden seinän välillä. Kuvan mustat viivat esittävät huoneessa esiintyvää seisovaa aaltoa (seisovia aaltoja käsitellään tarkemmin luvussa 2.3), ja punaiset pisteet mitattua äänenvoimakkuutta. Äänenvoimakkuus on sitä kovempi, mitä kauempana piste sijaitsee vaaka akselista. Kuva 8: Huonemoodit kahden seinän välillä
4 MALLINNUS 21 Kuten huomataan, on miltei jokaisessa mittauksessa informaatiota seisovasta aallosta. Tämä informaatio on mallin navoissa, joita nimitetään akustisiksi navoiksi. Jokaisen mittauksen amplitudi on kuitenkin riippuvainen mittauspisteestä, ja tämä informaation on mallin nollissa. Nollien voidaan myös katsoa kuvastavan heijastusten aikatason käyttäytymistä [5]. Kaikki mittaukset eivät kuitenkaan välttämättä sisällä informaatiota kaikista huoneen akustisista navoista. Esimerkiksi kuvan 8 toinen mittaus osuu huonemoodin solmukohtaan. Ilmiö selittyy myös napojen riippuvuudella mittauksen sijainnista. Solmukohdassa vasteen nolla vaimentaa samalla kohtaa sijaitsevan navan. Tästä syystä napojen määritykseen tulisi käyttää useita mittauksia eri kohdista huonetta. Haneda et. al. ehdotavatkin menetelmää, jossa eri vasteille määritellyistä navoista lasketaan keskiarvo. AR mallin parametrien, ts. mallin sisältämien akustisten napojen, määrän valinta on edelleen ongelma. Mikä on riittävä määrä napoja kuvaamaan huonevastetta tarpeeksi hyvin? Haneda et. al. totesivat, että jos mallin aste on pienempi kuin huoneen todellisten akustisten napojen lukumäärä, vastaavat mallinnetut navat huoneen pahimpia moodeja, joilla on korkea Q-arvo [6]. Toisin sanoen jo vähäisellä parametrien määrällä voidaan saada suhteellisen hyvä malli. Lopullinen mallin hyvyyden arviointi riippuu kuitenkin mallin käyttötarkoituksesta.
5 JOHTOPÄÄTÖKSET 22 5 JOHTOPÄÄTÖKSET Huonevasteen mallinnuksella on useita käyttökohteita aina konserttisalien suunnittelusta pelien ja elokuvien äänimaailman tuottamiseen. Erilaiset mallit soveltuvat hyvin eri tarkoituksiin, joten mallinnuksen lähtökohtana toimii sen lopullinen käyttötarkoitus. Tämän työn lähtökohtana on ollut huonevasteen mallinnus huonevasteen korjausta silmällä pitäen. Huonevasteen korjauksella tarkoitetaan toimia joilla pyritään kumoamaan huoneen äänisignaalille aiheuttamia vääristymiä. Korjausta voi suorittaa monella tapaa aina äänilähteiden sijoittelusta huoneen materiaalivalintoihin, mutta tässä yhteydessä sillä tarkoitetaan kuultavan äänen parantamista digitaalisen suodatuksen keinoin. Kuten luvuissa 2.1 sekä 4.1 todettiin, voidaan huonevasteen vaikutukset kuvata digitaalisella suodattimella. Korjauksen tarkoitus on löytää tälle suodattimelle käänteissuodin siten, että ne yhdessä kumoavat toistensa vaikutuksen. Käänteissuodin on yleensä staattinen suodin tai suodinpankki, ja suodatus tehdään toistettavalle audiosignaalille usein reaaliajassa. Korjaavan suodattimen ei tarvitse olla kausaalinen, mutta tällöin toistettavaan signaaliin aiheutuu ei-kausaalista osaa vastaava viive. Yksinkertaisimmillaan korjaavaksi suotimeksi valitaan mallin H RTF inverssi H RTF 1. Tämä ei kuitenkaan aina ole mahdollista, sillä huonevasteet ovat tyypillisesti ei-minimivaiheisia, eli niillä ei ole stabiilia inverssiä. Vasteesta voidaan kuitenkin pyrkiä erottamaan minimivaiheinen osa ja korjaamaan vain sitä. Korjaus ei myöskään aina ole käytännössä mahdollista, vaikka teoreettinen käänteissuodin löydettäisiinkin. Esimerkiksi amplitudivasteessa esiintyvää syvää notkahdusta ei välttämättä ole järkevää korjata kovalla vahvistuksella, vaikka se suodinten kannalta teoreettisesti mahdollista olisikin. Yleisestikään suurien korjauksien tekeminen kapealla taajuuskaistalla ei ole järkevää, sillä tällaiset vasteet ovat usein hyvin paikallisia. Useiden mittausten keskiarvottaminen, vasteen pehmennys tai mallintaminen lineaarisen ennustuksen avulla on suotavaa tasaisemman mallin amplitudivasteen saavuttamiseksi [4]. Korjaavan suotimen löytäminen on menetelmien automatisoinnin kannalta vaikein osa huonevasteen korjausta. Koska koko huonevasteen korjauksen tarkoitus on parantaa subjektiivista elämystä, suunnittelussa ei välttämättä voida hyödyntää yleisesti käytettyjä laadun tunnuslukuja. Teoreettisesti hyvä tulos saattaa kuulostaa huomattavasti huonommalta kuin toinen, teoreettisesti heikompi tulos. Lisäksi yhden henkilön mielestä onnistunut korjaus saattaa myös olla huono toisen henkilön mielestä. Nämä seikat vaikeuttaa entisestään geneeristen algoritmien kehittämistä ja erityisesti täysin automaattisten järjestelmien suunnittelua. Vaikka markkinoilla on useita automaattisia järjestelmiä,
5 JOHTOPÄÄTÖKSET 23 on niiden korjattava vastetta hyvin maltillisesti, ja parempiin tuloksiin päästään, jos korjaukseen voidaan itse vaikuttaa. Absoluuttisten suunnittelusääntöjen puutteesta huolimatta voidaan huonevastetta korjaavalle suotimelle, ja tätä kautta mallille, määritellä jotain hyviä ominaisuuksia. Huoneelle tehtävät mittaukset suoritetaan yleensä vain kerran, ja samaa suodinta saatetaan käyttää vaikka huoneen akustiset ominaisuudet ajan kuluessa muuttuisivat. Esimerkiksi huonekalujen järjestys [7] ja huoneessa olevien materiaalien laatu vaikuttavat vasteeseen. Suotimen täytyy kestää jonkin verran muutoksia huoneen dynamiikassa ilman, että se vaikuttaa ainakaan huonontavasti vasteeseen. Korjaavan suotimen tulisi myös toimia koko kuuntelualueella, ei ainoastaan tietyssä pisteessä. Tällöin myös mallin on kyettävä kuvaamaan huoneen ominaisuuksia laajemmalla alueella.
24 LÄHTEET [1] A. Farina, Simultaneous measurement of impulse response anddistortion with a swept-sine technique, 108 th AES Conference, 2000 [2] I. Mateljan, U. Kosta, The comparison of room impulse response measureing systems, Proceedings of the First Congress of Alps Adria Acoustics Association, Portorož, Slovenia, 2003 [3] S. Bharitkar, C. Kyriakakis, T. Holman, Variable-Octave Complex Smoothing for Loudspeaker- Room Response Equalization, Proc. IEEE Intl. Conf. consumer Elect., Las Vegas, NV, Jan. 2008 [4] M. Karjalainen, T. Paatero, J.D. Mourjopoulos, P.D. Hatziantoniou, About room response equalization and dereverberation, IEEE Workshop on Applications of Signal Prosessing to Audio and Acoustics, New York, October, 2005 [5] M. Karjalainen, T. Paatero, New digital filter techniques for room response modeling, AES 21 st International Conference, June, 2002 [6] Y. Haneda, S. Makino, Y. Kaneda, N. Kitawaki, Common Acoustical Pole and Zero Modeling of Room Transfer Functions, IEEE transactions on speech and audio processing, vol. 2, no. 2, April 1994 [7] A. Carini, S. Cecchi, F. Piazza, I. Omiciuolo, G.L. Sicuranza, Multiple Position Room Response Equalization in Frequency Domain, Audio, Speech, and Language Processing, IEEE Transactions on, vol.20, no.1, pp.122-135, Jan. 2012 [8] T. D. Rossing, The Science of Sound, 2 nd edition, Addison-weley Publishing Company, March, 1990 [9] H. Autio, Kaikumallin toteutus akustiikan mittauksista, Kandidaatintyö Tampereen Teknillisen Yliopiston Signaalinkäsittelyn laitokselle, Toukokuu, 2011 [10] Schroeder, M. R. The Schroeder frequency revisited, Journal of the Acoustical Society of America, vol. 99, May 1996 [11] K. Koppinen, Puheenkäsittelyn menetelmät, Luentomateriaali Tampereen Teknillisen Yliopiston kurssille SGN-4010, Joulukuu, 2006, (WWW) Viitattu 18.12.2011. Saatavissa: http://www.cs.tut.fi/courses/sgn-4010/sgn4010.pdf [12] A. Mäkivirta, P. Anstalo, M. Karjalainen, V. Välimäki, Low-Frequency Modal Equalization Of Loudspeaker-Room Responses, Convention Paper 5480 Presented at the AES 111th Convention, New York, September, 2001