Esa Hotanen HUT, Tietoliikenne ohjelmistojen ja multimedian laboratorio

Samankaltaiset tiedostot
HRTFN MITTAAMINEN SULJETULLA VAI AVOIMELLA KORVA- KÄYTÄVÄLLÄ? 1 JOHDANTO 2 METODIT

TEKNILLINEN KORKEAKOULU Tekijä: Juha Merimaa DIPLOMITYÖN TIIVISTELMÄ Työn nimi: Reaaliaikainen auralisaatio signaaliprosessorilla Päivämäärä:

KORVAKÄYTÄVÄN AKUSTIIKAN MITTAUS JA MALLINNUS 1 JOHDANTO 2 SIMULAATTORIT JA KEINOPÄÄT

Binauraalinen äänentoisto kaiuttimilla

3D-äänitystekniikat ja 5.1-äänentoisto

Digitaalinen signaalinkäsittely Kuvankäsittely

Kuulohavainto ympäristössä

Surround. Äänitys ja miksaus LFE-kanava 5.1. Mitä tarvitaan? 5 pääkaiutinta aktiivikaiuttimet passiivikaiuttimet + surround-vahvistin

ERILLISMIKROFONIÄÄNITYSTEN KÄYTTÖ PARAMETRISESSA TILAÄÄNEN KOODAAMISESSA

SUUNTAKUULON TOIMINNALLISUUDEN MALLINTAMINEN NEURO- FYSIOLOGISELLA TASOLLA 1 JOHDANTO 2 BINAURAALINEN AUDITORINEN MALLI

Digitaalinen audio

1 Vastaa seuraaviin. b) Taajuusvasteen

TELEKONFERENSSISOVELLUS JA SUUNTAMIKROFONITEKNIIKKA DIRAC-MENETELMÄLLE 1 JOHDANTO 2 YKSINKERTAISEN DIRAC-VERSION PERIAATE

Mono- ja stereoääni Stereoääni

YLEISIMMÄT MIKROFONITYYPIT

Kohti uuden sukupolven digitaalipianoja

Spektri- ja signaalianalysaattorit

Luento 15: Ääniaallot, osa 2

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN

Teknillinen korkeakoulu, Akustiikan ja äänenkäsittelytekniikan laboratorio PL 3000, TKK, Espoo

POHJOIS-KARJALAN AMMATTIKORKEAKOULU Viestinnän koulutusohjelma

HALLITSE ELÄMÄÄSI, ELÄ HETKESSÄ

1 Olkoon suodattimen vaatimusmäärittely seuraava:

Monikanavaäänen perusteet. Tero Koski

Qosmio: Kuule ero. entistä parempi kuuntelukokemus

SGN-4200 Digitaalinen audio

Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka. Vfo135 ja Vfp124 Martti Vainio

AKUSTISIA SIMULAATIOITA PÄÄ- JA TORSOMALLILLA. Tomi Huttunen, Timo Avikainen, John Cozens. Kuava Oy Microkatu 1, Kuopio

Kuuloaisti. Korva ja ääni. Melu

Antti Kelloniemi, Kalle Koivuniemi, Jarkko Punnonen, Sari Suomela. Tiivistelmä

PARAMETRISOITU TILAÄÄNENTOISTO JA -SYNTEESI VIRTUAALIMAAILMOISSA

Kojemeteorologia (53695) Laskuharjoitus 1

Langaton musiikkikeskus

SWEPT SINE MITTAUSTEKNIIKKA (NOR121 ANALYSAATTORILLA)

PSYKOAKUSTINEN ADAPTIIVINEN EKVALISAATTORI KUULOKEKUUNTELUUN MELUSSA

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

Äänen eteneminen ja heijastuminen

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.

havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä

Pianon äänten parametrinen synteesi

YKSILÖLLINEN HRTF 1 JOHDANTO. Tomi Huttunen 1, Antti Vanne 1. Haapaniemenkatu 40 E 1, Kuopio

Kaiuttimet. Äänentoisto. Klas Granqvist Akun Tehdas / Oy Aku s Factory Ltd

BINAURAALISELLA ÄÄNITYSTEKNIIKALLA TOTEUTETUN KUUNNELMAN TUNNELMALLINEN JA INFORMATIIVINEN LISÄ NÄKÖHAVAINNOIN TUTKITTAVAN KERRONNAN TUKENA

Matlab-tietokoneharjoitus

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Dynaamisten systeemien identifiointi 1/2

Successive approximation AD-muunnin

Etäkokouksen onnistumisen välttämätön edellytys on kuulla ja tulla kuulluksi. Ympäristö saattaa olla avotoimisto, auto, mikä tahansa muu kuin

Videotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi

LOPPURAPORTTI Lämpötilahälytin Hans Baumgartner xxxxxxx nimi nimi

Kuulokoje, joka avaa maailmasi

Telekonferenssisovellus ja suuntamikrofonitekniikka DirACmenetelmälle

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen

5 Akustiikan peruskäsitteitä

Missä mennään. systeemi. identifiointi. mallikandidaatti. validointi. malli. (fysikaalinen) mallintaminen. mallin mallin käyttötarkoitus, reunaehdot

T DSP: GSM codec

Digitaalinen audio & video I

AUTOJEN SISÄTILOJEN AKUSTIIKAN JA ÄÄNENTOISTON ANALYY- SI TILAIMPULSSIVASTEILLA

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

KONSERTTISALIAKUSTIIKAN SUBJEKTIIVINEN ARVIOINTI PERUSTUEN BINAURAALISIIN IMPULSSIVASTEISIIN 1 JOHDANTO

TILAIMPULSSIVASTEIDEN ANALYYSI JA SYNTEESI HUONEAKUS- TIIKASSA

Tiedonkeruu ja analysointi

Spektrin sonifikaatio

Realtek HD Audiohallinta Käyttäjän opas Vistakäyttöjärjestelmälle

BIOSÄHKÖISET MITTAUKSET

Cubase perusteet pähkinänkuoressa. Mikä Cubase on? Projektin aloitus

Yleistä. Digitaalisen äänenkäsittelyn perusteet. Tentit. Kurssin hyväksytty suoritus = Harjoitustyö 2(2) Harjoitustyö 1(2)

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Korkean resoluution ja suuren kuva-alueen SAR

2.1 Ääni aaltoliikkeenä

Samurai helppokäyttöinen ohjelma melun ja värähtelyjen mittauksiin

U-REMIX USB RF 2 RF 1 POWER

1. Perusteita Äänen fysiikkaa. Ääniaalto. Aallonpituus ja amplitudi. Taajuus (frequency) Äänen nopeus

Suodattimet. Suodatintyypit: Bessel Chebyshev Elliptinen Butterworth. Suodattimet samalla asteluvulla (amplitudivaste)

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

aktiivikaiuttimet Profel Nuovo Gamba aktiivinen High End subwoofer vallankumouksellisella bassoäänen automaattisella huonetilasäädöllä

Pikaohje Neuvottelupuhelin Konftel 50

Vector Base Amplitude Panning

ÄÄNILÄHDERYHMIEN TILAJAKAUMAN HAVAITSEMINEN 1 JOHDANTO 2 MENETELMÄT

Lisää ääntä. sitä tarvitseville.

aurelia aniara Käyttöohje

SIIRTOMATRIISIN JA ÄÄNENERISTÄVYYDEN MITTAUS 1 JOHDANTO. Heikki Isomoisio 1, Jukka Tanttari 1, Esa Nousiainen 2, Ville Veijanen 2

Oikeanlaisten virtapihtien valinta Aloita vastaamalla seuraaviin kysymyksiin löytääksesi oikeantyyppiset virtapihdit haluamaasi käyttökohteeseen.

Projektisuunnitelma ja johdanto AS Automaatio- ja systeemitekniikan projektityöt Paula Sirén

Signaalit ja järjestelmät aika- ja taajuusalueissa

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

TL5503 DSK, laboraatiot (1.5 op) Suodatus 1 (ver 1.0) Jyrki Laitinen

Kuule - luonnollisesti

Digitaalinen audio & video, osa I. Johdanto. Digitaalisen audion sovellusalueet. Johdanto. Taajuusalue. Psykoakustiikka. Johdanto Digitaalinen audio

Mukauta kuuntelukokemustasi kotona

ÄÄNTÄ VAHVISTAVAT OLOSUHDETEKIJÄT. Erkki Björk. Kuopion yliopisto PL 1627, Kuopion 1 JOHDANTO

Äänitetuotanto siirtyy Blu-ray -aikaan!

TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N)

Ambisonics. Jani Krigsman. Tiivistelmä

Åbo Akademi klo Mietta Lennes Nykykielten laitos Helsingin yliopisto

JOHDATUS TEKOÄLYYN TEEMU ROOS

Säätötekniikan ja signaalinkäsittelyn työkurssi

Tuotetiedot C: Asennus

Transkriptio:

Esa Hotanen HUT, Tietoliikenne ohjelmistojen ja multimedian laboratorio ehotanen@cc.hut.fi Tiivistelmä Tässä seminaarityössä käsitellään ensisijaisesti binauraalisen äänentoiston renderöintiä kuulokkeilla. Työssä tuodaan esille binauraalisen kuuloketoiston ja kaiutintoiston teknisiä eroavaisuuksia ja binauraalisen kuuloketoiston vaatimia erityispiirteitä, kuten kuuloke-ekvalisointi, pään asennon seuranta ja signaalin käsittely tilaäänentoistoa varten. Lisäksi työssä on kerrattu binauraaliseen äänentoistoon keskeisesti liittyviä käsitteitä ja lopuksi tutustutaan hieman markkinoilla oleviin tekniikoihin. Työstä olisi tarkoitus saada käsitys binauraalisen kuuloketoiston eri vaiheista äänityksestä kuulohavaintoon. 1 JOHDANTO Ihminen hahmottaa tilan pääasiassa näkö- ja kuuloaistien avulla. Esimerkiksi elokuvissa käytetään musiikkia ja ääniä luomaan kuvaan syvyyttä ja lisäämään läsnäolon tuntua. Parhaiten luonnolliseen ja realistiseen äänivaikutelmaan päästään binauraalisen äänentoiston avulla. Binauraalinen äänitys ja toisto tekevät kuulijalle täysin mahdolliseksi auraalisesti siirtyä tapahtumien keskipisteeseen. Binauraalisuus tarkoittaa kaksikorvaista kuulemista, jossa kuuntelija pystyy paikallistamaan äänilähteen. Ainut yhtäläisyys tavallisen stereotoiston kanssa on kahden kanavan käyttäminen auraalisen informaation välityksessä. Tässä seminaarityössä käsitellään binauraalista tekniikkaa erityisesti kuulokkeiden näkökulmasta. Tarkoitus on ensin luoda silmäys binauraalisen tekniikan keskeisimpiin peruskäsitteisiin ja tämän jälkeen pureutua tarkemmin binauraalisen kuuloketoiston erityispiirteisiin ja eroavaisuuksiin binauraaliseen kaiutintoistoon nähden. Työssä rajaudutaan käsittelemään lähinnä binauraaliseen kuuloke äänentoistoon liittyvää problematiikkaa poislukien binauraalisen äänityksen, vaikka tätäkin aihepiiriä sivutaan työssä. Myöskin signaalinkäsittelyä matemaattisena operaationa käsitellään vain pintapuoleisesti. 1

2 BINAURAALISEN ÄÄNENTOISTON PERUSTEET Binauraalinen tekniikka pohjautuu perusoletukseen, jonka mukaan äänipainesignaalit kummallakin tärykalvolla ovat fysiologisesti riittävä heräte auditoriselle järjestelmälle. Lokalisaatioinformaatio muodostuu oikeaan ja vasempaan korvaan tulevan äänen spektrin, amplitudin ja vaiheen eroista. Ihminen pystyy havaitsemaan noin parin asteen eroja äänilähteen suunnassa, tämän perusteella määritetään suuntakuulon resoluutio. Tärkeimpinä suuntainformaation lähteinä pidetään korvien välisiä aika- (Interaural Time Difference, ITD) ja tasoeroja (Interaural Level Difference, ILD). Aikaeron merkitys on suurin pienillä alle 1,5 khz taajuuksilla, jolloin korvien välinen etäisyys on pienempi kuin vastaava äänen aallonpituus (kuva 1a). Tätä suuremmilla taajuuksilla äänen aallonpituus on pään mittakaavassa niin pieni, että korvien väliseen etäisyyteen mahtuu useita aaltorintaman jaksoja, jolloin vaihe-eron päätteleminen hankaloituu. Yli 1,5 khz:n taajuuksilla kuuloaisti käyttääkin pääasiassa hyväkseen korvien välisiä tasoeroja (kuva 1b). Pään kokoluokkaa olevilla ja sitä pienemmillä aallonpituuksilla pään aiheuttama diffraktio aikaansaa merkittävän varjostuman äänilähteestä kauempana olevan korvan puolelle, jolloin tasot siellä ovat pienempiä (Pulkki, 2001). Maksimaalinen ero äänen havaitsemisessa korvien välillä on 650 µs tai 0.65 ms, tästä käytetään nimitystä binauraalinen viive (Rumsey, 2001). Kuva 1. Binauraalinen viiveen käyttäytyminen a) matalilla taajuuksilla (IDT) ja b) korkeammilla taajuuksilla (ILD). Korkeammilla taajuuksilla pää varjostaa ääntä. Binauraalisessa kuulemisessa äänilähteen suunnaksi havaitaan ensimmäisenä tulleen ääniaallon suunta, jos äänet saapuvat noin 35ms sisällä ja myöhemmät äänet eivät ole ensimmäisiä voimakkaampia (Rumsey, 2001). Tästä ilmiöstä käytetään nimitystä keksijänsä mukaan Haasin efekti. Haasin efekti liitetään pääasiassa yksittäisiin ääniin jatkuvien äänien kohdalla sillä ei ole juurikaan merkitystä. 2

2.1 Binauraalisuuteen liittyviä käsitteitä HRTF (HEAD RELATED TRANSFER FUNCTION) HRTF on vapaan kentän siirtofunktio tietystä pisteestä korvaan. Tulevan äänen suunnasta riippuen korviin tulee signaali, joka muuttuu voimakkuudeltaan sekä taajuussisällöltään (Maijala, 1997). Korvan harjanteet sekä kaikki muutkin pään ja olkapäiden muodot ja ihon ominaisuudet toimivat kuten monitaajuusselektiiviset suotimet, jotka on viritetty jokaisen ympäristömme äänen tulokulmalle niin sivusuunnassa kuin pystysuunnassakin. Aivot pystyvät paikallistamaan tulevan äänen pienestäkin muutoksesta taajuussisällössä, vaiheessa tai voimakkuudessa. HRTF:t ovat yksilöllisiä lähinnä anatomisista syistä, mikä asettaakin kuulokkeiden suunnittelijoille erityisen haasteen. Keinopää Useimmat binauraaliset äänitykset tehdään keinopäällä (dummy head), joka on tehty täysikasvuisen aikuisen pään mittojen mukaan. Siinä pyritään toistamaan mittojen ja yksityiskohtien lisäksi ihon pehmeys ja luun kovuus (Maijala, 1997). Oikeaa ihmistä ei äänityksissä juurikaan käytetä huonomman muokattavuuden vuoksi. Kuva 2. Bruel & Kjaerin valmistama HATS malli 4128D, kuvattuna eri suunnista (Rbüel & Kjaer 2002). Joissakin keinopäissä voi olla mukana myös olkapäät ja hiukset. Tälläisesta täydellisestä mallista (kuva 2) käytetään nimitystä HATS (Head And Torso Simulator) (Maijala, 1997). Kaikilla yksityiskohdilla on vaikutusta mikrofoneihin saapuvaan ääneen. Mikrofoneina käytetään yleensä pieniä suuntaamattomia kondensaattorimikrofoneja, jotka sijoitetaan korvakäytävän suulle tai lähelle. Joissakin malleissa mikrofonit on sijoitettu tärykalvon paikalle korvakäytäviin. Stereoäänityksen ja binauraalisen äänityksen erona on, että stereoäänityksessä mikrofonit sijoitetaan yleensä paljon kauemmaksi toisistaan kuin keskimääräinen korviemme välimatka (7 tuumaa tai 17-18 cm) (Maijala, 2001). Tällöin kanavien välinen viive ei vastaa 3

todellisuutta. Myöskään mukana ei ole HRTF:hen vaikuttavia korvalehteä, hartioita ja pääkalloa. Kalleimmissa malleissa mikrofonisignaaleille tehdään ekvalisointi korjaamaan äänen kaksinkertainen siirtyminen korvakäytävän läpi ensin äänitettäessä ja sitten toistettaessa. Kaikissa tapauksissa tavoitteena on säilyttää ihmisen kuuloaistin vaatimuksia vastaava lokalisaatioinformaatio. Tilakuuleminen Binauraalisista äänitteistä voidaan rekonstruoida äänitystapahtuman akustinen tilanne. Niistä saadaan selville äänittävän pään asento ja suhde äänilähteisiin. Sopivilla herätteillä saaduilla vasteilla voidaan mallintaa tila, esimerkiksi konserttisali tai muu haluttu ympäristö (Pulkki, 2001). Kunnollisen tilakuulemisen saavuttamiseksi pitää kuulokkeiden avulla äänentoiston lisäksi pystyä mallintamaan myös kuuntelutila. Kuitenkin binauraalisen äänittämisen lisäksi tarvitaan digitaalista signaalin käsittelyä luonnollisen tilaäänen mallintamisen aikaansaamiseksi. 3 BINAURAALINEN ÄÄNENTOISTO KUULOKKEILLA Binauraalinen kuulokeäänentoisto on sovellusalueena varsin uusi. Ensimmäiset todelliseen tilaäänentoistoon pystyvät kuulokkeet julkaistiin vasta 1996 Dolby Headphone tekniikan myötä, kuitenkin ensimmäiset tilaäänentoistoon pyrkivät kuulokkeita julkaistiin jo 1950-luvulla (Moy, 1999). 3.1 Kuuloketyypit Kuulokkeilla voidaan tuottaa äänipaineita korvaan monella eri tekniikalla. Sähköakustisena muuntimena voi olla pietsoelementti tai herkkä kalvo värähtelemässä sähkökentässä (sähköstaattiset kuulokkeet). Useimmat hyvälaatuiset kuulokkeet on kuitenkin toteutettu magneettisesti (dynaamiset kuulokkeet). Akustisen kytkennän perusteella kuulokkeet jaetaan yleensä kolmeen ryhmään: kuulokkeet, jotka lepäävät korvalehden päällä (supra-aural), laitetaan korvakäytävään (intra-aural) ja kuulokkeet, jotka ympäröivät korvalehden koskematta siihen (circumaural) (Maijala, 1997; Hirvonen, 2002). Korvakäytävään laitettavista ns. tulppamalleista voidaan vielä erottaa ns. nappikuulokkeet, jotka laitetaan korvakäytävän suulle. Tulppamallit sulkevat korvakäytävän kokonaan, mutta nappimallien akustinen kytkentä vaihtelee henkilöltä toiselle. Yleensä nappimalliset kuulokkeet eivät kuitenkaan sulje korvakäytävää täysin. Lisäksi kuulokkeet voidaan luonnollisesti luokitella langattomiin ja langallisiin. Binauraaliseen äänentoistoon pystyvät kuulokkeet voivat olla oikeastaan mitä tahansa mallia, koska tilan mallinnus suoritetaan lähinnä signaalinkäsittelyn avulla. 3.2 Binauraalisen kuuloketoiston erityispiirteitä ja ongelmatilanteita Keskeisimpiä ongelmia ja haasteita binauraaliseen äänentoistoon pystyviä kuulokkeita suunniteltaessa ovat lähinnä seuraavat: HRTF:t ovat yksilöllisiä. Tarvitaan menetelmä luoda yleispäteviä HRTF:itä tai muokata niitä yksilöllisesti ja reaaliaikaisesti kuuntelijalle sopivaksi. 4

In the head efektin eliminoiminen ja sen avulla tilakuulemisen mahdollistaminen. Kaiuttimille suunnitellun binauraaliselle audiolle vaaditaan erillinen taajuusvasteen korjaus kuulokkeita varten. 3.3 Päänseuranta Pään seurannalla tarkoitetaan pään asennon seurantaa äänikentässä. Jos pään asentoa ei seurata kuuloketoistossa liikkuu äänimaisema pään mukana, tällöin seurauksena on usein voimakas In the head efekti (Pulkki, 2001). Tällä tarkoitetaan epäluontevaa tunnetta, jossa äänilähde tuntuu tulevan pään sisältä. In the head efektiä esiintyy erityisesti korvalehden ympäröivissä stereokuulokkeissa (circumaural). Pään seurannan lisäksi luonnolliselta binauraaliselta kuuloketoistolta vaaditaan luonnollista jälkikaiuntaa. Pään seuranta kuulokkeissa perustuu menetelmään, jossa pään liikkeitä pystytään seuraamaan erillisen seurantalaitteiston avulla. Näin saatua informaatiota käytetään tilakuulumisen muokkaamiseen, jolloin virtuaalinen tila mallinnetaan uudestaan. Tämä edellyttää jatkuvaa HRTF:iden päivittämistä, jonka yleispätevänä riittävänä latenssi aikana voidaan pitää 85 ms:a. Käytännön sovelluksissa laskenta-aika on kuitenkin yleensä yritetty pitää noin 50 ms:ssa, tällöin haitallisia viiveitä ja siirtymäkaistoja (crossfading) ei esiinny (Rumsey 2001). 3.4 Taajuusvasteen korjaus kuuloketoistoa varten Termi binauraalinen edellyttää, että ääni toistetaan stereokuulokkeiden kautta, kun samaa äänitystä aiotaan toistaa stereokaiuttimilla käytetään termiä transauraalinen (Maijala, 1997). Äänitetty signaali prosessoidaan kompensoimaan kaiuttimien ja kuulokkeiden väliset erot, kuten korvien välinen ylikuuluminen ja taajuusvasteen epäideaalisuudet (Pulkki, 2001). Ylikuulumisella (cross-talk) tarkoitetaan kaiutinten äänikenttien sotkeutumista osittain toisiinsa esimerkiksi vasempaan korvaan tarkoitettu informaatio kuullaan myös oikeassa korvassa. Ylikuulumista aiheuttaa matalien taajuuksien lisäksi erilaiset tila-akustiset heijastukset. Ylikuuluminen ei kuitenkaan ole relevantti ongelma kuulokkeita käytettäessä. Taajuusvasteiden korjaamisen perusajatus on aikaansaada lineaarinen taajuusvaste, mitä voidaan pitää myös hi-fi äänentoiston perustavoitteena. Taajuusvasteiden korjausongelmasta päästäisiin helposti, jos valmistettaisiin erilliset musiikki- ja äänilevystöt kuulokkeita ja kaiuttimia varten (Rumsey, 2001). Kuitenkin käytännössä tämä ei ole mahdollista lähinnä taloudellisista syistä. Tyypillisesti taajuusvasteet ovat kaiutinkuuntelua varten ekvalisoitu, jolloin vaaditaan erillinen ekvalisointi kuulokkeita varten. Kuuloke-ekvivalisointi voidaan suorittaa joko erillisillä suotimilla tai yhdistää ne auralisaatiossa käytettäviin HRTF-suotimiin (Merimaa, 2000). Yksinkertaisimmin kuuloke ekvalisointi voidaan suorittaa suoraan kuulokkeista mitattujen vasteiden perusteella, kuitenkin käyttäjän lisäksi kuulokevasteisiin vaikuttavat kuuloketyyppi ja kuulokkeiden asento. Pahimmassa tapauksessa yhden mittauksen perusteella lasketut ekvalisointisuotimet saattavat jopa heikentää kuuloketoistoa (Merimaa, 2000). 5

Käytännössä kuulokesuotimet muodostetaankin useiden mittausten keskiarvona. Yleiskäyttöisten kuulokkeiden taajuusvasteiden korjaamiseen käytetään pääasiassa kahta menetelmää: vapaan kentän ja diffuusikentän korjausmenetelmiä. 3.4.1 Vapaan kentän ekvalisointi (Free-Field Calibration) Vapaan kentän kalibroinnin perusideana on verrata HRTF:itä tietyssä vapaan kentän pisteessä kuulokkeen siirtofunktioon PTF:ään (Headphone Transfer Function) samassa pisteessä (Hirvonen, 2002). Vertauspiste valitaan yleensä kuuntelijan edestä. Jos taajuusvasteet vastaavat toisiaan, niin kuulokkeiden toiston pitäisi kuulostaa kuin vapaassa kentässä olisi erillisiä äänilähteitä. Koska äänitettävällä päällä on erilliset siirtofunktiot äänen eri tulokulmille, tasaista taajuusvastetta ei voida saavuttaa kaikista kulmista. Vapaan kentän kalibroinnin huonona puolena on myös, että menetelmä perustuu monauraaliseen (yksikorvainen) HRTF:hen, koska monauraaliset tunnusluvut saattavat erota merkittävästi binauraalista (kaksikorvainen) tunnusluvuista (Maijala, 1997; Merimaa, 2000). 3.4.2 Diffuusikenttäkorjaus (Diffuse-Field Calibration) Diffuusikentänkorjausmenetelmä on kehittyneempi versio vapaan kentän kalibrointimenetelmästä. Diffuusikentän ekvalisoinnissa luodaan mittauspisteeseen joka suuntaan tasavahva äänikenttä ja sen avulla taajuusvaste. Näin ollen keskimääräinen äänikentän energia on vakio diffuusissa kentässä (Hirvonen, 2002). Käytännössä hajaantuvan kentän kalibrointi suoritetaan pääasiassa huoneessa, jossa on täysin heijastavat seinät. Huoneessa yksi kaiutin toimii valkoisen kohinan (white noise) lähteenä, jonka tarkoitus on aikaansaada diffuusi äänikenttä täyttämällä huone tasaisella äänikentällä. Toinen menetelmä hajaantuvan kentän avulla suoritettavan taajuusvasteen korjaamiseksi on käyttää heijastamatonta huonetta, jossa on useita kaiuttimia (Weikert 2002) Kaiuttimet sijoitetaan huoneen nurkkiin tai mahdollisimman kauas huoneen keskipisteestä, näin voidaan saada aikaan vakio äänikenttä keskellä huonetta olevalle alueelle. 3.5 Signaalin käsittely tilaäänen aikaansaamiseksi Ensimmäisiä monikanavaäänen avulla toteutettuja kuulokkeita olivat neljäkanavaiset kuulokkeet. Neljäkanavainen äänikenttä muodostetaan kahdella etu- ja takakaiuttimella. Tätä yritettiin mallintaa oheisen kuvan 3:n mukaisilla kuulokkeilla, jossa molemmat kuulokekupit sisälsivät kaksi kaiutinta (Moy, 1999). Tuloksena oli kuitenkin vain hiukan tavallisia stereokuulokkeita parempi tilainformaatio, koska kyseinen tekniikka ei ota millään tavoin huomioon äänen psykoakustisia ominaispiirteitä, kuten HRTF:ää tai jälkikaiuntaa. 6

Kuva 3. Neljä kanavaisessa kuulokkeessa käytettävä kuppi, jossa tilaääni pyritään luomaan jakamalla tietyt äänet surroudkaiuttimelle (Moy, 1999). Signaaliprosessoreiden kehitys on mahdollistanut ns. binauraalisen synteesin, jossa tilaja suuntavaikutelma lisätään jälkeenpäin monofoniseen äänisignaaliin. Binauraalisen synteesin avulla voidaan luoda kokonaisia virtuaalisia ääniympäristöjä. Binauraalisessa synteesissä monofoniseen äänisignaaliin lisätään suuntainformaatio suodattamalla signaalia kahdella digitaalisella suotimella, jotka mallintavat haluttuja HRTF-vasteita (Merimaa, 2000). Tuloksena on binauraalinen signaali, joka sisältää erilliset signaalit molemmille korville. Reaaliaikainen binauraalinen auralisaatio vaatii kuitenkin runsaasti prosessointitehoa ja on tullut mahdolliseksi kaupallisena sovelluksena vasta viime vuosina. Yksinkertaisin tapa on käyttää binauraalisessa auralisaatiossa mitattuja HRTF-vasteita suoraan FIR-suotimina (Finite Impulse Response). Mittaustulokset ovat kuitenkin tyypillisesti satojen näytteiden pituisia ja sisääntulosignaalit pitää suodattaa erikseen molemmille korvalle. Käytännössä näin pitkien signaalien realiaikainen suodattaminen on usein mahdotonta ja joudutaan turvautumaan hieman huonompiin approksimaatioihin (Merimaa, 2000). FIR-suodatin voivaan suunnitella näytteistämällä suodattimen taajuusvastetta halutulla tarkkuudella ja laskemalla impulssivaste Fourierkäänteismuunnoksella. Vastaava toimenpide voidaan suorittaa aika-alueessa ikkunoimalla minimivaiheista impulssivastetta suorakaideikkunalla. Toinen vaihtoehto HRTF-suodattamisen toteuttamiseen on käyttää takaisinkytkentää hyödyntäviä IIR-suodattamia (Infinite Impulse Response). IIR-suotimilla on mahdollisuus päästä eräissä tapauksissa tehokkaampiin toteutuksiin ja pienempiin suodattamien astelukuihin kuin FIR-suodattamilla. Kuitenkin IIR-toteutuksen huonona puolena on, että IIR-suotimien suunnittelu ja interpolointi suotimien välillä on hankalampaa (Merimaa, 2000). 4 KÄYTÄNNÖN SOVELLUKSIA Käytännössä suurimmaksi ongelmaksi yleispätevää binauraalista kuuloketoistoa rakennettaessa oli noussut yleisen HRTF:n tuottaminen reaaliaikaisesti. Yleistä HRTF:ää on pyritty 1990-luvulla rakentamaan luomalla laaja tietokanta HRTFsignaaleista binääriseksi hakurakenteeksi, josta valittiin sopivin kunkin kuuntelijan ominaisuuksille sekä lisäksi on yritetty luoda ns. universaalia HRTF-signaalia (Moy, 7

1999). Kumpikaan menetelmä ei kuitenkaan toiminut käytännössä. Vasta vuonna 1996 patentoidun innovaation pohjalta on syntynyt yleinen binauraalisessa kuuloketoistossa käytettävä de facto standardi Dolby Headphone, jonka avulla on pystytty ratkaisemaan signaalinkäsittelyongelma binauraalisessa kuuloketoistossa. Dolby Headphonen lisäksi on olemassa muitakin vähemmän kaupallista suosiota saavuttaneita menetelmiä. Dolby Headphone tekniikka ei edellytä yksilöllisiä HRTF-asetuksia eri käyttäjille, vaan pystyy käyttämään yleisiä asetuksia kaikille kuuntelijoille (Dolby Laboratories, 2002). Tämä perustuu erilliseen viisiosaiseen signaalinkäsittely-yksikköön, joka sisältää yhden aika-alueen LTI-suotimen (Linear Time-Invariant) ja neljä taajuusalueen FFTsuodinta (Fast Fourier Transform). Aika-alueen suotimella on lyhyempi suodin pituus ja pienemmät viiveet, kun taas FFT suotimissa on pidemmät suodinpituudet ja viiveet. Näitä kahta FIR suodintyyppiä yritettiin käyttää erikseen huonolla menestyksellä, kunnes keksittiin kuvan 4 mukainen rinnakkainen suodinrakenne, joka toimi reaaliaikaisissa sovellutuksissa tehokkaimmin. Perustava ajatus suotimessa on käsiteltävän informaation vähentäminen reaaliaikaista toistoa varten paremmin soveltuvaksi. Kuva 4. Dolby Headphone tekniikan signaalinkäsittely yksikkö, jossa ulostulosignaali Yk lasketaan Yx:stä viiden eri suodatusfunktion summana (Moy, 1999). Dolby Headphone tekniikan avulla pystytään luomaan tilavaikutelma niin tavallisesta stereoformaatissa olevasta äänitteestä kuin myös 5.1 kanavaisesta materiaalista. Yleisesti ottaen Dolby Headphone tekniikka pyrkii luomaan 5.1 kanavaista tilaääntä myös stereoäänityksiä kuunneltaessa. Bassokanava (.1) jaetaan molempiin (vasempaan ja oikeaan) kuulokkeisiin tasaisesti. Dolby Headphone tekniikalla valmistetuissa kuulokejärjestelmissä on tavallisten stereokuulokkeiden lisäksi mukana erillinen signaalinkäsittely-yksikkö, joka sisältää yleensä mahdollisuuden valita muutamista eri mallinnettavista virtuaalisista kuuntelutiloista (Dolby Laboratories, 2002). 8

5 YHTEENVETO Binauraalinen äänentoisto on monivaiheinen prosessi äänityksestä kuulohavaihtoon. Tässä prosessissa olevia vaiheita on esitetty kaaviokuvassa viisi. Ensimmäisessä vaiheessa suoritetaan äänitys joko keinopään tai oikean pään avulla tallentamalla binauraalinen signaali nauhalle. Tämän jälkeen suoritetaan joko signaalin käsittely tai ekvalisointi tapauksesta riippuvassa järjestyksessä. Kun signaali on äänitetty toistetaan se kuulokkeiden avulla. Tilaäänen luonnolliseen aistimukseen vaikuttaa moni tekijä, kuten äänen vaihe, taajuus, tulosuunta sekä lujuus. Näitä ominaisuuksia muokkaamalla saadaan aikaan tilaäänen auralisaatiossa tarvittava informaatio, jonka perusteella virtuaalisia äänitiloja muodostetaan. Lisäksi vaaditaan pään asennon seurantaa kunnollisen tilainformaation aikaansaamiseksi. Kuva 5. Binauraaliselta kuuloketoistolta edellytettävät vaiheet äänityksestä kuulohavaintoon. 3D-ääni on saavuttamassa yhä suurempaa kaupallista menestystä, hieman samaan tapaan kuin 3D-grafiikka. Kuuloketoistossa käytettävä tilaääni on vielä sovelluksena uusi ja tulee yleistymään jatkossa niin viihde- kuin hyötykäytössäkin. Binauraalisen kuuloketoiston avulla saavutetaan useita etuja tavalliseen kuuloketoistoon verrattuna. Päästään eroon pidemmän päälle rasittavasta in the head efektistä. Lisäksi hyödytään ns. binauraalisesta vahvistuksesta (binaural gain), jonka mukaan melun päällä toistettava binauraalinen ääni kuuluu noin 6-8 db lujempana kuin ei-binauraalinen ääni (Aureal Corp. 1998). Tätä ominaisuutta on alettu hyödyntää eräiden yhtiöiden lentokoneissa. Luonnollisesti binauraalisen toiston avulla pystytään luomaan aivan uudenlaisia virtuaalisia äänimailmoja, joiden avulla voidaan välittää runsaasti stereolähetyksessä vaikeasti havaittavissa olevaa informaatiota. Tästä on viihdekäytön lisäksi hyötyä useissa eri sovelluksissa esimerkiksi sotateollisuudessa. 9

LÄHDELUETTELO Aureal Corporation, 1998. Headwise: 3D-audio primer. Headwise: Technical papers library: http://headwize.com/tech/aureal1_tech.htm. [viitattu 9.1.2003]. Bruel & Kjaer, 2002: http://www.bksv.com/1667.htm. [viitattu 9.1.2003]. Chu Moy, 1999. Headwise: Technologies for Presentation of Surround-Sound in Headphones. Headwise, Technical papers library: http://www.headwize.com/tech/sshd_tech.htm. [viitattu 9.1.2003]. Dolby Laboratories inc. 2002: http://www.dolby.com/dolbyheadphone/. [viitattu 9.1.2003]. Hirvonen Toni, 2002. Diplomityö: Headphone listening test methods. Teknillinen Korkeakoulu. Maijala Panu, 1997. Diplomityö: Binauraalisen äänenlaadun arviointijärjestelmä. Teknillinen Korkeakoulu. Merimaa Juha, 2000. Diplomityö: Reaaliaikainen auralisaatio signaaliprosessoreilla. Teknillinen Korkeakoulu. Oomke Weikert, 2002. Realization of diffuse sound field with a PC based soundcard solution. Proc. of the 5 th Int. conference on digital audio effects, Hampuri, Saksa, syyskuu 26-28, 2002. University of the German Federal Armed Forces : http://www.unibwbamburg.de/eweb/ant/publications/dafx02_weikert_diff use_sound_field.pdf [viitattu 9.1.2003]. Pulkki Ville, 2001. Väitöskirja: Spatial sound generation and perception by amplitude panning techniques. Teknillinen Korkeakoulu. Rumsey Francis, 2001. Spatial Audio. Focal Press 2001, music technology series. 10