ERILLISMIKROFONIÄÄNITYSTEN KÄYTTÖ PARAMETRISESSA TILAÄÄNEN KOODAAMISESSA



Samankaltaiset tiedostot
PARAMETRISOITU TILAÄÄNENTOISTO JA -SYNTEESI VIRTUAALIMAAILMOISSA

3D-äänitystekniikat ja 5.1-äänentoisto

TELEKONFERENSSISOVELLUS JA SUUNTAMIKROFONITEKNIIKKA DIRAC-MENETELMÄLLE 1 JOHDANTO 2 YKSINKERTAISEN DIRAC-VERSION PERIAATE

Antti Kelloniemi, Kalle Koivuniemi, Jarkko Punnonen, Sari Suomela. Tiivistelmä

ÄÄNILÄHDERYHMIEN TILAJAKAUMAN HAVAITSEMINEN 1 JOHDANTO 2 MENETELMÄT

Telekonferenssisovellus ja suuntamikrofonitekniikka DirACmenetelmälle

AUTOJEN SISÄTILOJEN AKUSTIIKAN JA ÄÄNENTOISTON ANALYY- SI TILAIMPULSSIVASTEILLA

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN

ÄÄNI-INTENSITEETIN ESTIMOINTI LAAJAKAISTAISESTI PAINE- JA ENERGIA- GRADIENTTIEN AVULLA SEKÄ SOVELTAMINEN ÄÄNEN TULOSUUNNAN ANALY- SOINNISSA

PSYKOAKUSTINEN ADAPTIIVINEN EKVALISAATTORI KUULOKEKUUNTELUUN MELUSSA

TILAIMPULSSIVASTEIDEN ANALYYSI JA SYNTEESI HUONEAKUS- TIIKASSA

Kohti uuden sukupolven digitaalipianoja

Ambisonics. Jani Krigsman. Tiivistelmä

Pianon äänten parametrinen synteesi

Monikanavaäänen perusteet. Tero Koski

KONSERTTISALIAKUSTIIKAN SUBJEKTIIVINEN ARVIOINTI PERUSTUEN BINAURAALISIIN IMPULSSIVASTEISIIN 1 JOHDANTO

HRTFN MITTAAMINEN SULJETULLA VAI AVOIMELLA KORVA- KÄYTÄVÄLLÄ? 1 JOHDANTO 2 METODIT

Malmin lentokentän tulevaisuus. Malmin lentokentän tulevaisuus

Organization of (Simultaneous) Spectral Components

SUUNTAKUULON TOIMINNALLISUUDEN MALLINTAMINEN NEURO- FYSIOLOGISELLA TASOLLA 1 JOHDANTO 2 BINAURAALINEN AUDITORINEN MALLI

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali

Ristitulolle saadaan toinen muistisääntö determinantin avulla. Vektoreiden v ja w ristitulo saadaan laskemalla determinantti

Surround. Äänitys ja miksaus LFE-kanava 5.1. Mitä tarvitaan? 5 pääkaiutinta aktiivikaiuttimet passiivikaiuttimet + surround-vahvistin

Mikrofonien toimintaperiaatteet. Tampereen musiikkiakatemia Studioäänittäminen Klas Granqvist

SAVONLINNASALI, KOY WANHA KASINO, KONSERTTISALIN AKUSTIIKKA. Yleistä. Konserttisali

Binauraalinen äänentoisto kaiuttimilla

Äänen eteneminen ja heijastuminen

Luento 15: Ääniaallot, osa 2

Uusia sovelluksia kalojen havainnointiin Case Montta. Pertti Paakkolanvaara Simsonar Oy. Kuva Maanmittaus laitos 2.2.

AKUSTINEN SUUNNITTELU HUONETYYPIN PERUSTEELLA

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.

MUUTA ÄÄNIEN SEKAMELSKA ONNITTELU LAULUKSI

SGN-4200 Digitaalinen Audio Harjoitustyö-info

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

FYSIIKAN LABORATORIOTYÖT 2 HILA JA PRISMA

Kaiuttimet. Äänentoisto. Klas Granqvist Akun Tehdas / Oy Aku s Factory Ltd

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

3 Suorat ja tasot. 3.1 Suora. Tässä luvussa käsitellään avaruuksien R 2 ja R 3 suoria ja tasoja vektoreiden näkökulmasta.

Syksyn 2015 Lyhyen matematiikan YO-kokeen TI-Nspire CAS -ratkaisut

Tv-äänisuunnittelu. Antti Silvennoinen Tel

Seuraavia painikkeita klikkaamalla voit aktivoida, eli ottaa käyttöön (vihreä ikoni) tai poistaa käytöstä (valkoinen ikoni) toimintoja.

Avid Pro Tools Äänityksen perusteet. Petri Myllys 2013 / Taideyliopisto, Sibelius-Akatemia tp48 Äänitekniikan perusteet

Suora. Määritelmä. Oletetaan, että n = 2 tai n = 3. Avaruuden R n suora on joukko. { p + t v t R},

PUHEEN EROTETTAVUUDEN ENNUSTE- JA MITTAUSMENETELMÄT

PAKOPUTKEN PÄÄN MUODON VAIKUTUS ÄÄNENSÄTEILYYN

1 Vastaa seuraaviin. b) Taajuusvasteen

5 Akustiikan peruskäsitteitä

Lisää ääntä. sitä tarvitseville.

Avaruuden kolme sellaista pistettä, jotka eivät sijaitse samalla suoralla, määräävät

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

SOUNDGATE. Yhteydessä maailmaan SoundGaten avulla

ELEC C4140 Kenttäteoria (syksy 2016)

2.3 Voiman jakaminen komponentteihin

Vector Base Amplitude Panning

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Qosmio: Kuule ero. entistä parempi kuuntelukokemus

S OPTIIKKA 1/10 Laboratoriotyö: Polarisaatio POLARISAATIO. Laboratoriotyö

SWEPT SINE MITTAUSTEKNIIKKA (NOR121 ANALYSAATTORILLA)

Ajolista: Adobe Connect 8 yhteyden avaaminen

Mono- ja stereoääni Stereoääni

ENE-C2001 Käytännön energiatekniikkaa. Aloitustapaaminen Osa III: Tekninen raportointi

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Tilastotieteen jatkokurssi syksy 2003 Välikoe

MUUTA PIKKU TERVEHDYS LÄMPIMÄKSI KOHTAAMISEKSI

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Echo MegaLoop+ Induktiovahvistin. Käyttöohje. Maahantuoja: Audienta Oy Nuijamiestentie 5 A HELSINKI

Kojemeteorologia. Sami Haapanala syksy Fysiikan laitos, Ilmakehätieteiden osasto

23 VALON POLARISAATIO 23.1 Johdanto Valon polarisointi ja polarisaation havaitseminen

AKUSTINEN KAMERA ILMAÄÄNENERISTÄVYYSONGELMIEN SEL- VITTÄMISESSÄ

Sonera Neuvottelupalvelut Microsoft Office 365 -sisäänsoittopalvelu. Pikaopas

1 2 x2 + 1 dx. (2p) x + 2dx. Kummankin integraalin laskeminen oikein (vastaukset 12 ja 20 ) antaa erikseen (2p) (integraalifunktiot

Tuotetiedot C: Asennus

LASKOSTUMISEN HAVAITSEMINEN SAHA-AALLOSSA

SoundGate. Bernafon SoundGate. Näppäinlukko. Äänenvoimakkuuden ja ohjelman vaihtaminen. Puhelu. Musiikki/audio-painike. Bluetooth -painike

SISÄLTÖ Venymän käsite Liukuman käsite Venymä ja liukuma lujuusopin sovelluksissa

Ontologiakirjasto ONKI-Paikka

Osakesalkun optimointi. Anni Halkola Turun yliopisto 2016

Tulevat havaintokampanjat ja fotometriatyöpajan suunnittelu. Havaintotorniverkon kokous Cygnus 2011, Jokioinen

Monikanavaääni. Antti Silvennoinen Freelance ääni- ja valosuunnittelija. copyright Antti Silvennoinen 2009

Kuvantamismenetelmät kalojen seurannassa. Pertti Paakkolanvaara Simsonar Oy. Kuva Maanmittaus laitos CC-lisenssi

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Liikehavaintojen estimointi langattomissa lähiverkoissa. Diplomityöseminaari Jukka Ahola

Videotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi

Teknillinen korkeakoulu, Akustiikan ja äänenkäsittelytekniikan laboratorio PL 3000, TKK, Espoo

TTY Mittausten koekenttä. Käyttö. Sijainti

5.1-ambienssiäänikirjasto

S Havaitseminen ja toiminta

SIIRTOMATRIISIN JA ÄÄNENERISTÄVYYDEN MITTAUS 1 JOHDANTO. Heikki Isomoisio 1, Jukka Tanttari 1, Esa Nousiainen 2, Ville Veijanen 2

pitkittäisaineistoissa

Opetusmateriaali. Tutkimustehtävien tekeminen

1 Olkoon suodattimen vaatimusmäärittely seuraava:

Työ 21 Valon käyttäytyminen rajapinnoilla. Työvuoro 40 pari 1

isomeerejä yhteensä yhdeksän kappaletta.

Estimointi. Vilkkumaa / Kuusinen 1

HUONEAKUSTIIKAN MALLINNUS JA AURALISAATIO - KATSAUS NYKYTUT- KIMUKSEEN 2 DIFFRAKTION MALLINNUS KUVALÄHDEMENETELMÄSSÄ

Fysikaalisen kemian syventävät työt CCl 4 -molekyylin Ramanspektroskopia

YKSILÖLLINEN HRTF 1 JOHDANTO. Tomi Huttunen 1, Antti Vanne 1. Haapaniemenkatu 40 E 1, Kuopio

Kuva 1. Henkilöauton moottoriäänen taajuuspainottamaton spektri.

Harjoitus 7: NCSS - Tilastollinen analyysi

Transkriptio:

ERILLISMIKROFONIÄÄNITYSTEN KÄYTTÖ PARAMETRISESSA TILAÄÄNEN KOODAAMISESSA Mikko-Ville 1 1 Aalto-yliopiston sähkötekniikan ja elektroniikan korkeakoulu Signaalinkäsittelyn ja akustiikan laitos Otakaari 5, 02150 Espoo mikko-ville.laitinen@aalto.fi Tiivistelmä Erillismikrofonitekniikoita käytetään yleisesti monikanavaäänityksissä. Näissä tekniikoissa mikrofonien välinen koherenssi on pieni niiden etäisyyksistä johtuen, mikä johtaa miellyttävään ympäröivään tilantuntuun. Valitettavasti erillismikrofonitekniikat kuitenkin kärsivät epätarkasta äänilähteiden lokalisaatiosta. Tässä artikkelissa esitetään Directional Audio Coding -tekniikkaan (DirAC) pohjautuva menetelmä erillismikrofoniäänitysten parametriseen prosessointiin. Menetelmässä analysoidaan taajuuskaistoittain äänilähteiden suunta sekä diffuusisuus, minkä avulla toisto pyritään tekemään optimaalisesti. Menetelmä parantaa havaittua laatua perinteisiin erillismikrofonitekniikoihin verrattuna tarjoamalla tarkempaa ja stabiilimpaa äänilähteiden lokalisaatiota, kuitenkin siten, että hyvä tilantuntu säilyy. Erillismikrofoniäänitysten alhaisen mikrofonien välisen koherenssin takia voidaan parantaa myös perinteisen DirAC-tekniikan laatua. Artikkelissa esitetään prosessointi muutamalle tunnetulle erillismikrofonisijoittelulle, sekä menetelmää varten optimoidulle mikrofonisijoittelulle. 1 JOHDANTO Tilaäänen tallentamiseen monikanavaäänentoistoa varten on useita tunnettuja tekniikoita [1]. Yleensä nämä tekniikat jaetaan karkeasti kahteen ryhmään: koinsidenssi- ja erillismikrofonitekniikoihin (coincident and spaced-microphone techniques). Koinsidenssitekniikoissa käytetään suuntaavia mikrofoneja, joiden oletetaan olevan käytännössä yhdessä pisteessä. Kaiutinsignaalit saadaan mikrofonisignaalien painotettuna tai suodatettuna summana, kuten käyttämällä tunnettua Ambisonics-tekniikkaa [2]. Yleisesti käytössä olevien mikrofonien leveiden suuntakuvioiden takia kaiutinsignaalit ovat kuitenkin verrattain koherentteja, mikä aiheuttaa äänen sävyyn ja tilantuntuun liittyviä artifakteja. Tätä ongelmaa ratkaisemaan kehitettiin Directional Audio Coding -tekniikka (DirAC) [3], missä äänikentästä pyritään analysoimaan psykoakustisesti merkityksellistä suuntainformaatiota, jonka avulla toisto pyritään tekemään siten, että toistettu äänikenttä havaitaan samalla tavalla kuin alkuperäinen äänikenttä. Vastaavasti erillismikrofonitekniikoissa mikrofonien väliset etäisyydet ovat verrattain suuria, kymmenistä senttimetreistä jopa useisiin metreihin. Näissä tekniikoissa mikrofonisignaalit voidaan syöttää suoraan kaiuttimiin. Saapuva tasoaalto tallentuu käytännössä

INA-5 L C R 18cm Fukada Tree L C R 94cm 35cm 51cm 180cm LS 60cm RS LS 180cm RS Kuva 1: Erillismikrofonitekniikoiden esimerkkiasetteluja. Mikrofonit ovat kardioideja. kaikkiin mikrofoneihin, ja suuntahavainto perustuu viiveisiin ja tasoeroihin kaiutinkanavien välillä. Valitettavasti havaittu suunta on kuitenkin usein epämääräinen ja virheellinen [4]. Toisaalta erillismikrofonitekniikoissa mikrofonien välinen koherenssi on verrattain matala, mikä mahdollistaa miellyttävän äänen sävyn sekä ympäröivän tilantunnun. Tässä artikkelissa esitetään menetelmä [5, 6, 7], jonka avulla erillismikrofoniäänityksiä voidaan käsitellä parametrisesti käyttämällä DirAC-tekniikasta tunnettuja menetelmiä. Tarkoituksena on parantaa suuntahavainnon laatua, mutta kuitenkin pyrkiä säilyttämään erillismikrofoniäänitysten hyvä tilantuntu. Lisäksi perinteisen DirAC-tekniikan laatua pyritetään parantamaan käyttämällä hyödyksi mikrofonien välistä pientä koherenssia. 2 TAUSTAA DirAC-tekniikan [3] perusajatus on, että äänikenttää ei tarvitse toistaa fyysisesti oikein. Riittää, että ihmisen havainto on oikea. Lisäksi oletetaan, että yhdellä ajanhetkellä yhdellä kuulon kriittisellä kaistalla ihminen voi havaita vain yhden suunnan sekä korvien välisen korrelaation. Toistamalla nämä suuntavihjeet ihmisen kuuloa vastaavalla aika- ja taajuusresoluutiolla, tilaäänen havainnon tulisi vastata alkuperäistä äänikenttää. Voidakseen toistaa nämä, äänikentästä tulee analysoida vastaavia ominaisuuksia, jotka ovat DirAC-tekniikassa äänen tulosuunta ja diffuusisuus. Ne analysoidaan äänitetyistä B-formaattisignaaleista aikariippuvina taajuuskaistoittain. Diffuusisuus kuvaa sitä, oletetaanko äänikentän koostuvan pelkästään yhdestä tasoaallosta, pelkästään diffuusista kentästä vai jotain siltä väliltä. Synteesissä DirAC-tekniikassa pyritään kontrolloimaan ihmisen suunnan ja koherenssin havaintoa analyysidatan perusteella. Ääni jaetaan aluksi ei-diffuusiin ja diffuusiin ääneen. Ei-diffuusi ääni pyritään toistamaan amplitudipanoroinnin avulla halutusta suunnasta. Vastaavasti diffuusi ääni pyritään toistamaan epäkoherenttina dekorreloinnin avulla. Näitä kahta osaa painotetaan analysoidun diffuusisuuden perusteella, minkä tuloksena sekä havaitun suunnan että korvien välisen koherenssin, ja siten myös tilaäänen havainnon, tulisi vastata alkuperäistä äänikenttää. Perinteisissä erillismikrofonitekniikoissa parametrisen analyysin sijaan äänikentän havainto pyritään toistamaan mikrofonien sijoittelun avulla sekä valitsemalla sopivat suuntakuviot. Kuvassa 1 on nähtävissä kaksi tunnettua erillismikrofonitekniikkaa [8]: INA-5 (Ideale Nieren-Anordnung) ja Fukada Tree. Kummassakin tekniikassa voidaan nähdä sama periaate: edessä on kolme mikrofonia, joiden avulla pyritään toistamaan äänilähteiden suunta, ja takana on kaksi mikrofonia, joilla pyritään toistamaan tilantuntua.

Kaiutinjärjestelmä VBAP DirACanalyysi Erillismikrofonisignaalit Kaiutinsignaalit Dekorrelaatio Kuva 2: Erillismikrofoniäänitysten parametrisen käsittelyn lohkokaavio. 3 ERILLISMIKROFONIÄÄNITYSTEN PARAMETRINEN KÄSITTELY Sekä DirAC-tekniikalla että erillismikrofonitekniikoilla voidaan toistaa tilaääntä hyvällä laadulla. Molemmissa on kuitenkin ongelmansa. DirAC-tekniikassa eräs ongelmista on dekorrelaatio, joka tietyillä signaaleilla saattaa huonontaa laatua. Vastaavasti erillismikrofonitekniikoissa suuntien havainnointi on melko epämääräistä. Tässä artikkelissa esitetyllä menetelmällä pyritään kiertämään kummankin lähestymistavan ongelmat ja yhdistämään hyvät puolet. Prosessointi tehdään kahdessa vaiheessa: analyysi ja synteesi. Äänikentästä pyritään analysoimaan perinteisen DirAC-tekniikan tapaan suunta ja diffuusisuus taajuuskaistoittain [6]. Oletetaan, että on kaksi suuntamikrofonia, kuten kardioidia, jotka ovat symmetrisessä kulmassa x-akseliin nähden. Laskemalla näiden kahden signaalin magnitudispektrien erotus, saadaan tulokulmaan verrannollinen muuttuja I x (f) = S 1 (f) S 2 (f) = A(f) (1 α)2 sin θ 0 cos θ, (1) missä A(f) on saapuvan tasoaallon magnitudispektri, α mikrofonin suuntaavuusparametri, θ 0 mikrofonien välinen kulma ja θ saapuvan tasoaallon suunta. Asettamalla vastaavasti kaksi mikrofonia y-akselin suhteen symmetrisesti, voidaan luoda suuntavektori I mag = [I x I y ] ja laskea tulokulma θ = tan 1 (I y /I x ). Diffuusisuus voidaan laskea suuntavektorin ajassa tapahtuvaan vaihteluun perustuen ψ = 1 E{I mag} E{ I mag }, (2) missä E tarkoittaa odotusarvoa, mikä lasketaan käytännössä aikakeskiarvoistuksella. Synteesin lohkokaavio on nähtävissä kuvassa 2. Perinteisen DirAC-tekniikan tapaan mikrofonisignaalit jaetaan aluksi ei-diffuusiin ja diffuusiin ääneen. Siitä poiketen kuitenkin vain osa diffuusista äänestä dekorreloidaan. Syy tähän on se, että siinä missä perinteisessä DirAC-tekniikassa käytetyt B-formaattisignaalit ovat melko koherentteja, erillismikrofonisignaalien välinen koherenssi on keski- ja korkeilla taajuuksilla varsin pieni. Tämän takia niitä ei suurelta osin tarvitse dekorreloida, millä vältetään dekorreloinnista johtuvat artefaktit. Jako dekorreloituun ja dekorreloimattomaan diffuusiin ääneen tehdään mikrofonien välillä taajuuskaistoittain estimoidun koherenssin γ perusteella. Estimointi voidaan tehdä esimerkiksi olettamalla diffuusi kenttä [9]. Ei-dekorreloidun diffuusin äänen vahvistus ɛ määritetään lopuksi siten, että kokonaisenergia säilyy.

30 22cm 42cm 120 Kuva 3: Esitettyä menetelmää varten optimoitu kardioideja käyttävä mikrofoniasettelu. 4 KÄYTÄNNÖN TOTEUTUKSIA Kappaleessa 3 esitettyä menetelmää voi käyttää olemassa olevien erillismikrofoniasettelujen kanssa, mutta mikrofoniasettelu voidaan myös yrittää optimoida menetelmää varten. Analyysin puolesta a) mikrofonien väliset kulmat pitäisivät olla sopivat analyysia varten ja b) mikrofonien välinen etäisyys pitäisi olla minimaalinen [6]. Synteesin puolesta a) mikrofonien tulisi osoittaa kaiuttimia ja vierekkäisten mikrofonien välinen aikaero tulisi minimoida [6] ja b) mikrofonien välinen etäisyys pitäisi olla mahdollisimman suuri, mielellään vähintään 40 cm [5]. Vaatimukset ovat ilmiselvästi ristiriitaiset, ja sopiva ratkaisu on aina kompromissi. Esimerkkiratkaisu ongelmaan on nähtävissä kuvassa 3. Siinä etumikrofonit on pyritty asettelemaan siten, että edessä olevien äänilähteiden suunta voitaisiin toistaa mahdollisimman tarkasti. Takamikrofoneilla yleensä toistetaan lähinnä kaiuntaa ja ambienssia, joten niiden osalta tarkka lokalisaatio ei ole niin tärkeää. Siksi niiden asettelu on valittu siten, että suunta-analyysi edessä olevia lähteitä varten voidaan tehdä tarkasti, ja että signaalien välillä on sopiva koherenssi. Kuvassa 1 esitettyjen mikrofoniasettelujen tapauksessa analyysi tehdään käyttämällä vain edessä olevia mikrofoneja (L, C ja R), jotka ovat riittävän lähellä toisiaan suuntaanalyysia varten. Näissä asetteluissa mikrofoneja ei ole sopivissa kulmissa, jotta kappaleessa 3 esitettyä analyysia voitaisiin käyttää suoraan. Analyysia hieman muokkaamalla voidaan kuitenkin päästä riittävän tarkkaan tulokseen myös näillä asetteluilla [7]. 5 KUUNTELUKOKEET Tässä artikkelissa esitetyn menetelmän toiston laatua evaluoitiin formaaleilla kuuntelukokeilla [6]. Kuuntelukoe toteutettiin hyvin akustoidussa kuunteluhuoneessa. Toistojärjestelmässä oli yhdeksän kaiutinta 0 asteen korkeudessa suunnissa 0, ±30, ±70, ±110 ja ±160, sekä neljä kaiutinta 45 asteen korkeudessa suunnissa ±45 ja ±135. Kokeeseen osallistui 18 kuuntelijaa. Testimateriaalina käytettiin kolmea ääninäytettä: samanaikaista puhetta eri suunnista sekä pienessä että suuressa huoneessa ja musiikkia keskikokoisessa huoneessa. Ääninäytteet valittiin siten, että ne tiedettiin ennestään haastaviksi DirACtekniikoille. Testissä käytetyt huoneet simuloitiin kuvalähdemenetelmällä. Tuloksena saatiin signaalit kaiutinjärjestelmässä oleville kaiuttimille siten, että suorat äänet ja jokai-

5 4 Puhe, pieni tila Puhe, suuri tila Musiikki MOS 3 2 1 ref spaceddirac normdirac spacedmic mono Kuva 4: Kuuntelukokeissa havaittu yleisen laadun heikkeneminen verratuna referenssiin. Keskiarvot ja 95%:n luottamusvälit ovat nähtävillä kuvassa. nen heijastus oli kvantisoitu lähimpään kaiuttimeen. Näiden referenssisignaalien avulla simuloitiin myös B-formaatti- ja erillismikrofonisignaalit. Testissä oli tutkittava viisi eri menetelmää. Piilotettu referenssi (ref) oli identtinen luodun 13-kanavaisen referenssin kanssa. Monoversio (mono) sisälsi referenssin kanavien summan toistettuna edessä olevalla kaiuttimella. Muissa menetelmissä toisto tehtiin 5.1:n mukaisilla viidellä kaiuttimella (0, ±30, ±110 ). Kuvassa 3 esitetyn asettelun mukaiset signaalit toistettiin suoraan ilman käsittelyä menetelmässä spacedmic. Samat signaalit toistettiin tässä artikkelissa esitetyllä parametrisella tekniikalla menetelmässä spaced- DirAC. B-formaattisignaalit toistettiin perinteisellä DirAC-tekniikalla menetelmässä normdirac. Koehenkilöiden tehtävänä oli arvostella toiston yleistä laatua verrattuna referenssiin. Kysymyksenä oli: Arvioi havaittu laadun heikkeneminen. Arvosana 5 tarkoitti, ettei havaitse eroa, ja 1 tarkoitti, että ero on erittäin häiritsevä. Kuuntelukokeiden tulokset ovat nähtävissä kuvassa 4. Voidaan nähdä, että spaceddirac-menetelmän laatu on verrattain hyvä kaikilla näytteillä. Tulee huomata, että testissä verrattiin viisikanavaisia menetelmiä kolmetoistakanavaiseen referenssiin. Lisäksi voidaan nähdä, että esitetty menetelmä on havaitulta laadultaan parempi tai yhtä hyvä kaikilla näytteillä verrattuna sekä perinteiseen DirAC-toistoon että myös erillismikrofonisignaalien suoraan toistoon. 6 DISKUSSIO Esitettyä menetelmää voidaan ajatella perinteisten erillismikrofonitekniikoiden parametrisena parannuksena. Se osa äänestä mikä mikrofonisignaaleissa toimii suoraan toistettuna sellaisenaan, toistetaan sellaisenaan. Vain ongelmakohtia pyritään käsittelemään. Matalilla taajuuksilla mikrofonisignaalit ovat yleensä liian koherentteja, joten ne voidaan dekorreloida niiltä osin. Lisäksi lokalisoitavissa olevat osat äänestä voidaan toistaa amplitudipanoroinnilla, mikä lisää suuntahavainnon tarkkuutta ja pistemäisyyttä. Esitettyä menetelmää voidaan ajatella myös jälkikäsittelytyökaluna. Äänityksen voi tehdä haluamallaan tekniikalla, ja jos lisäksi haluaa parantaa lokalisaatiota, voi käyttää esitettyä menetelmää. Prosessoinnin voi ottaa käyttöön saumattomasti, koska menetelmällä prosessoitua ja prosessoimatonta ääntä voi miksata vapaasti valittavassa suhteessa. Täten miksaaja voi vapaasti valita haluamansa prosessoinnin määrän kuuntelemalla.

7 YHTEENVETO Artikkelissa esitettiin DirAC-tekniikkaan pohjautuva menetelmä erillismikrofoniäänitysten parametriseen käsittelyyn. Menetelmässä analysoidaan taajuuskaistoittain äänilähteiden suunta sekä diffuusisuus, minkä avulla toisto pyritään tekemään optimaalisesti. Menetelmä parantaa havaittua laatua perinteisiin erillismikrofonitekniikoihin verrattuna tarjoamalla tarkempaa ja stabiilimpaa äänilähteiden lokalisaatiota, kuitenkin siten, että hyvä tilantuntu säilyy. Erillismikrofoniäänitysten alhaisen mikrofonien välisen koherenssin takia voidaan parantaa myös perinteisen DirAC-tekniikan laatua. 8 KIITOKSET Kirjoittaja haluaa kiittää Archontis Politista avusta artikkelin tekemisessä. Fraunhofer IIS ja GETA-tutkijakoulu ovat tukeneet tätä tutkimusta. VIITTEET [1] Francis Rumsey. Spatial Audio. Focal Press, Oxford, 2001. [2] Michael A. Gerzon. Ambisonic in multichannel broadcasting and video. J. Audio Eng. Soc., 33(11):859 871, November 1985. [3] Ville Pulkki. Spatial sound reproduction with directional audio coding. J. Audio Eng. Soc., 55(6):503 516, June 2007. [4] Ville Pulkki. Microphone techniques and directional quality of sound reproduction. In AES 112th Convention, Munich, Germany, 2002. [5] Mikko-Ville, Fabian Kuech, and Ville Pulkki. Using spaced microphones with directional audio coding. In AES 130th Convention, London, UK, May 2011. [6] Archontis Politis, Mikko-Ville, Jukka Ahonen, and Ville Pulkki. Parametric spatial audio coding for spaced microphone array recordings. In AES 134th Convention, Rome, Italy, May 2013. [7] Archontis Politis, Mikko-Ville, and Ville Pulkki. Spatial audio coding with spaced microphone arrays for music recording and reproduction. In 21st International Congress on Acoustics, Montreal, Canada, June 2013. [8] Günther Theile. Natural 5.1 music recording based on psychoacoustic principles. In AES 19th International Conference, Schloss Elmau, Germany, June 2001. [9] W. Gary Elko. Spatial Coherence Functions for Differential Microphones in Isotropic Noise Fields. In Michael Brandstein and Darren B. Ward, editors, Microphone Arrays, chapter 3, pages 61 85. Springer-Verlag, Berlin, Heidelberg, New York, 2004.