FOURIER-MUUNNOS JA SPEKTRI- ANALYYSIKUVAAJIEN TULKINTA MUSIIKINTUTKIMUKSESSA, OSA 1

Samankaltaiset tiedostot
Tiistai klo Jari Eerola

Spektri- ja signaalianalysaattorit

5 Akustiikan peruskäsitteitä

Tietoliikennesignaalit & spektri

Laskuharjoitus 4 ( ): Tehtävien vastauksia

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka. Vfo135 ja Vfp124 Martti Vainio

Mono- ja stereoääni Stereoääni

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Alla olevassa kuvassa on millisekunnin verran äänitaajuisen signaalin aaltomuotoa. Pystyakselilla on jännite voltteina.

SGN-4200 Digitaalinen audio

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

Numeeriset menetelmät

Signaalien datamuunnokset. Digitaalitekniikan edut

Signaalien datamuunnokset

IIR-suodattimissa ongelmat korostuvat, koska takaisinkytkennästä seuraa virheiden kertautuminen ja joissakin tapauksissa myös vahvistuminen.

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen

1 Vastaa seuraaviin. b) Taajuusvasteen

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

SIGNAALITEORIAN KERTAUSTA OSA 2

ELEC-C5070 Elektroniikkapaja (5 op)

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Digitaalinen audio

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Juha Henriksson. Digitaalinen äänentallennus Dr. Juha Henriksson Finnish Jazz & Pop Archive

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Äänen eteneminen ja heijastuminen

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

T SKJ - TERMEJÄ

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N)

Digitaalinen audio & video I

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Alttoviulujen vertailua spektrianalyysin avulla. Sisällys. Johdanto. Aluke ja jatkuva ääni

Luku 4 - Kuvien taajuusanalyysi

Digitaalinen signaalinkäsittely Desibeliasteikko, suotimen suunnittelu

Tuntematon järjestelmä. Adaptiivinen suodatin

1. Perusteita Äänen fysiikkaa. Ääniaalto. Aallonpituus ja amplitudi. Taajuus (frequency) Äänen nopeus

Laskuharjoitus 2 ( ): Tehtävien vastauksia

SGN-4200 Digitaalinen Audio Harjoitustyö-info

Åbo Akademi klo Mietta Lennes Nykykielten laitos Helsingin yliopisto

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Spektrianalysaattori. Spektrianalysaattori

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Tiedonkeruu ja analysointi

3 Ikkunointi. Kuvio 1: Signaalin ikkunointi.

Yleistä. Digitaalisen äänenkäsittelyn perusteet. Tentit. Kurssin hyväksytty suoritus = Harjoitustyö 2(2) Harjoitustyö 1(2)

6.8 Erityisfunktioiden sovelluksia

Tiedonkeruu ja analysointi

Flash AD-muunnin. Ominaisuudet. +nopea -> voidaan käyttää korkeataajuuksisen signaalin muuntamiseen (GHz) +yksinkertainen

SIGNAALITEORIAN KERTAUSTA 1

Signaalien generointi

Matlab-tietokoneharjoitus

Äänitiedostoista. 1 Äänen tallentaminen

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.

Infraäänimittaukset. DI Antti Aunio, Aunio Group Oy

Kuuloaisti. Korva ja ääni. Melu

Akustiikka ja toiminta

Virheen kasautumislaki

Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria

Digitaalinen signaalinkäsittely Kuvankäsittely

Digitaalinen audio & video, osa I. Johdanto. Digitaalisen audion sovellusalueet. Johdanto. Taajuusalue. Psykoakustiikka. Johdanto Digitaalinen audio

KON-C3004 Kone- ja rakennustekniikan laboratoriotyöt Tiedonkeruu ja analysointi Panu Kiviluoma

1 Olkoon suodattimen vaatimusmäärittely seuraava:

Infrapunaspektroskopia

11. kierros. 1. Lähipäivä

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

6. Analogisen signaalin liittäminen mikroprosessoriin Näytteenotto analogisesta signaalista DA-muuntimet 4

1 Tarkastellaan digitaalista suodatinta, jolle suurin sallittu päästökaistavärähtely on 0.05 db ja estokaistalla vaimennus on 44 db.

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN

ELEKTRONISET JÄRJESTELMÄT, LABORAATIO 1: Oskilloskoopin käyttö vaihtojännitteiden mittaamisessa ja Theveninin lähteen määritys yleismittarilla

havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä

Muuntavat analogisen signaalin digitaaliseksi Vertaa sisääntulevaa signaalia referenssijännitteeseen Sarja- tai rinnakkaismuotoinen Tyypilliset

SIGNAALITEORIAN KERTAUSTA OSA 1

RAKENNUSAKUSTIIKKA - ILMAÄÄNENERISTÄVYYS

LUT CS20A0650 Meluntorjunta 1. Tsunamin synty LUT CS20A0650 Meluntorjunta

Kuulohavainnon perusteet

ELEC-C Sovellettu digitaalinen signaalinkäsittely. Äänisignaalien näytteenotto ja kvantisointi Dither Oskillaattorit Digitaalinen suodatus

Perusmittalaitteet 2. Spektrianalyysi. Mittaustekniikan perusteet / luento 4. Spektrianalyysi. Logaritmiasteikko ja db (desibel) Spektrianalysaattori

Nimi: Muiden ryhmäläisten nimet:

Digitaalinen signaalinkäsittely Johdanto, näytteistys

DSP:n kertausta. 1 Spektri, DFT, DTFT ja aika-taajuusresoluutio

Alias-ilmiö eli taajuuden laskostuminen

S Elektroniikan häiriökysymykset. Laboratoriotyö, kevät 2010

Diskreetti Fourier-muunnos ja sen hyödyntäminen signaalien spektrien muodostamisessa. Pentti Romppainen

Jaksollisen signaalin spektri

Puheen akustiikan perusteita

1 Diskreettiaikainen näytteistys. 1.1 Laskostuminen. Laskostuminen

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?

Kojemeteorologia. Sami Haapanala syksy Fysiikan laitos, Ilmakehätieteiden osasto

Kotitehtävät 1-6: Vastauksia

Alipäästösuotimen muuntaminen muiksi perussuotimiksi

Mitä tulisi huomioida ääntä vaimentavia kalusteita valittaessa?

FYSP105 / K3 RC-SUODATTIMET

PSYKOAKUSTINEN ADAPTIIVINEN EKVALISAATTORI KUULOKEKUUNTELUUN MELUSSA

Signaalit ja järjestelmät aika- ja taajuusalueissa

JOHDATUS TEKOÄLYYN TEEMU ROOS

ELOKUVATYÖKALUN KÄYTTÖ ANIMAATION LEIKKAAMISESSA. Kun aloitetaan uusi projekti, on se ensimmäisenä syytä tallentaa.

Akustointiratkaisujen vaikutus taajuusvasteeseen

Transkriptio:

Kai lassfolk FT, Yliopistonlehtori, Helsingin yliopisto Musiikintutkijan työkalupakki FOURIER-MUUNNOS JA SPEKTRI- ANALYYSIKUVAAJIEN TULKINTA MUSIIKINTUTKIMUKSESSA, OSA 1 57 Spektrianalyysista on tullut tärkeä apuväline myös musiikintutkimuksessa, vaikkakin menetelmällä on vankemmat perinteet monilla muilla tieteenaloilla kuten fonetiikassa ja akustiikassa. Yksi syy tähän on musiikkisignaalien pitkä kesto, joka on tyypillisesti useita minuutteja, jopa tunteja. Sitä vastoin esimerkiksi akustiikkamittausten ajanjaksot ovat yleensä joitakin sekunteja tai sekunnin osia, minkä vuoksi tietokoneiden laskentakyky- ja muistitilavaatimukset ovat olleet suhteellisen pieniä ja mahdollistaneet menetelmän käytön pidempään. Toinen syy on tieteenalojen perinteessä; musiikin graafisessa kuvauksessa on suosittu symbolisia kuvaustapoja, joista tunnetuin on länsimainen viivastonotaatio. Vaikka kokeiluja spektrinanalyysin hyödyntämisessä on musiikintutkimuksenkin piirissä tehty jo pitkään (esim. Cogan 1984), mittausten hyödyntäminen ja metodologinen opetus on yhä suhteellisen epäsystemaattista tai sijoittunut lähinnä muiltakin osin teknisesti orientoituneisiin musiikkitieteen alueisiin. Esimerkkinä mainittakoon elektroakustisen musiikin analyysi, jossa spektrogrammit ovat olleet jo vuosikymmeniä keskeinen apuväline. Viime vuosina spektrianalyysia on kuitenkin hyödynnetty myös esimerkiksi soitinäänten tutkimuksessa (esim. Laine & Lassfolk 2006), populaarimusiikin tutkimuksessa (Lilja 2009) ja musiikkiarkeologiassa (Rainio 2010). Tämän artikkelin tarkoituksena on selventää spektrianalyysin ja erityisesti Fourier-analyysin ominaisuuksia ja käyttöä musiikkitieteellisissä yhteyksissä. Painopiste on spektrianalyysilla tuotettujen graafisten kuvaajien ominaisuuksissa, tulkinnoissa ja käyttömahdollisuuksissa. Artikkelissa selostetaan myös tutkimuksen dokumentoinnin kannalta tärkeitä parametritietoja. Fourier-analyysista ja sen tietokonetoteutuksista on julkaistu lukemattomia tieteellisiä artikkeleita ja kirjoja. Musiikintutkijan kannalta tämä kirjallisuus on kuitenkin hankalasti lähestyttävää matemaattisen ja tietojenkäsittelyllisen käsittelytapansa vuoksi. Käytännönläheistä musiikkitieteilijän työkalupakkiin sopivaa metodologista lähdemateriaalia on varsin vähän. Musiikintutkimuksessa olennaista on tietää ensisijaisesti ominaisuuksien käytännön vaikutus, eikä niinkään, mistä matemaattisesta funktiosta ne on johdettu ja millaisella tietokonealgoritmilla ne on toteutettu. Jälkimmäisistä kiinnostuneet voivat turvautua insinööritieteiden runsaaseen lähteistöön (esim. Oppenheim & Schaefer 2009) tai menemällä alkulähteille (Fourier 1822). Tähän artikkeliin on pyritty valitsemaan ne ominaisuudet ja parametrit, jotka ovat musiikintutkijan kannalta olennaisia sekä selostamaan ne tiivistetysti käytännön esimerkkien avulla. Samalla tuodaan esille spektrianalyysin musiikintutkimuksellisen käytön

58 Kuva 1a: Stratocastersähkökitaran vapaan ala-e-kielen alukkeen magnitudispektri. erityispiirteitä kuten kuvaajien tulkintatapoja. Käsitellyt menetelmät ovat diskreetti ja nopea Fourier-analyysi, lyhyen ajan Fourier-analyysi sekä näiden tärkeimmät graafiset kuvaajat. Tämä artikkeli keskittyy musiikkiesitysten analysointiin. Artikkeli on jaettu kahteen osaan, joista tässä ensimmäisessä keskitytään Fourier-analyysin perusteisiin. Toisen osan aiheena ovat Fourier-analyysilla tuotettujen graafisten kuvaajien ominaisuudet ja tulkinta. Fourier-analyysin perusteet Ranskalaisen fyysikon Jean-Baptiste Joseph Fourier n (1768 1830) teoriaan pohjautuva Fourier-analyysi on yksi tärkeimmistä signaalianalyysin menetelmistä. Digitaalisen äänisignaalin ja tämän osana digitaalisten musiikkiäänitteiden analyysi on yksi sen monista sovellusalueista esimerkiksi tietoliikennesignaalien, aivotutkimuksen ja kuvankäsittelyn ohella. Akustisessa tilassa soiva musiikki on ilmanpaineen vaihtelua, jonka ihmiskorva muuttaa aivojen ymmärtämäksi kokonaisuudeksi. Fourier-analyysi, siinä käyttötarkoituksessa kuin sitä tämän artikkelin yhteydessä käsitellään, pohjautuu äänitetyn ja digitaaliseen muotoon muunnetun ilmanpaineen vaihtelun mittaamiseen. Menetelmän tarkoituksena on purkaa ajassa tapahtuva paineen vaihtelu eri taajuuksilla esiintyviksi osatekijöiksi. Menetelmällä analysoidaan siis äänisignaalin fysikaalista rakennetta, eikä esimerkiksi aivojen tapaa havainnoida musiikkia. Tästä syystä musiikintutkijalle spektrianalyysilla tuotetut kuvaajat ovat paremminkin tutkimusaineistoa kuin -tuloksia ja edellyttävät tutkijan tulkintaa ja kirjallista selostusta. Musiikintutkimuksessa Fourier-analyysia hyödynnetään sekä 1) suoraan näyttämällä analyysin tuloksia graafisesti musiikkisignaalin sisällön havainnollistamiseksi että 2) signaalinkäsittelymenetelmänä esimerkiksi säveltasojen tunnistamiseksi tai äänitteiden venyttämiseksi transkriptiotyötä varten. Tässä artikkelissa keskitytään graafisiin kuvaajiin. Tärkeimmät kuvaajatyypit ovat kaksiulotteinen magnitudispektri, kolmiulotteinen spektrogrammi sekä sonogrammi. Magnitudispektri (kuva 1a) kuvaa lyhyen ajanjakson, esimerkiksi yksittäisen sävelen, yläsävelrakennetta (yläsävelten värähtelyn voimakkuutta eli magnitudia), jossa ei ole tietoa jakson sisällä mahdollisesti tapahtuvista ajallisista muutoksista (esim. sävelkorkeuden tai voimakkuuden muutoksista). Kolmiulotteinen magnitudispektrogrammi (kuva 1b) koostuu joukosta peräkkäisiä magnitudispektrejä; sillä voidaan analysoida myös ajassa tapahtuvia muutoksia. Sonogrammi (kuva 1c) on magnitudispektrogrammin erityistapaus, jossa kaksiulotteisen kuvaajan akseleina ovat taajuus (yleensä pystyakselilla) ja aika (vaaka-akselilla): magnitudi kuvataan harmaasävyinä tai väreillä. Spektrianalyysikuvaajien ohella ja tukena käytetään usein oskillogrammia, joka kuvaa signaalin aaltomuotoa (signaalia yksityiskohtaisesti tarkasteltuna) tai voimakkuusvaihteluita ajassa (laajempaa yleiskuvaa tarkasteltaessa). Fourier n matemaattisesta menetelmästä, Fourier-muunnoksesta on kehitetty digitaaliselle signaalille

soveltuva tietokonealgoritmi, ns. diskreetti Fourier-muunnos (engl. Discrete Fourier Transform, DFT). Algoritmi on toiminnaltaan ja toteutukseltaan yksinkertainen, mutta ongelmana on laskennan hitaus varsinkin suurta erottelutarkkuutta vaativissa mittauksissa. Vastaukseksi kehitettiin ns. nopea Fourier-muunnos (Fast Fourier Transform), josta on useita algoritmitoteutuksia. Diskreetti Fourier-muunnos on nopeaa versiota hieman joustavampi, mutta käytännössä se voidaan lähes aina korvata nopealla muunnoksella, jonka lyhenteestä (FFT) onkin tullut yleisnimitys koko menetelmälle. Käsitteellisesti määriteltynä Fouriermuunnos on menetelmä, jolla aika-alueella oleva signaali (ts. ajassa etenevä värähtelyliike) voidaan muuntaa taajuusalueelle (värähtelyksi taajuuden suhteen) ja päinvastoin taajuusalueelta aika-alueelle. Fourier-muunnos on siis kahdensuuntainen ja lisäksi häviötön, eli edestakaisin muunnettu signaali vastaa täysin alkuperäistä. Pelkkää muunnosta aika-alueelta taajuusalueelle kutsutaan myös Fourier-analyysiksi. Fourier-muunnos perustuu oletukseen, että analysoitava signaali on periodista, samanlaisena jatkuvasti toistuvaa aaltoliikettä, josta voidaan rajata analysoitavaksi vain yksi periodi. Fourier n teorian mukaisesti mikä tahansa periodinen aaltoliike voidaan esittää toisiinsa harmonisessa suhteessa olevina siniaaltoina (ts. taajuudeltaan aaltoliikkeen periodin kerrannaisina), taajuuskomponentteina, joilla on kullakin yksilöllinen magnitudi ja vaihe. Tähän muotoon purettua Fourier-analyysin tuottamaa tietoa kutsutaan signaalin magnitudi- ja vaihevasteiksi. Menetelmän yhteydessä puhutaan usein myös yleisesti signaalin taajuusvasteesta, jolla tarkoitetaan käyttöyhteydestä riippuen joko pelkkää magnitudivastetta tai sekä magnitudi- että vaihevastetta yhdessä. Magnitudin yksikkönä on esimerkiksi lineaarisesti skaalautuva voimakkuusarvo välillä 0..1 tai logaritmisesti skaa- lautuva desibeliarvo. Vaiheen yksikkönä on kulma joko asteina (esim. 0..360 tai ±180 ) tai radiaaneina (esim. 0..2π tai ±π). Musiikkisignaalin vaihevasteet ovat sellaisenaan yleensä epähavainnollisia ja vaikeasti tulkittavia. Siksi Fourier-muunnoksen suorassa graafisessa kuvauksessa rajaudutaan yleensä pelkän magnitudivasteen käyttöön, näin myös tässä tekstissä. (Muunnoksen tuottama vaihetieto on kuitenkin hyödyllistä vasteiden jatkokäsittelyssä; nämä menetelmät rajautuvat tämän kirjoituk- sen ulkopuolelle.) Kuva 1b: Kolmiulotteinen spektrogrammi Jacksonin kappaleen The Way You Make Me Feel (1987) ensimmäisen säkeistön alusta. 59 Kuva 1c: Sonogrammi Erkki Kurenniemen elektronimusiikkisävellyksen On Off (1963) alusta.

60 Spektrianalyysin vaiheet Ennen Fourier-muunnosta digitaalinen äänisignaali on esikäsiteltävä, mikä osaltaan määrittää analyysin tarkkuutta. Kokonaisuutena Fourier-analyysin perustuva akustisen äänisignaalin spektrianalyysi on monivaiheinen prosessi, joka voidaan jakaa kahteen päävaiheeseen ja edelleen osavaiheisiin seuraavasti: Äänitys ja digitointi Äänen taltiointi Alipäästösuodatus Näytteenotto Kvantisointi Spektrianalyysi Ikkunointi Fourier-muunnos Magnitudi- ja vaihevasteiden erottelu Vasteiden graafinen kuvaus Äänitys- ja digitointivaiheessa määräytyy äänisignaalin tekninen laatu ja erottelutarkkuus, jotka muodostavat rajat spektrianalyysin esitys- ja erottelutarkkuudelle. Valmiita, esimerkiksi CD-levyllä julkaistuja tallenteita analysoitaessa nämä tekijät ovat ennalta annettuja, mutta silti merkittäviä. Äänitystai äänitteen jälkikäsittelyvaiheessa määräytyy myös äänikanavien määrä. Esimerkiksi CD-järjestelmän stereofonisessa signaalissa kanavia on kaksi: vasen ja oikea. Spektrianalyysivaiheessa äänikanavat voidaan, analyysiohjelman ominaisuuksista riippuen, analysoida joko erikseen tai yhdistettynä yksikanavaiseksi, monofoniseksi signaaliksi. Äänityksessä akustinen äänisignaali, eli värähtelytaajuudeltaan noin 20 Hz ja 20 khz välinen ilmanpaineen vaihtelu, muunnetaan ensin analogiseksi elektroniseksi signaaliksi, joka on sähköjännitteen vaihtelua. Digitoinnissa jännitteenvaihtelusta otetaan näytteitä, jotka kvantisoidaan eli muutetaan numeerisiksi arvoiksi. Näytteet otetaan yleensä jollakin vaihtelemattomalla näytteenottotaajuudella, joka on huomattavasti korkeampi kuin taltioitavan signaalin korkein taajuus. Näytteenottotaajuuden on Shannonin/ Nyquistin teoreeman mukaan oltava vähintään kaksin- kertainen korkeimpaan toistettavaan taajuuteen nähden. Esimerkiksi CD-levyissä näytteenottotaajuus on 44,1 khz, jolla voidaan digitoida korkeintaan 22050 Hz värähtelytaajuus. Tätä kutsutaan signaalin yläraja- eli Nyquistin taajuudeksi. Akustinen signaali voi sisältää huomattavasti tätäkin korkeampia taajuuksia. Nämä on suodatettava signaalista pois alipäästösuotimella ennen näytteenottoa aliasoitumisen välttämiseksi. Tällä tarkoitetaan ilmiötä, jossa ylärajataajuuden ylittävä signaali tuottaa digitoinnissa virheellisen heijastusvaikutuksen, jonka taajuus on alkuperäisen signaalin ja ylärajataajuuden erotus. Tämä kuuluu signaalissa epäharmonisena särönä ja näkyy spektrianalyysissa ylimääräisinä taajuuskomponentteina. Alipäästösuodatuksen rajataajuus joudutaan käytännössä asettamaan jonkin verran ylärajataajuutta matalammaksi, CD-levyissä noin 20 khz:iin. Näytteenottotaajuus ei kuitenkaan yksin rajoita korkeiden taajuuksien mittaamista. Monet äänityslaitteet, esimerkiksi useimmat musiikkiäänityksiin tarkoitetut mikrofonit on suunniteltu vain alle 20 khz:n taajuuksille. Siksi edes CD-levyjä korkeamman näytteenottotaajuuden tarjoavat Super Audio CD tai DVD Audio -julkaisut eivät välttämättä sisällä yli 20 khz taajuuksia. Korkeiden taajuuksien tutkimisessa äänitteet onkin useimmiten tehtävä itse kiinnittäen lisäksi erityistä huomiota laitteiston valintaan. Kvantisoinnissa analogisesta signaalista otettujen näytteiden arvot koodataan numeeriseen ( kvantitatiiviseen ) muotoon. Kvantisointitapoja on useita. Yleisimmässä, esimerkiksi CD-äänilevyissä käytetyssä lineaarisessa kvantisoinnissa toistettava signaalitasoalue jaetaan tasavälein, ja jokaiselle tasolle annetaan yksilöllinen numeerinen arvo. CD-järjestelmässä kvantisointitarkkuus on 16-bittiä/näyte, jolla voidaan koodata 2 16 = 65536 arvoa. Yhden bitin lisäys tai vähentäminen kvantisointitarkkuudesta vastaa 6 desibelin vastaavaa parannusta tai heikennystä. CD-järjestelmän erottelutarkkuus, signaali-kvantisointikohinasuhde on 16 x 6 db = 96 db, joka on samalla hiljaisimman ja voimakkaimman signaalin maksimivoimakkuusero. Fourier-analyysissa kvantisointitarkkuus ei yleensä suoraan näy analyysiohjelman käyttäjälle, koska näytteet muunnetaan

Function). Voimakkuus kasvaa vähitellen maksimiinsa ikkunan puoliväliin tultaessa ja vaimenee jälleen loppua kohti. Tällöin alun ja lopun mahdollinen epäjatkuvuus poistuu. Haittapuolena on, että ikkunan alussa ja lopussa oleva signaalin painoarvo pienenee, mikä puolestaan pienentää analyysin tarkkuutta. Tätä voidaan osin kompensoida ikkunan pituutta kasvattamalla puolestaan yllämainituin sivuvaikutuksin. Käytännössä painotusfunktion käyttö näkyy magnitudivasteissa siten, että yksittäiset yläsävelet näkyvät kellomaisina hahmoina, eivät yksittäisinä pystysuorina pylväinä. Painotusfunktioita on useita, yleisimpiä ovat ns. Hanning- ja Hamming-ikkunointifunktiot, jotka noudattavat käänteistä kosinifunktion muotoa. Seuraavassa esimerkki painotusfunktion vaikutuksesta. Kuvassa 2a on noin 90 millisekunnin mittainen jakso sähkökitaran äänen alukkeesta. Kuvassa 2b on sama jakso Hanning-funktiolla käsiteltynä. (Painotusfunktion vaikutusta spektrianalyysiin havainnollistetaan myöhemmin kuvassa 3.) Ikkunoitu signaali syötetään Fourier-muunnosalgoritmille, joka muuntaa signaalijakson aika-alueelta (paineen vaihtelusta ajan suhteen) taajuusalueelle (voimakkuuden ja vaiheen vaihteluksi taajuuden suhteen). Fourier-muunnos tuottaa joukon Fourier-pisteitä, joita on yhtä monta kuin ikkunassa olevia näytteitä. Fourier-pisteet ovat kompleksilukuja, joiden reaali- ja imaginaariosiin sisältyy tieto kunkin siniaaltokomponentin magnitudista (värähtelyn laajuudesta) ja vaiheesta (ts. mistä sinifunktion kohdasta komponentin värähtely alkaa). Kompleksilukuja voidaan käsitellä laskennallisesti 2-ulotteisen koordinaatiston pisteinä (tähän viittaa myös nimitys Fourier-piste ), joista voidaan erotella magnitudi laskemalla pisteen etäisyys origosta ja vaihe laskemalla pisteen kulma suhteessa origoon. (Tämä vaihe prosessista on siis ratkottavissa koulumatematiikalla.) Fourier-pisteet jakautuvat taajuuksiltaan tasavälein niin, että matalin taajuus on 0 Hz ja ylin on lähellä näytteenottotaajuutta. Taajuuksien erottelutarkkuus eli etäisyys toisistaan (hertseissä) voidaan laskea jakamalla signaalin näytteenottotaajuus Fourier-pisteiden määrällä. Fourier-pisteet eivät suoraan vastaa signaalin (esityypillisesti suuremman erottelutarkkuuden luvuiksi ennen analyysia. Alkuperäisen digitaaliäänitteen kvantisointitarkkuus on kuitenkin syytä selvittää, koska pieni kvantisointitarkkuus tai kovin hiljainen äänite tuottaa kvantisointikohinaa, joka voi merkittävästi vaikuttaa analyysin tarkkuuteen. Varsinaisen spektrianalyysin ensimmäinen vaihe on ikkunointi, jossa signaalista valitaan analysoitavaksi joukko peräkkäisiä ääninäytteitä. ä. Ikkunan koko määrää yhtäältä taajuusvasteen tarkkuuden ja toisaalta analyysin tarkkuuden ajassa tapahtuvien muutosten suhteen. Mitä pidempi ikkuna on, sen tarkemman tuloksen spektrianalyysi periaatteessa antaa. Toisaalta pitkän ikkunan sisällä tapahtuvat muutokset signaalissa, esimerkiksi säveltason muutokset, vibratot tai glissandot, heikentävät analyysin tarkkuutta. Pitkä ikkuna tuottaakin tarkan tuloksen vain pitkissä, staattisesti soivissa jaksoissa. Käytännössä ikkunalle on haettava optimipituus ajallisten vaihtelujen ja taajuusvasteen esitystarkkuuden kompromissina. Hyvänä lähtökohtana on mitoittaa ikkuna vastaamaan kuuloalueen alarajoilla olevaa aallonpituutta (esim. 20 Hz:n taajuudella 50 ms:n pituus). Tätä matalammat värähtelyt kuuloaisti tulkitsee rytmisiksi hahmoiksi ja korkeammat säveltasoiksi. Fourier-analyysi tuottaa virheettömän tuloksen vain, jos ikkuna on täsmälleen yhtä pitkä kuin analysoitavan signaalin ääniaallon periodi. Muussa tapauksessa signaalijakson alku- ja loppupään välille muodostuu epäjatkuvuus, yleensä äkillinen siirtymä värähdystasolta toiselle, joka näkyy taajuusvasteessa ylimääräisinä taajuuskomponentteina. Musiikkiesitysten analyysissa edellä mainitun ehdon täyttäminen edellyttäisi rajautumista yksiäänisiin esityksiin ja joko ikkunan pituuden säätämistä kunkin säveltason mukaiseksi tai signaalin esikäsittelyä ikkunan pituuteen sovittamiseksi. Tällaista taajuussynkronoitua Fourier-analyysia käytetään muun muassa soitinakustiikan tutkimuksessa. Yleiskäyttöisempi ja suoraviivaisempi menetelmä on käsitellä ikkuna painotusfunktiolla, jolla ikkunan alun ja lopun värähtelyä vaimennetaan niin että ikkunan alussa signaalin voimakkuus on nolla tai lähes nolla (ts. täysin hiljainen tai hyvin pieni). Painotusfunktiota kutsutaan myös painotusikkunaksi tai ikkunointifunktioksi (engl. Window 61

Kuva 2: Ikkunointi ja painotusfunktion toiminta: a) signaalijakson oskillogrammi (värähtelyliike ajassa), b) sama jakso Hanningpainotusfunktiolla käsiteltynä 62 merkiksi soittimen tuottaman äänen) yläsäveliä, vaan mittaavat tietyillä tasavälein jaetuilla taajuuskaistoilla esiintyvän värähtelyn voimakkuutta ja vaihetta. Soitinäänen osasävelet sijoittuvat joidenkin Fourier-pisteiden kohdalle ja näkyvät magnitudivasteessa korostumina ympäristöönsä (eli viereisiin Fourier-pisteisiin) nähden. Ikkunoinnista johtuen Fourier-analyysi ei myöskään tuota täysin tarkkaa taajuusvastetta, vaan yläsävelet aiheuttavat korostumia myös tämän taajuudeltaan lähimmän Fourier-pisteen viereisiin pisteisiin. (Tähän ilmiöön voidaan osin vaikuttaa ikkunoinnin painotusfunktion valinnalla.) Aika-alueella (ts. ennen Fouriermuunnosta) oleva ikkunoitu signaali voidaan Fourier-analyysin näkökulmasta tulkita siten, että se muodostaa katkeamattoman värähtelyprosessin. Prosessi alkaa ikkunan alusta ja päättyy ikkunan loppuun. Tämän jälkeen prosessi alkaa uudelleen samanlaisena kuin ikkunan alussa ja toistuu saman periaatteen mukaisesti loputtomiin. Prosessin voi katsoa ulottuvan samanlaisena myös menneisyyteen siten, että ikkunan alkua edeltää tämän loppua vastaava värähtely. Ikkunan alku tai loppu on siis vain yksi piste toistuvan signaalin jatkumossa ja ajan kulkua voidaan tarkastella sekä eteenpäin että taaksepäin. Tästä voidaan johtaa ns. negatiivisten taajuuksien käsite, joka kuuluu Fourier-muunnoksen teoreettiseen terminologiaan. Myös taajuusalueella oleva signaali on tulkittavissa loputtomana toistuvan taajuusvasteen yhtenä jaksona, joka toistuu samanlaisena sekä loputtoman korkeisiin taajuuksiin (näytteenottotaajuuden kerrannaisina jaksoina) että negatiivisiin (ikään kuin takaperin kulkevaa aikaa kuvaaviin) taajuuksiin. Fourier-muunnosalgoritmille syötettävät aika-alueella olevan signaalin näytteet koodataan tyypillisesti reaalilukuina, joiden arvot on skaalattu välille -1..+1. Reaalilukusyötteellä Fourier-muunnos tuottaa symmetrisen magnitudispektrin siten, että signaalin ylärajataajuuden (ts. Nyquistin taajuuden, joka on puolet näytteenot-

totaajuudesta) ylittävien taajuuksien spektri on peilikuva tämän alittavasta spektristä. Samoin negatiivisten taajuuksien spektri on peilikuva positiivisten vastaavasta. Näin ollen Fourier-pisteistä voidaan karsia pois ylärajataajuuden ja näytteenottotaajuuden välinen osuus eli puolet pisteistä. Musiikkisignaalin graafisissa kuvaajissa rajaudutaankin yleensä vain ylärajataajuuden alittavien positiivisten taajuuksien kuvaamiseen ja näistäkin valitaan usein kuvattavaksi vain jokin osa-alue. Diskreetissä Fourier-muunnoksessa näytteiden määrä voi olla mikä tahansa, mutta FFT:ssä näytteiden määrän on oltava jokin 2:n potenssi, esim. 2 10 = 1024. Ikkunan pituuden ja Fourier-pisteiden määrän ei kuitenkaan tarvitse olla sama, vaan ikkuna (ja painotusfunktio) voidaan säätää myös tätä lyhyemmäksi ja lisätä ikkunan alkuun ja/tai loppuun nollan arvoisia näytteitä niin, että sen koko saadaan kasvatettua seuraavaan 2:n potenssiin. Useimmissa Fourier-analyysiohjelmissa ikkunan pituus ja Fourier-pisteiden määrä ovat kuitenkin samat. Magnitudi- ja vaihetiedon erottelun jälkeen kyseiset vasteet voidaan tulostaa graafisesti. Yksittäisten ikkunoiden vastetta kutsutaan magnitudi- ja vaihespektreiksi. Yhdistämällä useita, pidemmästä signaalijaksosta määrävälein peräkkäin otettuja spektrejä voidaan tuottaa spektrogrammeja, joilla voidaan havainnollistaa spektrin muutoksia ajassa. Kuvissa 3a ja 3b on kuvassa 2 esitettyjen painotetun ja vastaavasti painottamattoman jakson magnitudispektrit rajattuna taajuusalueelle 20..1200 Hz. Painottamattoman signaalin (3b) spektrissä osasävelten välissä näkyy voimakkaampaa aaltoilua kuin painotetussa jaksossa (3a). Tässä osasävelet puolestaan erottuvat selvemmin ympäristöstään, mutta muodostavat toisaalta leveämpiä kellomaisia hahmoja. Painotusfunktion hyödyt tulevat parhaisten esiin hiljaisimpien yläsävelten tarkastelussa, jotka ilman painotusta saattavat peittyä muuhun, pohjakohinalta näyttävään singaaliin. Kuva 3: a) painotetun jakson magnitudispektri ja b) painottamattoman jakson magnitudispektri. 63

Kirjoitukseni seuraavassa osassa perehdytään muun muassa näiden kuvaajien tarkempiin ominaisuuksiin, muihin kuvaajatyyppeihin sekä kuvaajien tulkintaan musiikintutkimuksen näkökulmasta. 64 Lähteet Cogan, Robert 1984. New Images of Musical Sound. Cambridge, Massachusetts: Harvard University Press. Fourier, Joseph 1822. Théorie analytique de la chaleur. Paris: Firmin Didot Père et Fils. Laine, Pekka Mikael & Lassfolk, Kai 2006. Jousisoittimen äänen arviointi spektrianalyysin avulla. http://www.music.helsinki. fi/tmt/tutkimus/jousisoitinanalyysi/. (Tarkistettu 18.2.2013.) Lilja, Esa 2009. Theory and Analysis of Classic Heavy Metal Harmony. Helsinki: IAML Finland. Oppenheim, Alan V. & Schafer, Ronald W. 2010. Discrete-Time Signal Processing. 3rd. Edition. Upper Saddle River, New Jersey: Prentice Hall. Rainio, Riitta 2010. Suomen rautakautiset kulkuset, kellot ja kelloriipukset: äänimaiseman arkeologiaa. Helsinki: Suomen musiikkikirjastoyhdistys.