Musiikin suunta 1/2005 Petri Toiviainen & Tuomas Eerola Musiikkitietokannat kansanmusiikin tutkimuksessa Musiikkia on pitkään tallennettu erilaisiin kirjallisiin kokoelmiin, ensyklopedioihin ja temaattisiin luetteloihin. Jo Ilmari Krohn (1902) kehitti sävelmien kadensseihin perustuvaan luokittelujärjestelmä. Myös Barlowin ja Morgensternin (1948) toimittamassa hakuteoksessa A Dictionary of Musical Themes listataan noin 10 000 sävellyksen teeman alut tietyssä sanakirjamaisessa järjestyksessä, joiden avulla siis voi periaatteessa hakea mieltään askarruttavan kappaleen. Nykyisin tietokannat ovat digitaalisia, ja näitä kysymyksiä voidaan ratkoa tietokoneen avulla. Kansanmusiikin tutkimukseen digitaaliset tietokannat antavat uusia mahdollisuuksia. Erilaiset hakutoiminnot mahdollistavat esimerkiksi tietokannan tutkimisen uusilla tavoilla. Lisäksi tietokoneella voidaan analysoida tehokkaasti suuriakin aineistoja, jolloin kokoelmista saadaan uutta empiiristä tietoa, jota kuulonvaraisen tai nuotinnokseen perustuvan käsivaraisen analyysin pohjalta olisi mahdotonta hahmottaa. Tässä artikkelissa käsittelemme näitä tietokantojen kansanmusiikin tutkimukseen tuomia uusia näkökulmia. Kansanmusiikkitietokantoja Internetissä tai muussa digitaalisessa muodossa olevia kansanmusiikkitietokantoja on olemassa muutamia. Helmut Schaffrathin (1995) toimittama Essenin kokoelma (Essen folk song collection) koostuu noin 6 000 5 kansansävelmästä, jotka ovat pääasiassa keskieurooppalaista alkuperää. Kukin sävelmä on kokoelmassa esitetty notaatiopohjaisessa muodossa (**kern), minkä lisäksi sävelmistä on tarjolla erilaista metatietoa, kuten maantieteellinen alue, tyyli, tahtilaji, säemerkinnät. Uusiseelantilaisessa Otagon yliopistossa keitetty MELDEX-tietokanta sisältää vajaa pari tuhatta kansansävelmää Digital Tradition -kokoelmasta (Greenhaus 1996), joka kattaa pääasiassa Brittein saarilta peräisin olevaa perinnemusiikkia. Muutamia yksittäisiä kulttuurialueita kattavia pienempiä kokoelmia löytyy myös Humdrum -ohjelman käyttämässä representaatiossa Ohion yliopiston verkkosivuilta (mm. Frances Densmoren keräämiä Amerikan intiaanien lauluja). Laajin digitaalinen kansanmusiikkikokoelma on Ilmari Krohnin (1899 1933) toimittaman Suomen Kansan Sävelmiä -kokoelman digitaalinen verkkoversio Suomen Kansan esävelmät (Eerola ja Toiviainen 2004). Kokoelmassa on liki 9 000 kansansävelmää ja ne löytyvät niin nuotinnoksina kuin MIDI-tiedostoinakin. Kustakin sävelmästä on tietokannassa myös metatietoa. Kokoelmaa kuvataan seuraavassa tarkemmin. Suomen Kansan esävelmät Ilmari Krohn teki arvokkaan kulttuurityön toimittaessaan Suomen Kansan Sävelmiä -teoksissaan noin
MUSIIKIN SUUNTA 1/2005 9000 suomalaista kansansävelmää kokoelmista, jotka Suomalaisen kirjallisuuden seuran kenttätyöntekijät olivat arkistoihin keränneet. Krohn (1902 1903) kehitti kokoelman jäsentämiseksi myös luokittelujärjestelmän, joka sai runsaasti huomiota Euroopassa. Itse kokoelma on kansallisesti arvokas, yhtenäinen ja hyvin dokumentoitu. Tästä johtuen kokoelma on yhä nykyään tärkeä lähde suomalaisille muusikoille ja musiikin harrastajille (ks. esim. Pekkilä 1984). Kokoelmat julkaistiin vuosien 1898 1933 aikana, ja ne koostuvat seuraavista osista: Laulusävelmät, Hengelliset sävelmät, Kansantanssit, Runolaulut sekä Kantele- ja jouhikkosävelmät. Suomen Kansan esävelmät -hankkeessa tämä kokoelma on tuotu tutkijoiden ja kansanmusiikin ystävien ulottuville tietotekniikan keinoin. Hankkeessa digitoitiin vuosina 2002 ja 2003 kokoelman kaikki sävelmät ja niihin liittyvä metadata ja laadittiin näiden perusteella tietokanta ja internet-sivusto. Verkossa olevasta tietokannasta on mahdollista hakea sävelmiä selaimella käytettävällä hakukoneella. Haku on mahdollista muun muassa sanojen, paikkakuntien, läänien, musiikillisten piirteiden tai kerääjien mukaan. Haun tuloksena saadaan sävelmien nuotit ja muut tiedot. Lisäksi haettuja sävelmiä voi kuunnella. Mukana on myös yksinkertaisia musiikin sisältöön perustuvia hakumenetelmiä. Tämä digitoitu kansanmusiikkikokoelma on merkittävä aineisto vertailevalle musiikintutkimukselle, sillä mikään muu digitaalinen musiikkitietokanta ei ole yhtä laaja sekä yhtenäisesti ja verrattain rajatulta alueelta kerätty. Kuva 1. Suomen Kansan Sävelmien maantieteellinen jakauma. Tietokoneavusteinen musiikkianalyysi Digitaalisia musiikkitietokantoja voidaan käyttää tietokoneavusteisen musiikintutkimuksen materiaalina. Tällöin sovelletaan erilaisia tietokonealgoritmeja, joilla suuria musiikkiäänitekokoelmia voidaan automaattisesti analysoida ja luokitella. Tätä uutta tutkimusalaa kutsutaan nimellä musiikin sisältöhaku, Music Information Retrieval (MIR) (Downie 2003; Leman 2002). Kyseessä on monitieteinen tutkimusalue, jossa yhdistetään musiikkitieteen, kognitiivisen musiikkitieteen, tietojenkäsittelytieteen ja signaalinkäsittelyn tietämystä ja menetelmiä. Luokittelun lähtökohtana ei musiikin sisältöhaussa ole musiikkiteosta koskeva metadata vaan musiikillinen sisältö eli se, miltä musiikki kuulostaa. Toimiakseen hyvin tällaisen järjestelmän tulee kyetä hahmottamaan musiikista piirteitä, jotka ovat 6
Musiikin suunta 1/2005 kuulijan kannalta olennaisia. Nämä piirteet liittyvät musiikin peruselementteihin, kuten melodiaan, sointiväriin, rytmiin ja sointuihin sekä näiden välisiin suhteisiin. Kansanmusiikin tutkimuksessa tietokoneavusteinen analyysi sopii siten esimerkiksi sävelmien alueellisten erojen ja yhtäläisyyksien tarkasteluun sekä eri maiden kansanmusiikkien piirteiden vertailuun. Seuraavissa luvuissa annamme joitain esimerkkejä tämänkaltaisista analyyseistä. Suomen Kansan Sävelmien keruupaikat Alkuperäinen Suomen Kansan Sävelmiä -kokoelma sisältää tiedon useimpien sävelmien keruupaikasta. Tämän tiedon avulla on mahdollista tehdä erilaisia maantieteellisiä vertailuja. Kokoelmassa mainittujen sävelmien keruupaikkojen sijainnit muunnettiin pituus- ja leveyspiireiksi erilaisten kartastojen avulla. Koska monien paikkakuntien nimet ovat nykyisin jotain muuta kuin sävelmien keräämishetkellä (1800-luvun loppupuolella) eritoten Suomen nykyisten rajojen ulkopuolisilla alueilla koordinaattien saamiseksi tehtiin jonkin verran selvittelytyötä. Karjalan ja Inkerin alueen paikannimissä voi silti olla yhä epäselvyyksiä tai virheitä. Joissakin tapauksissa kylän tai pitäjän nimeä ei ole annettu ja silloin on käytetty annetun maakunnan keskipistettä. Nämä keskipisteet on jätetty pois yksittäisten piirteiden maantieteellisiä jakaumia kuvatessa. Karttojen pohjana on satelliittikuva Suomesta. Kuvassa 1 on esitetty Suomen Kansan Sävelmien keruupaikkojen jakauma. Kukin valkoinen ympyrä Kuva 2. Suomen Kansan Sävelmien osakokoelmien maantieteellinen jakauma. 7 osoittaa yhden sävelmän keruupaikan. Kuten kartasta selviää, Lapista ei sävelmiä tähän kokoelmaan ole juurikaan kerätty. Tämän puutteen korjasi Armas Launis (1908), joka 1900-luvun alussa keräsi suuren joukon suomensaamelaisia joikuja. Kuvassa 2 on esitetty Suomen kansan sävelmien osakokoelmien maantieteellinen jakauma sekä sävelmien määrä (N) kussakin osakokoelmassa. Kartoista näkee heti, kuinka eri kokoelmat painottuvat eri seuduille (Laulusävelmät on kerätty melko tasaisesti ympäri Suomea, Hengelliset sävelmät muutamalta toisistaan kaukana olevalta seudulta, Runosävelmät pääosin Inkeristä ja Kantelesävelmät etupäässä Laatokan Karjalasta).
MUSIIKIN SUUNTA 1/2005 Kuva 3. Mollisävelmien suhteellinen osuus eri alueilla. Musiikillisten piirteiden maantieteellisiä jakaumia Edellä esitettyjen keräyspaikkajakaumien lisäksi voidaan tutkia erilaisten musiikillisten piirteiden maantieteellisiä vaihteluita. Musiikilliset piirteet voivat perustua joko alkuperäisen kokoelman sisältämään metadataan (esim. nuotinnoksen sävel- tai tahtilaji) tai ne voivat olla erilaisilla algoritmeilla irrotettuja musiikillisia piirteitä. Kuvassa 3 on kuvattu mollisävelmien suhteellinen osuus maantieteellisesti. Suhteellinen osuus kullakin alueella on kuvattu harmaasävyjen avulla. Tumma väri kuvaa korkeaa ja vaalea matalaa mollisävelmien osuutta. Esimerkiksi Itä-Suomessa mollisävelmien osuus on lähes puolet kaikista sävelmistä. Länsirannikolla, Turun ja Oulun alueilla, taas noin 75 % kappaleista kulkee duurisävellajissa. Harmaasävyjen merkitys löytyy kuvan oikeassa reunassa olevasta selitepylväästä, jossa kerrotaan piirteen suhteellinen osuus. Karttaa varten on valittu ainoastaan Laulusävelmät-kokoelmissa (osat 1 4) olevat sävelmät. Mollissa kulkevat kappaleet on määritelty kerääjien antamien sävellajien mukaan. Tosin käsitteet duuri ja molli olivat tuohon aikaan vielä ongelmallisia, koska sävelkulkuja voisi paremmin luonnehtia erilaisten moodien ja pentatonisten asteikoiden avulla (ks. esim. Leisiö 1999). Kuvassa 4 on kuvattu kolmijakoisten laulusävelmien maantieteellinen jakauma. Kolmijakoisiksi on laskettu kappaleet, joiden tahtilaji on joko 3/4 tai 6/8. Kuten kuvasta näkyy, kokonaisuudessaan kolmijakoiset kappaleet edustavat vähemmistöä, sillä tiheimmilläänkin näitä kappaleita on vain noin 15 % alueen (esim. Etelä-Savon) kappaleista. Aina laulu ei ala sävellajin perussävelestä (toonikasta), mutta varsinkin Pohjanmaalla laulut näyttävät alkaneen tältä säveleltä useammin kuin muualla (ks. kuva 5). 8
Musiikin suunta 1/2005 Laulujen sanojen yleisyyden maantieteellinen vaihtelu esävelmät-tietokantaan on tallennettu Suomen Kansan Sävelmien laulusävelmien ensimmäisten säkeistöjen sanat. Sanoja kokoelmassa on yhteensä 74 596, erilaisia sanoja taivutusmuodot mukaan lukien on 13 857. Tätä aineistoa hyväksikäyttäen voidaan musiikillisten piirteiden lisäksi kuvata eri sanojen yleisyyden maantieteellistä vaihtelua. Tällainen vertailu antanee tietoa siitä, mitkä ovat tyypillisiä laulujen aiheita eri puolilla maata. Kuvassa 6 on esitetty iloa kuvaavien sanojen (kuten ilo ja riemu ) yleisyys eri puolilla maata. Näitä sanoja ei lauluissa tosin kovin paljoa käytetä, mutta yleisempiä ne ovat lounaisrannikolla. Kuvaa 6 on mielenkiintoista vertailla kuvaan 7, jossa on esitetty surua kuvaavien sanojen (kuten murhe, suru, onneton ) yleisyyden maantieteellinen vaihtelu. Tämänkaltaiset laulunaiheet näyttävät olevan yleisimpiä Inkerinmaalla, tyypillinen sanoitus on esimerkiksi: Onneton olin minä ollessani, onneton tähän kylään tullessani. Kuva 4. Kolmijakoisten laulusävelmien suhteellinen osuus eri alueilla. Lopuksi Kansanmusiikin tietokannat ja niiden analysointi tietokoneen avulla tarjoavat uuden näkökulman kansanmusiikin tutkimukseen. Menetelmän avulla on mahdollista saada hyvä kokonaiskuva suurista kansanmusiikkiaineistoista. Eri musiikillisten piirteiden vertailua voidaan tehdä yksittäisen kansanmusiikkikokoelman sisällä tai useiden eri kokoelmien välillä. Myönteistä tällaisessa tutkimuksessa on käytetyn analyysiprosessin selkeä formulointi ja läpinäkyvyys, jolloin objektiivinen analyysi ja sen Kuva 5. Perussäveleltä alkavien sävelmien suhteellinen osuus eri alueilla. 9
MUSIIKIN SUUNTA 1/2005 Kuva 6. Iloa kuvastavien sanojen yleisyys eri alueilla. tuloksiin perustuva subjektiivinen tulkinta voidaan selkeästi erottaa toisistaan. Tietokoneavusteisen analyysin tuloksia arvioitaessa on syytä pitää mielessä eräitä menetelmän rajoituksia. Ensinnäkin transkriptiot, joihin analyysi yleensä perustuu, ovat alkuperäisen esityksen approksimaatioita, joiden muotoon ovat vaikuttaneet sekä muistiinkirjoittajan että perinteisen nuotinnusjärjestelmän rajoitukset. Tehtäessä tulosten perusteella johtopäätöksiä esimerkiksi tietyn alueen kansanmusiikin ominaispiirteistä on kyettävä tavalla tai toisella arvioimaan, kuinka hyvin tietokannassa oleva aineisto edustaa koko aineistoa. Aineiston edustavuuden osatekijöitä lienevät ainakin sen kattavuus sekä erilaiset sävelmien suosioon liittyvät tekijät. Kuva 7. Surua kuvastavien sanojen yleisyys eri alueilla. Lähteet Barlow, Harold & Morgenstern, Sam (1948) A Dictionary of Musical Themes. New York: Crown Publishers. Downie, J. Stephen (2003) Music information retrieval Annual Review of Information Science and Technology 37. Toim. Blaise Cronin. Medford: Information Today. S. 295 340. Eerola, Tuomas, & Toiviainen, Petri (2004) Suomen Kansan esävelmät. Suomalaisten kansansävelmien elektroninen tietovaranto http://www.jyu.fi/musica/sks/ (tarkistettu 11.3.2004). Greenhaus, Dick (1996) About the Digital Tradition http://www.mudcat.org/digitrad-blurb.html (tarkistettu?). [Osoite ei toimi enää!] Krohn, Ilmari (1902 1903) Welche ist die beste Methode um Volks- und volksmässige Lieder nach 10
ihrer melodischen (nicht textlichen) Beschaffenheit lexikalisch zu ordnen? Sammelbände der Internationalen Musikgesellschaft 1902 3: 643 660. Launis, Armas (1908) Lappische juoigos-melodien. Mémoires de la société Finno-Ougrienne 26. Helsinki: Société Finno-Ougrienne. Leisiö, Timo (1999) Karjalan hääsävelmistön tyylihistoriaa Musiikin suunta 3/1999: 45 69. Leman, Marc (2002) Musical audio mining Dealing with the Data Flood: Mining data, text and multimedia. Toim. Jeroen Meij. Rotterdam: STT Netherlands Study Centre for Technology Trends. S. [sivut?]. Pekkilä, Erkki (1984) Ilmari Krohnin leksikografisesta kansansävelmien luokittelumenetelmästä Musiikki 1/1984: 1 12. Schaffrath, Helmut (1995) The Essen folksong collection in kern format. Menlo Park: Center for Computer Assisted Research in the Humanities. Musiikin suunta 1/2005 11