Äänen digitointi. Juha Korvenpää. Kansalliskirjasto Kansallinen digitointikeskus, Mikkeli



Samankaltaiset tiedostot
Ääni%eiden digitoin, Kansalliskirjastossa

Heikki Helin Metatiedot ja tiedostomuodot

Mitä PAS-järjestelmä tarkoittaa museoille?

Juha Henriksson. Digitoitavan aineiston valinta Dr. Juha Henriksson Finnish Jazz & Pop Archive

Kirjastojen kansallinen metatietovaranto -hanke Yleisten kirjastojen projekti

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

C-kasetin digitointi Audacity-ohjelmalla

Hyvät käytännöt ja pitkäaikaissäilytyksen huomioiminen digitoinnissa FT István Kecskeméti, sektorijohtaja, Kansallisarkisto

Käyttöoikeuksien metatieto

Pitkäaikaistallennus. CSC - Tieteen tietotekniikan keskus IT2008 Ari Lukkarinen

Tekstin digitointi Kansallisarkistossa

Osoite Kotisivut. Yhteyshenkilö.. Tehtävä Sähköposti... Puhelin:..

Digitointiprojektin käytäntö ja ongelmat. Esimerkkinä Porin taidemuseon digitointiprojekti 2014

C-kasetin digitointi Audacity-ohjelmalla

Juha Henriksson. Digitointiprojektin hallinta ja ulkoistaminen Dr. Juha Henriksson Finnish Jazz & Pop Archive

DAISY. Esteetöntä julkaisua

Juha Henriksson. Digitaalinen äänentallennus Dr. Juha Henriksson Finnish Jazz & Pop Archive

Digitoidut aineistot ja kaukopalvelu. Harri Ahonen Suomen tieteellinen kirjastoseura Kokoelmatyöryhmä

Aineistojen paketoinnin pilotit PAS-seminaari 2013 Kuisma Lehtonen

KODAK EIM & RIM VIParchive Ratkaisut

TTA, PAS ja julkishallinnon standardisointi

Äänitedigitointi Kotuksessa Varmistaminen ja pitkäaikaissäilytys (PAS) Jussi Rusi

KDK/PAS: Mitä kuvien luetteloinnissa tulee ottaa huomioon pitkäaikaissäilytyksen näkökulmasta? Esityksen sisältö

KOPIOLUETTELOINTI KANSALLISKIRJASTON TIETOKANNOISTA

Mitä tiedon pitkäaikaissäilytys tarkoittaa?

Äänitteiden laadukas itsepalveludigitointi Digitoimistossa

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

Äänikirjojen kuvailuohje

Kansallinen digitaalinen kirjasto

C-kasetin digitointi Audacity-ohjelmalla

Museoaineiston digitointi. Museovirasto, Tiedonhallintakeskus Vesa Hongisto

Kansalliskirjaston palvelut digitoijalle

KDK-ajankohtaispäivä museoille

Museoaineiston digitointi

Kansallinen digitaalinen kirjasto -tilannekatsaus. Digiajasta ikuisuuteen -seminaari Minna Karvonen

Museo 2015 järjestelmä ja Museoiden luettelointiohjeet

Yleiset tiedot. paperiaineisto. AV-aineisto. valokuvat. digitoidut ja digitaalisena syntyneet aineistot

Suomen Jazz & Pop Arkiston digitointiopastus. Jouni Eerola Suomen Jazz & Pop Arkisto

Äänitteitä lainaava asiakaskunta

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

AV-muotojen migraatiotyöpaja - video. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

Muusa ja KDK:n asiakasliittymä

Museoiden digitointiavustus

Vinyylilevyn tai C-kasetin digitointi

KANSALLISKIRJASTON DIGITOINTIPOLITIIKKA

Kokoelmien arviointi

KDK Kansallinen digitaalinen kirjasto

äänitedigitoinnin alkeet toimittanut Outi Puustinen

LUE ENSIN KOKO OHJE LÄPI JA KYSY NEUVOA! 5. Klikkaa Audacity-ohjelmassa mikrofonikuvakkeen vieressä tekstiä Napsautus käynnistää seurannan.

Cubase perusteet pähkinänkuoressa. Mikä Cubase on? Projektin aloitus

Kansallinen yhteisluettelo kirjastojen luettelointiyhteistyön tukena. Pori Nina Hyvönen

Aineistojen paketoinnin pilotti KDK-PITKÄAIKAISSÄILYTYS 2013 SEMINAARI

Pitkäaikaissäilytyksen toteutuksen erityispiirteet. TTA:n pitkäaikaissäilytyksen keskustelutilaisuus Kimmo Koivunen

Kansalliskirjasto, tietoyhteiskunnan palvelukeskus. Kirjastoverkkopäivän avaus Kai Ekholm

Pitkäaikaissäilytyksen toiminta ja ylläpito

LP-levyn digitointi Audacity-ohjelmalla

C-kasetin digitointi

Teknologinen muutos ja yliopistojen tulevaisuus. Tievie-seminaari Helsinki Antti Auer

Tietoasiantuntija Juha Piukkula Eduskunnan kirjasto

MichaelPlus. Hankkeen esittely Mikael Vakkari Suunnittelija MichaelPlus hanke

Kansalliset digitaaliset kulttuuriaineistot Eduskunnan kirjastossa Annamari Törnwall

Keskitetty digitaalisen säilyttämisen palvelu osana KDK arkkitehtuuria Kimmo Koivunen CSC Tieteen tietotekniikan keskus

Suomalais-ugrilaisten aineistojen. digitoinnin pilottiprojekti ( )

Luetteloinnin tiedotuspäivä

Julkaistun kokoelman kuvailun muokkaaminen/poistaminen Klikkaa vasemmasta palkista "Edit this Item" (Kuva 1.)

T.E.H.D.A.S. Arkisto. Kokemuksia performanssitaiteen arkistoinnista. Juha Mehtäläinen

Avokelanauhan digitointi Audacity-ohjelmalla

BDD (behavior-driven development) suunnittelumenetelmän käyttö open source projektissa, case: SpecFlow/.NET.

Kysely audiovisuaalisista aineistoista Euroopassa. Loppuraportti TAPE-kyselyn Suomen vastauksista

RDA (Resource Description and Access) & FRBR-käsitemalli

Case YLE D-keskus. Digiwiki-työpaja Kiasmassa: Videoiden digitoinnin perusteet ja prosessit

Sähköiset aineistot ja arvonmääritys rakenteelliset ja tekniset kriteerit. Projektipäällikkö Osmo Palonen, Mikkelin ammattikorkeakoulu

Tutkijatapaaminen

Ennakkometadata - ONIX Maarit Huttunen

Mono- ja stereoääni Stereoääni

Äänitiedostoista. 1 Äänen tallentaminen

Mikkeli - Arkistokaupunki

Tampereen kaupunginkirjasto ja Melinda

Digitointiprosessin työskentelyohjeistus

Kansallinen yhteisluettelo tilannekatsaus ja toimintasuunnitelma Nina Hyvönen

Kansallinen digitaalinen kirjasto - toiminnan säädöspohja. Tekijänoikeusneuvos Viveca Still

KDK:n pitkäaikaissäilytyksen suunnittelun tilanne ja vastaanotettavan aineiston vaatimukset DigiWiki-seminaari Kimmo Koivunen CSC Tieteen

Digitoinnin työpaja 3a/4 Äänitteiden digitoinnin perusteita

7.4 Variability management

VALTIONEUVOSTON JA EDUSKUNNAN YHTEISTEN ASIAKIRJOJEN JA NIIHIN RINNASTETTAVIEN TIETOAINEISTOJEN PYSYVÄ SÄILYTYS

THL:N NÄKÖKULMIA TUTKIMUSAINEISTOJEN SÄILYTTÄMISEEN

Digitointitila asiakkaiden ja henkilökunnan kokemuksia. Jyväskylän kaupunginkirjasto Keski-Suomen maakuntakirjasto

Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto

Kokemuksia PDF/A:sta Arkistolaitoksen VAPApalvelussa

econtentplus ATHENA -hanke Access to cultural heritage networks across Europe KDK ajankohtaispäivä Suvi Leukumaavaara

Mikä muuttuu musiikin kuvailussa? (äänitteet ja nuottijulkaisut)

Yleistä säännöistä Mikä muuttuu musiikin kuvailussa? (äänitteet ja nuottijulkaisut) 0-alue: Sisältö- ja mediatyyppi Sisältötyyppi

Kansallinen digitaalinen kirjasto

TTA-PASin etenemissuunnitelma ja kustannukset

Capacity Utilization

Fennica Melindassa. Melinda-tietoisku Kiti Vilkki-Eriksson Kansalliskirjasto

Åbo Akademi klo Mietta Lennes Nykykielten laitos Helsingin yliopisto

ARKISTOLAITOKSEN SUOSITUS DIGITOINNIN LAATUKRITEEREIKSI:

Museoviraston kuvakokoelmien digitointiprojekti Priorisointikysymyksiä eli arvovalintoja ja haja-ajatuksia

Videoiden digitointi Nuorisoasiainkeskuksessa

Transkriptio:

Äänen digitointi Juha Korvenpää Kansalliskirjasto Kansallinen digitointikeskus, Mikkeli

Sisältö 1. Äänitteiden digitointiprosessi Kansalliskirjastossa Esimerkkejä ja kokemuksia äänitteiden digitoinnista 2. Tekninen metadata Miten ja minne tallennetaan tieto siitä, millä laitteilla digitointi on tehty ja miten hyvin digitointi on onnistunut. BWF-formaatin (Broadcast waveform) ominaisuuksien hyödyntäminen teknisen metadatan tallentamisessa. 3. KDK:n standardisalkku ja digitoidut äänitteet Standardisalkun ensimmäinen luonnos. 4. METS - Metadata Encoding and Transmission Standard METS-standardi pitkäaikaissäilytyksen tallennusmuotona. Millainen digitoidun äänitteen METS-paketti voisi olla: mitä tarvitaan.

Kansallinen digitointikeskus Perustettu 1990 Mikkeliin Yksi Kansalliskirjaston tulosalueista n. 50 työntekijää Aluksi vain mikrokuvaus ja konservointi, paperiaineiston digitointi alkoi 1990-l. lopulla DocWorks-järjestelmä digitoidun paperiaineiston jälkikäsittelyyn 2006 DocWorks tuottaa METS-paketin paperiaineistosta Äänitedigitointiyksikkö valmistui 2007 Noa Audio Solutions, Hedcom

Kansallinen äänitearkisto Toimii Kansalliskirjaston yhteydessä Helsingissä Noin 158 000 äänitettä Äänitteiden vapaakappaleet vuodesta 1981 lähtien Sitä edeltävältä ajalta noin 85 % Suomessa julkaistuista äänitteistä Maan laajin julkinen äänitearkisto Kansalliskirjaston suurten kokoelmien vuoksi tarvitaan tehokas digitointiprosessi

Äänitetietokannat Viola: Suomen kansallisdiskografia Nuotit, äänitteet Fennica: Suomen kansallisbibliografia Puheäänitteet: äänikirjat, liitemateriaalit ym. Raita: Digitoitujen äänitteiden tietokanta Digitoidut äänitteet kuunneltavissa verkossa, jos tekijänoikeudet rauenneet Kaikki käytössä ilmaiseksi verkossa

Kansalliskirjaston äänitedigitointi 1.Tilausdigitointi Helsingissä Asiakkaalle ei anneta kuunteluun alkuperäistä äänitettä, vaan digitaalinen kopio, yleensä CD-levy. Pienet tilaukset, nopea toimitusaika. 2. Systemaattinen digitointi Laajat aineistokokonaisuudet Esimerkiksi kaikki Suomessa julkaistut 78 kierroksen levyt digitoidaan Vuosisadan äänet hankkeessa Äänitteiden massadigitointi Mikkelissä 1980-luvun c-kasetit

Laitteistot Helsinki Protools-järjestelmä Toistolaitteet kaikille ääniteformaateille Nopea toimitusaika Mikkeli Noa-massadigitointijärjestelmä Kolme digitointihuonetta Suunniteltu erityisesti c-kasettien digitointiin Myös CD-, MD- ja vinyylilevyt, avokela- ja DATnauhat

Massadigitointi Useita äänilähteitä digitoidaan samanaikaisesti Digitointiprosessin seuranta Tehtävät mitoitettavissa käyttäjien kokemuksen mukaisesti Laaduntarkkailu ja teknisen metadatan raportointi Metadatan siirto äänitiedostoihin (BWF) Tiedostojen automaattinen tuottaminen

Noa Ääniteiden massadigitointiin kehitetty hajautettu digitointijärjestelmä Digitointiohjelmat eri formaateille, prosessinhallinta, tiedostomuuntimet Noa luo kaksi XML-raporttia 1. Kuvaileva metadata 2. Tekninen metadata Kerätään digitointiprosessin aikana Kuvaa digitoinnin teknistä toteutusta ja onnistumista

Digitointijärjestys Kirjaston kokoelmissa on yli 60 000 c- kasettia, joilla ilmeisin tuhoutumisvaara Lähivuosina digitoidaan uniikit C-kasetit alkaen vuodesta 1981. Uniikki c-kasetti = äänite, joka julkaistu vain kasettimuodossa.

Luettelointiperiaatteet ja digitointi Millaisia äänitiedostoja alkuperäisestä muodostetaan? Esim. A-puoli.wav, B-puoli.wav, raita1.mp3, raita2.mp3 Luettelointitaso eri ääniteaineistolle Puheäänitteet Ei tehdä osakohteita Musiikkiäänitteet Pääsääntöisesti tehdään osakohteet

Tiedostojen nimeämiskäytäntö DUO-k123456-01-2-003 DUO digitoitu Mikkelissä k123456 kirjaston antama signum k=kasetti 01=julkaisun ensimmäinen kasetti 2=b-puoli 003=kolmas raita Eli Julkaisun k123456 ensimmäisen kasetin toisen puolen kolmas raita.

Digitointiprosessi 1. Valinta Luettelointi Kuljetus Hki - Mli Digitointi kannet ja ääni 2. Luetteloinnin täydennys Äänitiedostojen jälkityöt Lopulliset äänitiedostot 3. Tarkistus Kansiot Palautus Hki

Digitoinnin lopputuotteet wav a- ja b-puolesta erikseen BWF 96 khz, 24 bit mp3 a- ja b-puoli tai raitakohtaiset tiedostot MP3 192 kbps tif Kasetin kannet ja paperiliitteet Kannet ja kasetin kuoret: 300 dpi tif xml 1 Tekninen metadata, BWF coding report xml 2 Kuvaileva metadata wmf Tekninen metadata graafisena esityksenä

Ongelmat 1 Pitkät nauhat Tiedostokoon rajoitukset, 2 Gt Nauhojen kunto Alkunauha irtoaa Nauhurien säätäminen Minkä mukaan pitäisi säätää? Kopiointivirheet alkuperäisissä tallenteissa Tyhjät nauhat: onko koko erä tyhjä vai vain kirjaston kappale? Kappaleet lähtevät kesken nauhan alussa Säröytynyt ääni Kanavat epätasapainossa

Ongelmat 2 Mihin huomautus digitointivirheistä ja muista havainnoista? 1. Huomautus digitointijärjestelmään => tulee XML-raporttiin, siirrettävissä esim. METSpakettiin 2. Huomautus kirjaston tietokantaan Kuuluuko bibliografiseen tietueeseen? => Oma tietue digitaaliselle objektille? Mikä Marc-kenttä, fraasit?

Käyttöönsaattaminen Millaisia tiedostoja käyttöön? Kokonaisuudet vai yksittäiset kappaleet? Puheäänitteet: Kasetin A- ja B-puoli Musiikki: yksittäiset raidat Riittääkö mp3 tulevaisuudessa? Cue-merkit äänitiedostoissa => käyttökopioiden automaattinen konvertointi? Kulttuuriaineistolain mahdollisuudet streemaus vapaakappalekirjastoihin

Tekninen metadata Miten digitointi on tehty Kuka, milloin, missä, millä laitteilla, asetukset Hyödyt massadigitoinnissa Virheiden paikantaminen ja ajoittaminen

Mitä tietoa pitäisi tallentaa? WHY: Accurate and sufficient documentation is very important in archiving digital audio recordings in order to produce an archival copy that is authentic and that can be retrieved and migrated to new platforms and media as necessary. HOW: Generate as much metadata as is reasonably possible about all technical details. Provide information about the nature of the tape, the original recording and the transfer parameters used, including playback machine and settings, hard- and software versions, dates and responsibility. Especially all anomalous events and faults in the recording have to be reported. http://www.jazzpoparkisto.net/audio/audio37.html

Minne tieto pitäisi tallentaa 1. Tiedostoon (BWF) Mitä saadaan mukaan Miten tieto voidaan lukea 2. Erillinen tietokanta Viola? Erillinen raportti esim. digitointijärjestelmän tuottama XML

BWF - Broacast Waveformat EBU:n kehittämä wav-äänitiedoston laajennus Laajalti käytössä ääniarkistoissa Yhteensopivuus: tiedostot soivat kaikissa ääniohjelmissa (wav) Tiedostoon voidaan upottaa kuvailevaa ja teknistä metadataa

BWF:n rakenne Broadcast extension chunk The "Broadcast extension" chunk, coded "bext", is contained in all BWF files. It contains the minimum information expected to be needed by all applications in broadcast production. It contains information on the title, origination, date, time, etc. of the audio content. Capturing report (coding history) This optional chunk is intended to contain information on the audio quality of the audio content of a BWF. Frequently this data is gathered at the digitisation stage and can remain with the file as a permanent record of the audio quality and any known defects. http://www.ebu.ch/en/technical/publications/userguides/bwf_user_guide.php http://www.ebu.ch/cmsimages/en/tec_text_r98-1999_tcm6-4709.pdf

3. KDK ja digitoidut äänitteet Miten digitoidut äänitteet tulevat KDK:n asiakasliittymään ja PAS-järjestelmään? Miten metadata yhteismitalliseksi KDKasiakasliittymää varten? Standardisalkussa joitakin ääntä koskevia suosituksia Tekninen metadata - AudioMD Pitkäaikaistallennuksen metadata - Premis Rakenteelliseen kuvaukseen METS Kuvat - MIX Mihin kysymyksiin äänitearkistojen on otettava kantaa?

4. METS - Metadata Encoding and Transmission Standard METS on "säiliö", joka sisältää tiedostot ja niitä koskevan metadatan. The METS schema is a standard for encoding descriptive, administrative, and structural metadata regarding objects within a digital library, expressed using the XML schema language of the World Wide Web Consortium. The standard is maintained in the Network Development and MARC Standards Office of the Library of Congress, and is being developed as an initiative of the Digital Library Federation. http://www.loc.gov/standards/mets/

Metsin rakenne filesec Tiedostot dmdsec Kuvaileva metadata admsec Hallinnollinen metadata behaviorsec Jakelua koskevat tiedot structmap Rakenteellinen metadata

Mets: Tekninen metadata AudioMD Kehitetty prototyypiksi 2003 Ei koskaan yleistynyt eikä välttämättä tule yleistymään Uusi AES-standardi tulossa AES x098 Kolme osaa 1. AES-X098A: Descriptive metadata for audio objects - Core audio schema 2. AES-X098B: Administrative and structural metadata for audio objects 3. AES-X098C: Administrative metadata for audio objects - Process history schema Tiivis yhteistyö EBU:n kanssa, BWF:n yhteensopivuus

Esimerkkejä 1. British Library Mets-profiili äänitteitä varten http://www.bl.uk/profiles/sound/index.html 2. Sound Directions Hyvä esitys audiometsistä: http://www.loc.gov/standards/mets/presentations/robin_we ndler_sound%20directions%20germany.ppt