Visuaalisten objektien tunnistus

Samankaltaiset tiedostot
Ihminen havaitsijana: Luento 6. Jukka Häkkinen ME-C2600

Ihminen havaitsijana: Luento 5. Jukka Häkkinen ME-C2000

Kertaus. Markku Kilpeläinen RESEPTIIVISET KENTÄT. Eräitä näköjärjestelmän reseptiivisen kentän tyyppejä. Retinan ganglion ja LGN -solut

Marrin teorian pääpointti: Reseptorit

Kuulohavainnon perusteet

Moniaistisuus. Moniaistinen havaitseminen. Mitä hyötyä on moniaistisuudesta? Puheen havaitseminen. Auditorisen signaalin ymmärrettävyyden vaikutukset

Simo Vanni Aivotutkimusyksikkö ja AMI keskus O.V. Lounasmaa laboratorio Perustieteiden korkeakoulu Aalto yliopisto.

Näköhavainnon perusteet

JOHDATUS TEKOÄLYYN TEEMU ROOS

Organization of (Simultaneous) Spectral Components

Kuulohavainto ympäristössä

Tuntoaisti. Markku Kilpeläinen. Ihossa olevat mekanoreseptorit aloittavat kosketusaistimuksen. Somatosensoriset aistimukset

Aistit. Kaisa Tiippana Havaintopsykologian yliopistonlehtori. Luento Aistit ja kommunikaatio-kurssilla 12.9.

S Havaitseminen ja toiminta

S Havaitseminen ja toiminta

VISUAALISET HAHMOTTAMIS-VAIKEUDET KOULUTYÖSSÄ EO, KM KRISTIINA JOKINEN JOENSUU

Toiminnallisen näön profiili

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Lasten visuaaliset. Sokeus on ÓsuhteellinenÓ kšsite, kapeutta (alle 20 ) molemmissa. voimakasta nššn tarkkuuden. 1Ð8/ syntynyttš lasta

Toiminnallisen näön profiili

JOHDATUS TEKOÄLYYN TEEMU ROOS

S09 04 Kohteiden tunnistaminen 3D datasta

Tilastotiede ottaa aivoon

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Nopeus, kiihtyvyys ja liikemäärä Vektorit

Tietoisuuden tutkimus

5 Akustiikan peruskäsitteitä

Laskut käyvät hermoille

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Havaintopsykologia I. Havaintopsykologia: Miksi ja miten? Markku Kilpeläinen. Markku Kilpeläinen

Tulostettavat KPL-lisätehtävät

Juuri 3 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Siltaaminen: Piaget Matematiikka Inductive Reasoning OPS Liikennemerkit, Eläinten luokittelu

Opetusmateriaalin visuaalinen suunnittelu. Kirsi Nousiainen

Luento 3: 3D katselu. Sisältö

Essity Engagement Survey 2018

Luento 15: Ääniaallot, osa 2

Tänään ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus laskarit. Ensi kerralla (11.3.)

Valon havaitseminen. Näkövirheet ja silmän sairaudet. Silmä Näkö ja optiikka. Taittuminen. Valo. Heijastuminen

PYÖRÄHDYSKAPPALEEN PINTA-ALA

YHTEISKUNTA MUUTTUU- KUINKA ME MUUTUMME? Asiaa aivotutkimuksesta ja hahmottamisesta

Tilastotiede ottaa aivoon

Esteetön PowerPoint-esitys

Psykoosisairauksien tuomat neuropsykologiset haasteet

HELSINKI UNIERSITY OF TECHNOLOGY T Käyttöliittymäpsykologia VISUAALISEN HAVAINNOINNIN HUOMIOIMINEN KÄYTTÖLIITTYMÄSUUNNITTELUSSA

JOHDATUS TEKOÄLYYN TEEMU ROOS

Taulukkolaskennan perusteet Taulukkolaskentaohjelmat

ARVO - verkkomateriaalien arviointiin

KÄYTTÖLIITTYMÄT. Visuaalinen suunnittelu

MUSIIKKI, AIVOT JA OPPIMINEN. Mari Tervaniemi Tutkimusjohtaja Cicero Learning ja Kognitiivisen aivotutkimuksen yksikkö Helsingin yliopisto

RATKAISUT: 19. Magneettikenttä

2.1 Ääni aaltoliikkeenä

ETNIMU-projektin, aivoterveyttä edistävän kurssin 5.osa. Aistit.

800 Hz Hz Hz

ψ(x) = A cos(kx) + B sin(kx). (2) k = nπ a. (3) E = n 2 π2 2 2ma 2 n2 E 0. (4)

Venekilpailu! Esteiden väistely ja hahmon ohjaaminen

5.3 Suoran ja toisen asteen käyrän yhteiset pisteet

Muotoilumaailman hahmottaminen - Tuotesemantiikka

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

Lego Mindstorms NXT robottien etenemissuunnitelma

FYSIIKKA (FY91): 9. KURSSI: Kertauskurssi KOE VASTAA KUUTEEN (6) TEHTÄVÄÄN!!

Koko maan ilveskanta-arvion taustasta ja erityisesti Etelä-Hämeen arviosta. Tiedosta ratkaisuja kestäviin valintoihin

JOHDATUS TEKOÄLYYN TEEMU ROOS

Derivointiesimerkkejä 2

Toiminnallisen näönkäytön tutkiminen lastenneurologisella osastolla ja poliklinikalla

Aikamatkustus. Emma Beckingham ja Enni Pakarinen

Magneettikenttä. Liikkuva sähkövaraus saa aikaan ympärilleen sähkökentän lisäksi myös magneettikentän

Taulukkolaskennan perusteet Taulukkolaskentaohjelmat

Kenguru 2016 Student lukiosarja

Havaitseminen ja tuote. Käytettävyyden psykologia syksy 2004

JOHDATUS TEKOÄLYYN TEEMU ROOS

4.1 Kaksi pistettä määrää suoran

Hei kuka puhuu? lapsen kohtaaminen ja tukeminen

JOHDATUS TEKOÄLYYN TEEMU ROOS

Ihminen havaitsijana: Luento 7. Jukka Häkkinen ME-C2600

Digitaalisen arkkitehtuurin alkeet

Mitä aivokuvista näkee?

Opetussuunnitelma ja selviytymisen kertomukset. Eero Ropo

muistijärjestelmä Ympäröivä aisti-informaatio Tiedon valikoiminen tarkkaavaisuuden avulla taustatietoa muistista MUISTI 7

Kenguru 2017 Student lukio

Keskeisiä asioita edelliseltä luennolta

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2018 Insinöörivalinnan matematiikan koe, , Ratkaisut (Sarja A)

Ultraäänen kuvausartefaktat. UÄ-kuvantamisen perusoletukset. Outi Pelkonen OYS, Radiologian Klinikka

SMART Board harjoituksia 09 - Notebook 10 Notebookin perustyökalujen käyttäminen 2 Yritä tehdä tehtävät sivulta 1 ilman että katsot vastauksia.

Linkkitekstit. Kaikkein vanhin WWW-suunnitteluohje:

Kenguru 2014 Student sivu 1 / 8 (lukion 2. ja 3. vuosi)

6 TARKASTELU. 6.1 Vastaukset tutkimusongelmiin

20 Kollektorivirta kun V 1 = 15V Transistorin virtavahvistus Transistorin ominaiskayrasto Toimintasuora ja -piste 10

Pakollinen testi: U-arvo

Prosodian havaitsemisesta: suomen lausepaino ja focus

58131 Tietorakenteet (kevät 2009) Harjoitus 11, ratkaisuja (Topi Musto)

Kognitiivinen psykologia tutkii tiedonkäsittelyä. Neuropsykologia tutkii aivojen ja mielen suhdetta MITEN AIVOT TOIMIVAT?

Kieli merkitys ja logiikka. Johdanto. Kurssin sisältö. Luento 1: Johdanto. Kirjasta. Kieli, merkitys ja logiikka, HY, kevät Saara Huhmarniemi 1

Kenguru Benjamin (6. ja 7. luokka) ratkaisut sivu 1 / 6

Luento 6: Tulostusprimitiivien toteutus

Luku 6. reunaehtoprobleemat. 6.1 Laplacen ja Poissonin yhtälöt Reunaehdot. Kun sähkökentän lauseke E = φ sijoitetaan Gaussin lakiin, saadaan

NTKIMJSKOHTEEN SlJAINTI AKAIWEN, SAHAKOSKI KARTAN MITTAKAAVA 1 :

Erityislapset partiossa

Geogebra -koulutus. Ohjelmistojen pedagoginen hyödyntäminen

Öljysäiliö maan alla

Transkriptio:

Visuaalisten objektien tunnistus Markku Kilpeläinen Käyttäytymistieteiden laitos, Helsingin yliopisto Tietokone osaa kyllä etsiä reunoja kuvasta, mutta mitkä reunat ovat olennaisia? Page 1 of 29 Page 3 of 29 Jotta kohteita voidaan tunnistaa, ne täytyy erottaa taustasta Esimerkkejä Gestalt -laeista http://www.graphics.cornell.edu Page 2 of 29 Ns. Gestalt lait määritettiin 1900- luvun alussa -Lait ennustavat (varsin pätevästi), mitkä kuvan elementit ihminen todennäköisesti ryhmittelee yhteen. -Tämä mahdollistaa periaatteessa objektien (elementit ryhmässä) erottamisen taustasta (ei elementtejä ko. ryhmässä). -Lait toimivat, mutta eivät anna selitystä sille, miten näköjärjestelmä noudattaa lakeja, eli suorittaa ryhmittelyn. -Yleisesti hyväksyttyä selitystä ei ole vieläkään olemassa Page 4 of 29 Symmetria Samankaltaisuus Lähekkäisyys Sulkeutuminen Jatkuvuus http://www.cs.iupui.edu/~tuceryan/

Tosielämässä on monimutkaisempaa Kun objekti on erotettu taustasta ja muista samankaltaisista, mikä se on? -Jokaisen kohteen suora vertaaminen mielessä olevaan malliin kyseisestä kohteesta (ns. isoäiti-solu) on melko mahdoton ajatus: -Pitäisi olla neuraalinen edustus jokaisesta henkilöstä ja esineestä kaikilta mahdollisilta etäisyyksiltä ja kaikista kulmista katsottuna täysin ääretön määrä malleja Monet kuvan piirteet auttavat erottelemaan objektit toisistaan näköjärjestelmän täytyy valita jokin vaihtoehdoista Page 5 of 29 -Sen sijaan olisi enemmän mahdollista, että olisi edustus tietyille piirteiden suhteille, jotka koosta tai vaihtelevuuksista Page 7 of 29 riippumatta tunnistettaisiin. Kun näköjärjestelmän varhaiset tasot ovat tuottaneet jonkinlaisen (tarkoituksenmukaisesti) käsitellyn kuvan ulkomaailman informaatiosta, objektintunnistusjärjestelmän täytyy: 1. Erotella objekteja taustasta / ryhmitellä elementit: mikä kaikki kuuluu yhteen objektiin? 2. Tunnistaa: Minkälainen kuvio se on? 3. Tunnistaa eroteltu objekti. Mikä se on? Page 6 of 29 David Marrin komputationaalinen lähestymistapa Marr tajusi, että aivot eivät ole valkokangas, vaan niiden täytyy aktiivisesti käsitellä sisään tuleva informaatiovirta ja tehdä niistä käyttökelpoinen esitys. Lisäksi koska Marr oli kiinnostunut siitä, miten keinotekoinen näköjärjestelmä voitaisiin valmistaa, ylläolevan tehtävän vaikeus ja monimutkaisuus tuli ymmärretyksi. -Marr erotti näköjärjestelmän tehtävästä 3 vaihetta: 1) Ensimmäinen luonnos 2) 2.5-D luonnos 3) 3-D malli todellisuudesta Page 8 of 29

Reunan yhdistäminen 1) Ensimmäinen luonnos Verkkokalvon pikselikuva, josta järjestelmä erottaa: Reunoja, Palkkeja, Viivanpäitä, Täpliä Järjestelmä ryhmittelee Reunat ym. elementit tiettyjen (Gestalttyyppisten) periaatteiden mukaan, esim: Lähekkäisyys, Viivojen jatkuvuus David Fieldin (ja monien muiden) psykofysikaaliset tutkimukset tukevat ajatusta ns. assosiaatiokentästä. Reseptiiviset kentät osoittavat kohti toisiaan: linkitetään Eivät osoita: ei linkitetä Page 9 of 29 Loffler (2008) Vision Research Page 11 of 29 1. Objektin erottaminen taustasta Onko kuvissa pelkkää yleistä hälyä vai jokin taustasta erottuva säännönmukaisuus? Missä? Mikä se on? Assosiaatiokentän neurofysiologinen tausta: V1 -Solut yhteydessä pääasiallisesti melko samaa orientaatiota preferoiviin soluihin. -Tietty solu yhteydessä pääasiallisesti soluihin, jotka käsittelevät näkökentässä aluetta, joka on ko. solun reseptiivisen kentän päässä. -Tällaiset toisiinsa yhteydessä olevat solut pääasiallisesti vahvistavat toistensa responsseja (aivan vierekkäisiä näkökentän alueita käsittelevät solut vaimentavat toisiaan, harmaa alue kuvassa) Page 10 of 29 Page 12 of 29

2) 2.5-D luonnos Kaikille edellisessä vaiheessa erotelluille yksiköille annetaan arvo syvyys- ja orientaatio-asteikoilla - Käytetään mm. syvyyshavainto vihjeitä (kts. edellinen luento) Kovera ärsyke löydetään kuperoiden joukosta nopeammin kuin kupera koveroiden joukosta. 45 +10 Orientaatio (astetta) 0 90 - Kuten ensimmäinen luonnos, myös tämä vaihe on katselukulmasta riippuva. Syvyys (asteikko merkityksetön) - 2.5-D luonnos ei sisällä objektien piilossa olevia osia Page 13 of 29 0-10 Hakuaika 1 5 10 Ärsykkeiden määrä Humphreys & Müller, 2000 Page 15 of 29 3) 3-D malli todellisuudesta katselukulma-riippumaton - Primitiiviyksiköt: lieriöitä, joilla on yksi pää-akseli - Suhteellisen helppo hahmottaa, vaikka katselukulma vaihtelee - Hahmottamalla ryhmän lieriöitä, voimme verrata ärsykettä muistissa olevaan luetteloon 1) Ensin etsitään objektista koverat kohdat. Ne osoittavat lieriöiden liitoskohdat 2) Sitten määritetään lieriöiden pää-akselien orientaatiot V1:n tuottamien assosiaatiokenttien jatkokäsittelyn fysiologiaa -V2:n solut valikoivia ärsykkeille, joissa on 2 tietyn orientaation omaavaa viivaa, eli tietty kulma. -Eivät siis tietylle kulman suuruudelle Reseptiivinen kenttä Keskisuuri vaste:2 Keskisuuri vaste:2 Suuri vaste: 2+2=4 Korkeintaan pieni vaste:1 Kovera kohta Page 14 of 29 -Sen sijaan alueella V4 solut vaikuttavat olevan valikoivia tietylle kulmallekin, missä tahansa suunnassa esitettynä (3. vs 4. tilanne). Page 16 of 29

Biederman muokkasi Marrin teoriaa lähinnä: 1) Korvaamalla lieriöt 36 erilaisella geonilla 2) Esittämällä ei-satunnaisuus (non-accidental) periaatteen: - Tietty muoto 2-D kuvassa (mistä tahansa kuvakulmasta) heijastaa suurella todennäköisellä vastaavaa muotoa 3- D kuvassa. - On huonoa tuuria, jos jokin mikä näyttää kuutiolta, onkin pyramidi suoraan pohjasta päin katsottuna Katselukulma-riippumaton 3-D malli mahdollistuu. Tosielämässä, havainnoija muodostaa reunoja sinne, missä niitä ei fysikaalisesti ole - Näköjärjestelmä käyttää jollain lailla tietoa siitä, että kun esineissä (pallot ja viivat) on epäjatkuvuuksia, jokin (talo) yleensä peittää ne. Esimerkkejä Geoneista: www.pigeon.psy.tufts.edu Page 17 of 29 Page 19 of 29 Marrin ja Biedermanin teorioiden arviontia + Objektien havaitsemisen suuri haaste näköjärjestelmälle on ymmärretty + Koverat kohdat vaikuttavat todella olevan tärkeitä objektien tunnistamiselle - Hienovaraiset, meille helpot erottelut (oma muki vs. joku muu) eivät onnistu geonien perusteella - Katselukulman ja objektin kontekstin merkitystä aliarvioidaan Näköjärjestelmän käyttämät yleisperiaatteet : 1. Implisiittinen tieto fysiikan laeista (synnynnäinen tai nopeasti kokemuksessa opittu). 2. Havaittu kuva on se todennäköinen eikä mikään lukemattomista epätodennäköisistä vaihtoehdoista. A B C Onko näkymän A todennäköinen selitys B vai C? Page 18 of 29 Page 20 of 29

Aivovaurioiden antama kuva objektien tunnistamisen eri osa-tehtävistä Kasvojen havaitseminen: erikoistoiminto vai ei? Kasvojen haivaitsemista on tutkittu paljon, koska se on ihmiselle äärimmäisen tärkeä kyky. Riddoch ja Humphreys erottivat erilaisia objektintunnistuksen vaikeuksia, joihin on myös löydetty vastaavia paikallisia aivovaurioita. Tuttujen ja tuntemattomien kasvojen prosessointi voi olla häiriintynyt toisesta riippumatta (kaksoisdissosiaatio). - Toisistaan ainakin osittain riippumattomat aivoalueet Esim: Tietynlaisen vamman saaneet sekoittavat kahden objektin piirteitä: Musta ympyrä ja punainen laatikko. - Objektiin liittyvä tieto muistista (se on onkivapa, onkimiseen) -Objektirakenteen tunnistaminen muistista (pitkä, ohut, taipuisa keppi) - Katselukulma-riippumattomuus - Piirteiden yhdistely (binding) - Reunojen ryhmittely Page 21 of 29 Ylemmät toiminnot rakentuvat alempien päälle Ongelmat ovat sitä laajempia, mitä alempaan tasoon vaurio vaikuttaa Prosopagnosia: Kasvojen tunnistaminen häiriintynyt, vaikka muiden kohteiden tunnistaminen normaalia. Tutut kasvot kuitenkin aiheuttavat tuntemattomista eroavia tiedostamattomia vasteita. Lisäksi: -Aivokuvantaminen on tuottanut paljon suurta julkisuutta saaneita tutkimuksia, joissa vaikuttaa tulevan esiin kasvoalue aivoissa -Vaikuttaa, että kasvot prosessoidaan lähtökohtaisesti kokonaisuutena, toisin kuin muut objektit. Page 23 of 29 Inferior temporal cortex (IT) objektin tunnistuksen päätepysäkki? -Vahvat yhteydet hippokampukseen ja muihin muistin kannalta tärkeisiin rakenteisiin. -Solujen reseptiiviset kentät sisältävät aina tarkan näön alueen. -Solujen responssin voimakkuus yleensä riippumaton kohteen koosta, väristä ja paikasta verkkokalvolla. -Solujen reseptiiviset kentät hyvin erilaisia kuin useimmilla alemmilla näköaivokuorilla. -Res. kentät ja yhteydet muistirakenteisiin viittaavat tärkeään rooliin objektien tunnistuksessa. Page 22 of 29 IT Dorsaalinen Ventraalinen thebrain.mcgill.ca Mutta: -Jopa eräs kuvantamisen kasvoalue pioneereista (Kanwisher) on nyttemmin esittänyt, että se mikä vaikuttaa kasvoalueelta on vain kohta aivokuorella, jossa preferoidaan sellaisia eri muuttujien arvoja (esim. orientaatioiden yhdistelmiä), joita kasvoista löytyy. Tummien pisteiden etäisyys ympyrän keskikohdasta Aivokuoren pintaa Ympyrän soikeus Esimerkki-muuttujat ovat fantasiaa, mutta kukaan ei tiedä, millä muuttujilla korkeita aivokuoria pitäisi tutkia tai käsitteellistää! Ympyrämäisissä muodostelmissa edustettu pisteiden välinen ero. Toisaalta: Viimeaikaisessa tutkimuksessa apinan temporaalilohkon soluissa preferenssien suhteen ei vierekkäisillä soluilla aivokuorella esiintynyt kuten ylläoleva teoria ennustaisi Page 24 of 29

-Kokonaisuutena prosessointi on tyypillistä, kun havaitsija on kyseisten objektien ekspertti. Ihmisistä tulee jo hyvin varhain kasvojen havainnoinin supereksperttejä. Koska puhe on aina ajassa nopeasti muuttuvaa ääntä, on sitä tarpeen kuvata kuvaajalla, jossa on eri taajuuksien suhteellinen energia kuvattu ajan funktiona. Aivokuoren temporaalilohkolla on alueita, joilla on suuri rooli kasvojen käsittelyssä, mutta on vielä aivan auki, mikä ko. alueiden toimintaperiaate ja kyseisten toimintaperiaatteiden perimmäinen tarkoitus on? Klusiili on äänne, joka syntyy, kun ilmavirta ensin pysäytetään ääntöväylässä ja sitten annetaan sen purkautua äkillisesti. (Wikipedia). Käytännössä vokaali tai kuten sanassa linja-auto. Joka tapauksessa kasvot ovat tärkeä osoitus siitä, että puhdas näkökulmariippumaton objektintunnistus (ala Marr) ei ole koko totuus. Page 25 of 29 Page 27 of 29 Kertaus Puheen kontrolloitu tutkimus vaatii puheärsykkeiden tarkan kuvailun, tässäkin tapauksessa fourier-analyysi tarjoaa työkalut. Formantti on taajuus, jota jokin ääntöväylän kohta (kurkunpää, suuontelo jne.) vahvistaa suhteessa toisiin (suodattaa vähemmän kuin muita). Ihminen havaitsee käytännössä vain 2-5 matalinta formanttia. Äänihuulista lähtee ääntä 100 Hz perustaajuudella Ääntöväylä korostaa tiettyjä taajuuksia (yläääniä), tuloksena tietty vokaali (i) Ganglionsolujen reseptiiviset kentät (alla) ja useammat näköaivokuorien reseptiiviset kentät pysyvät paikallaan aina, kun katse pysyy paikallaan. Premotorisen aivokuoren näkötunto solujen reseptiiviset kentät (oikealla) liikkuvat käden mukana, vaikka katse pysyy paikallaan. Page 26 of 29 Page 28 of 29

Ihminen tarttuu kädellä ruokaan apinan nähden aktivaatio Apina tarttuu kädellä kyseiseen ruokaan. aktivaatio Ihminen tarttuu esineellä ruokaan apinan nähden ei aktivaatiota Apina tarttuu kädellä ruokaan näkemättä ruokaa aktivaatio Peilisolujen aktivaatio on siis kiinni tietystä motorisesta suorituksesta, joko toisen tai itsen tekemästä. Page 29 of 29