Ált. 1.3

6
1.3. Akusztikus észlelés: a hangoktól a beszédészlelésig 1.3.1. A hangok alapvető tulajdonságai és észlelésük A hang egy tárgy mechanikai rezgéséből származik, és valamilyen közvetítő közeg (általában levegő) segítségével terjed. A hangok terjedése hanghullámok révén valósul meg, melyek a környezet tárgyaiba ütközve elnyelődhetnek, vagy visszaverődhetnek. A hanghullámok a levegő részecskéinek sűrűsödéséből és ritkulásából állnak – a hanghullám tehát a légnyomás szabályos megváltozásából jön létre. A hanghullám 3 paraméterrel jellemezhető. A hangnyomás a hangerő, a sűrűsödések és ritkulások nagysága. Amplitúdóval fejezhető ki. Jele a p, mértékegysége a Pa, vagy a mikroPa. De a hangnyomás intenzitással is jellemezhető, ekkor a hang energiáját írjuk le; mértékegysége a W/m 2 . A hangerő mérésének leggyakoribb mértékegysége a decibel, ami exponenciális hangerő- növekedést ír le. Képlete: dB=20 log (p 1 /p 0 ) /p 1 -vizsgált érték, p 0 -alapnyomás érték (általában 20 mikroPa)/. A 0 dB a hallási küszöb, 130 dB a fájdalomküszöb. A másik paraméter a rezgésszám, ez a frekvencia, a sűrűsödések és ritkulások időegység alatti száma. Ez feleltethető meg (nagyjából) a hangmagasságnak. Mértékegysége a hertz (Hz), de a hullámhosszal is leírható. Az ember 20 és 20 000 Hz között képes érzékelni a hanghullámokat. A harmadik paraméter a hanghullám időtartama, vagy másként a fázis. Azt írja le, hogy a hanghullám 1 teljes periódusa mennyi idő alatt játszódik le. Vannak tiszta hangok, melyek leírhatóak egyetlen, szabályos szinuszfüggvénnyel. Ezeket a hangvilla közelíti meg. A komplex hangok többféle frekvenciából adódnak össze; az alaphang az, amelynek egészszámú többszörösei a frekvenciakomponensek, az alaphangra épülnek rá a felharmonikusok. A hangok észlelése A fülbe érkező hang hatására a dobhártya, valamint a hallócsontok közvetítésével mozgásba jön a csiga folyadéka, és ennek révén az alaphártya. Az alaphártya mozgása a szőrsejtek tetején lévő csillószőrök elhajlását eredményezi, ez pedig elektromos változásokat okoz a szőrsejtekben. Ezek az elektromos impulzusok továbbítódnak a hallóidegrostokba. A hallóidegrostok a hallóidegben futnak össze, amely az agytörzsben több helyen átkapcsolódik, illetve átkereszteződik, 1

Upload: nermal93

Post on 27-Oct-2015

28 views

Category:

Documents


1 download

DESCRIPTION

Ált. 1.3.

TRANSCRIPT

Page 1: Ált. 1.3

1.3. Akusztikus észlelés: a hangoktól a beszédészlelésig

1.3.1. A hangok alapvető tulajdonságai és észlelésük

A hang egy tárgy mechanikai rezgéséből származik, és valamilyen közvetítő közeg (általában levegő) segítségével terjed. A hangok terjedése hanghullámok révén valósul meg, melyek a környezet tárgyaiba ütközve elnyelődhetnek, vagy visszaverődhetnek. A hanghullámok a levegő részecskéinek sűrűsödéséből és ritkulásából állnak – a hanghullám tehát a légnyomás szabályos megváltozásából jön létre.

A hanghullám 3 paraméterrel jellemezhető. A hangnyomás a hangerő, a sűrűsödések és ritkulások nagysága. Amplitúdóval fejezhető ki. Jele a p, mértékegysége a Pa, vagy a mikroPa. De a hangnyomás intenzitással is jellemezhető, ekkor a hang energiáját írjuk le; mértékegysége a W/m2. A hangerő mérésének leggyakoribb mértékegysége a decibel, ami exponenciális hangerő-növekedést ír le. Képlete: dB=20 log (p1/p0) /p1-vizsgált érték, p0-alapnyomás érték (általában 20 mikroPa)/. A 0 dB a hallási küszöb, 130 dB a fájdalomküszöb. A másik paraméter a rezgésszám, ez a frekvencia, a sűrűsödések és ritkulások időegység alatti száma. Ez feleltethető meg (nagyjából) a hangmagasságnak. Mértékegysége a hertz (Hz), de a hullámhosszal is leírható. Az ember 20 és 20 000 Hz között képes érzékelni a hanghullámokat. A harmadik paraméter a hanghullám időtartama, vagy másként a fázis. Azt írja le, hogy a hanghullám 1 teljes periódusa mennyi idő alatt játszódik le.

Vannak tiszta hangok, melyek leírhatóak egyetlen, szabályos szinuszfüggvénnyel. Ezeket a hangvilla közelíti meg. A komplex hangok többféle frekvenciából adódnak össze; az alaphang az, amelynek egészszámú többszörösei a frekvenciakomponensek, az alaphangra épülnek rá a felharmonikusok.

A hangok észlelése

A fülbe érkező hang hatására a dobhártya, valamint a hallócsontok közvetítésével mozgásba jön a csiga folyadéka, és ennek révén az alaphártya. Az alaphártya mozgása a szőrsejtek tetején lévő csillószőrök elhajlását eredményezi, ez pedig elektromos változásokat okoz a szőrsejtekben. Ezek az elektromos impulzusok továbbítódnak a hallóidegrostokba. A hallóidegrostok a hallóidegben futnak össze, amely az agytörzsben több helyen átkapcsolódik, illetve átkereszteződik, végül pedig az agykéreg temporális lebenyében található elsődleges hallókéregbe érkezik.

A fizikai ingerek átalakítását idegi impulzusokká mechano-elektromos transzdukciónak nevezik.

Hogy hogyan alakítja át az alaphártya az egyes frekvenciákat megfelelő idegi impulzusokká, arra több elmélet is született. A frekvenciaelmélet szerint (Rutherford) az alaphártya ugyanazon a frekvencián rezeg, mint a hang. Ezt azonban anatómiailag lehetetlen. A helyelmélet szerint (Helmholtz) egy hang hatására csak az alaphártya specifikus részei rezegnek a hang magasságának megfelelően. Ezt az elméletet is cáfolták. Az utazóhullám elmélet szerint (Békésy György) a helyelmélet nagyjából helyes, mert a frekvencia kódolása az alaphártya specifikus részeihez köthető. De egy utazóhullám maximális elhajlása hozza létre a megfelelő hangot. Hogy hol éri el az utazóhullám a maximumot, az határozza meg, hogy milyen hang kódolódik, és minél erősebb a hang, annál nagyobb az utazóhullám.

1.3.2. Akusztikus objektumok

Az akusztikus objektumok (vagy hallási tárgyak, vagy hallási láncok) egy különálló hangforrásból érkező, különböző fizikai jellemzőkkel rendelkező, összetartozó hangok (zenedarab vagy madárcsicsergés).

1

Page 2: Ált. 1.3

A hallás során elvégezzük az azonosítást, vagyis meghatározzuk, hogy mi az, amit hallunk, másrészt lokalizáljuk, hogy honnan jön a hang.

Hanglokalizáció

A környezetből származó hangok forrásának helyét és távolságát azonosítjuk. A lokalizációban elsősorban a binaurális (kétfüles) érzékelésre támaszkodunk, melynek jelzőmozzanatai az interaurális hangerőkülönbség (IHK), amikor a két fülbe más hangerővel érkezik a hang, továbbá az interaurális időkülönbség (IIK), mely szerint, amelyik fülbe hamarabb érkezik a hang, ahhoz közelebb van a tárgy

A hallási lokalizáció duplexelmélete szerint az alacsony frekvenciájú hangok lokalizációjában az IIK, a magas frekvenciájúakéban az IHK játszik központi szerepet.

Monaurális (egyfüles) lokalizáció esetén a fülkagyló külső járatain történő hangvisszaverődések is segítenek megállapítani, hogy honnan jön a hang. A fülkagyló és a fej kissé megváltozatják a hangokat (erősítik vagy halkítják), és segítik a lokalizációt (fejhez kötött átviteli függvény (FKÁF)).

Azonosítás

Az azonosítás során érvényesülnek a gestalt elvek.

A hallási színtérelemzés az akusztikus információk szétválasztása, vagyis annak eldöntése, melyik hang melyik hangforrásból származik. A hallási lánc a hallási tárgyaknak felel meg (hangok egy összetartozó lánca).

Ahhoz, hogy az észlelőrendszer a hallási láncokat el tudja különíteni egymástól, a hangok idői távolságát használja fel; ezt segíti még a háttér-figura hatás, vagyis, hogy egyszerre csak egy hangláncra tudunk figyelni.

A hallási láncokra bontásban a spektrális szerveződési elvek is nagy segítséget jelentenek. A „régi plusz új” szabály szerint ha jön egy új hang, akkor annak a folytatásaként tekintjük, amelyikhez jól illik. A harmonikussági alapelv mondja ki, hogy a hallórendszer azokat a felharmonikusokat azonosítja, amelyek feltételezhetően egy alaphanghoz taroznak. A közös sors elve alapján, ha egyszerre kezdődnek vagy végződnek és változnak a hangok, akkor egy hallási lánc részének tekintjük őket

1.3.3. Automatikus változás-detekció és figyelmi működések a hangoknál

Az észlelés egyik fontos feladata a környezetben végbemenő változások gyors detektálása. A változás lehet egy új objektum megjelenése, vagy egy hosszabb ideig érvényes sémától, szabálytól való eltérés. A változás-detekció vizsgálatában központi szerepet játszanak az akusztikus jelekkel történő vizsgálatok, mert ezekkel tanulmányozható jól a jelenség.

A kísérletek alapsémája az, hogy kialakítanak egy olyan hangkörnyezetet, melyre a kísérleti személynek nem kell figyelnie, és ahol valamilyen szabály szerint ismétlődő hangok hallhatóak (ezek a sztenderd hangok). Közben, időnként, ezektől a sztenderd hangoktól eltérő hangok érkeznek, ezeket nevezzük deviáns hangoknak (sok mély hang közben ritkán megjelenik egy magas).

Az emberek automatikusan detektálják, hogy változás történt, és ez onnan tudható, hogy megváltozik az agyi elektromos aktivitásuk. Amikor oda nem illő, deviáns hang érkezik, akkor megjelenik egy eseményhez kötött potenciál-összetevő, az eltérési negativitás (EN).

2

Page 3: Ált. 1.3

A változás-detekció az emlékezeti rendszer és a beérkező akusztikus input össze nem illésén alapul. Az EN tehát akkor váltódik ki, ha egy emlékezeti nyom és a beérkező hang reprezentációjának összevetésekor az eredmény az össze nem illés.

A hangsorozatokban az egyes sajátságokat az akusztikus emlékezet külön-külön tárolja. Ha kialakul egy szabály vagy séma az emlékezetben, akkor az ettől való bármilyen eltérés EN-t vált ki. De az, hogy milyen szabály alakul ki, befolyásolja azt, hogy milyen változás vált ki EN-t. Például egy „magas után mély jön” szabályban nincs benne, hogy mennyire kell mélynek lennie ennek a hangnak, és bármilyen mély hang jön, az bele fog illeni a sémába. Ha viszont az a szabály, hogy „magas után három hanggal mélyebb hang jön”, akkor egy akármilyen nem 3 hanggal mélyebb hang már kiváltja a potenciál-változást. (Ezek a szabályok nem tudatosak, hiszen a kísérleti személyeknek nem is kell figyelni a hangokat.)

Az akusztikus tároló rendszer sokféle bonyolult szabály megjegyzésére képes, és az egyes akusztikus objektumokra külön szabályokat is képes tárolni.

Ezeknek a változás-detekcióknak fontos szerepük lehet például a nyelvtanulásban, a fonémadiszkriminációban (két nagyon hasonló hang megkülönböztetése). Azok a hangok, melyek nem léteznek a mi nyelvünkben (és valamely más hanghoz tartozónak véljük), nem váltanak ki EN-t. Az idővel azonban a személyek elkezdik megtanulni ezeket a hangokat is, és egyre nagyobb EN mutatható ki náluk a hang hallatán.

Mivel a hangforrások nem folyamatosan bocsátanak ki hangjelzést, az akusztikus érzékelő rendszernek gyorsnak és pontosnak kell lennie az információ feldolgozásban és a hangforrás lokalizálásában. Az akusztikus ingereknél nincs megfelelés a proximális (az érzékszervben leképződött) és a disztális (távoli, valódi) ingerek között, mint a látásban, ezért itt az észlelő rendszernek helyreállító munkát is kell végeznie.

A figyelem szerepét az akusztikus ingerek szűrésében, jól szemlélteti a koktélparti-helyzet, ahol bár hatalmas a hangzavar, a beszélgetőpartnerek mégis hallják egymást.

A figyelem vizsgálatában a dichotikus hallgatási kísérletekben volt legkifejezettebb a hangok szerepe. Az ilyen kísérletekben a két fülbe eltérő ingerek érkeznek, és így jól vizsgálható a figyelem megosztása, a figyelmi szűrés, vagy a rövid távú memória kapacitása.

1.3.4. A beszéd észlelése

A beszéd észlelésének folyamata két részre bontható: a beszédhangok és hangkapcsolatok felismerésére (a fonémák azonosítása), és ezek értelmezésére (a szavak, mondatok, szöveg feldolgozása).

Az első rész további két részre bontható: a beszédhangok akusztikai környezettől való elválasztására, és az akusztikus input (beszédhangok) megfeleltetésére a mentális reprezentációknak (fonéma).

A beszédhangok másként hangzanak az egyes szavakban, mint izoláltan (ezt nevezzük kontextusfüggő átszerveződésnek vagy koartikulációnak), mégis képesek vagyunk azok azonosítására, fonémáknak való megfeleltetésére.

A kutatások azt mutatják, hogy nincs egy az egyben megfelelés a beszédhangok akusztikai jellemzői és azok reprezentációja között (akusztikai-fonetikai varianciaproblémának). Eddig nem sikerült olyan állandó akusztikai észlelési kulcsokat találni, amelyek minden esetben meghatározhatnának egy adott fonémát (Vagyis van-e egyáltalán olyan tulajdonsága a hangoknak, ami kontextustól függetlenül állandó?).

Liberman szerint a beszéd megértése során nem megfeleltetés zajlik, hanem dekódolás, ahol visszafordítunk egy kódolt üzenetet az eredeti formájára. A beszédkód dekódolására azonban szükség van egy speciális dekóderre, ami csak a beszédhangok kódolásával és

3

Page 4: Ált. 1.3

dekódolásával foglalkozik, más hangokkal nem. Kísérletileg is igazolták, hogy a hallási észlelésnek létezik egy speciális beszédmódja, pontosabban üzemmódja, amit akkor kapcsol be, ha beszédhangokkal találkozik.

Erre az elméletre három bizonyíték van. Egyik a szinuszhullámú beszéd észlelése. Ez egyfajta eltorzított beszéd, de érthető, ha az ember tudja, hogy beszédet hall, tehát „beszédmódba” van kapcsolva. Ha nem tudja a személy, hogy beszédet hall, akkor csak egyszerű akusztikai ingerként észleli a hangokat. A beszéd észlelésében megfigyelhető agyféltekei különbségek is magyarázatként szolgálhatnak. Köztudottan a beszéd észlelése a bal agyféltekében történik, míg más akusztikus információk feldolgozása nem lateralizált. A harmadik evidencia a beszédhangok kategoriális észlelése. A beszédhang kisebb-nagyobb mértékű változásai nem okoznak változást az észlelésben – ez teszi lehetővé a fonémaazonosítást. A kategoriális észlelés csak embereknél létezik, és csak beszédhangokra érvényes, újabban azt is feltételezik, hogy azok között is csak a mássalhangzókra. Ezt a kategoriális észlelést valószínűleg tanulás útján sajátítjuk el, amikor megtanuljuk, hogy csak az olyan változásokra figyeljünk oda, amelyek befolyásolják a szavak jelentését. A kategóriák megfelelnek a percepciós bázisunk hangjainak, ezek azok a fonémák, amelyek a nyelvünkben megtalálhatók.

Vannak bizonyítékok amellett, hogy a fonémák valójában nem is a beszédünk alapegységei, ilyen például a fonéma-restaurációs hatás, ami azt jelenti, hogy nem vesszük észre, ha egy szóból kivesznek egy beszédhangot, és a helyét elfedik. Másik ilyen bizonyíték, hogy szótagokat hallunk a fonémákat gyorsan egymás után játszanak le nekünk, vagy, hogy a szótagokat gyorsabban azonosítjuk, mint a fonémákat.

A beszéd észlelésére több elmélet is született. A motoros elmélet szerint azért tudjuk megérteni a beszédet, mert nagyon szoros kapcsolat van a beszéd percepciója és produkciója között. A megkülönbözető jegyek elmélete szerint a beszédfeldolgozó rendszerünkben vannak olyan vonásdetektorok, amelyek a fonémák bizonyos jegyeire (képzés helye, zöngésség) szelektíven érzékenyek.

4