az alaktan az információs pszicholingvisztikában

39
Az alaktan az információs pszicholingvisztikában Pléh Csaba 3. Óra Információs Pszicholingvisztika a PPKE diákjainak 2014 ősz [email protected]

Upload: taariq

Post on 05-Jan-2016

30 views

Category:

Documents


4 download

DESCRIPTION

Az alaktan az információs pszicholingvisztikában. Pléh Csaba 3. Óra Információs Pszicholingvisztika a PPKE diákjainak 2014 ősz [email protected]. Áttekintés. A morfológia fogalma Szófelismerés és alaktani elemzés. A szuffixumok feldolgozása agglutinatív nyelvekben. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Az alaktan az  információs pszicholingvisztikában

Az alaktan az információs pszicholingvisztikában

Pléh Csaba3. Óra

Információs Pszicholingvisztika a PPKE diákjainak 2014 ősz

[email protected]

Page 2: Az alaktan az  információs pszicholingvisztikában

Áttekintés

• A morfológia fogalma • Szófelismerés és alaktani elemzés.• A szuffixumok feldolgozása agglutinatív nyelvekben. • Elemző és egészleges modellek kombinációja. • Az igekötő levágás és a komplex igék képviselete.• Az alaktani szabályok és az allomorfia: észlelés,

produkció és elsajátítás. • A szabályok és szokások vitája az alaktanban: a

konnekcionisták és Pinker. • Alaktan afáziás és egyéb patológiás folyamatokban.• Alternatívák az alaktanban és a nyelvhasználat mint

értékhordozó (stigmatizációs folyamatok).

Page 3: Az alaktan az  információs pszicholingvisztikában

Morfológia

• A szavak belső szerkezetét vizsgálja

• Morféma: legkisebb jelentéssel bíró nyelvi egység• Szó és szóalak

• elkelkáposztásíthatatlanságaitokért

• Hány morféma ez a szóalak?

Page 4: Az alaktan az  információs pszicholingvisztikában

Morfológiai folyamatok• A morfémák kombinációkészsége nyelvről nyelvre változik:

– Poliszintetikus nyelvek: többszörösen összetett szavak, teljes mondatokat fejezhet ki egy szó.

• Ajjiliurumavagit. (inuktitut)Le akarlak fényképezni.

– Izoláló nyelvek: ritka az összetett szó, a grammatikai morfémák is szabadon állnak.

• I want to take a picture of you. (angol)Le akarlak fényképezni.

• Flektáló nyelv: szláv, latin. Tőtípusok – Agglutináló nyelvek: nyelvtani morfémák többnyire kötöttek,

lexikai morfémák többnyire szabadok.• Le akarlak fényképezni.• Szatellita szerveződés: minden megkülönböztetés másik

morféma kalap-ja-im-nak • Egy-egy nyelv története mozoghat a típusok között.

Page 5: Az alaktan az  információs pszicholingvisztikában

Az alaktan bonyolódása csökkenti a beszélők számát

Nettle, 2012

Page 6: Az alaktan az  információs pszicholingvisztikában

Szavak száma és szóalakok a bibliafordításban. Ragozóknál sok alak s kevés szó

Sekély morfológiai: sok fonéma, sok szó

Page 7: Az alaktan az  információs pszicholingvisztikában

Az alaktan viszonylagos szerepének következményei

(Gergely és Pléh, 1995) Gazdag alaktan

gyors döntések lokálisabb megértés emlékezet szavaknál

(Németh Dezső)

Szegényes alaktanlassabb döntésegészlegesebb

megértés emlékezet

frázisoknál

Page 8: Az alaktan az  információs pszicholingvisztikában

• A morfémákat emlékezetünkben tároljuk: mentális lexikon morfématár része

• A tárolt morfémákból kombinációs szabályok szerint alkotunk szavakat.– prefixáció: be-megy, be-olvas, ? ki-rándul – Szuffixáció drájv-ot, kólá-val – Szóösszetétel sörkorcsolya – kettőzés (egyszer-egyszer, tutyi-mutyi)– szóvegyülés (citrancs)

• A kombinációs szabályok többnyire nem egyéni szavakra vonatkoznak, hanem kategóriákra:

• Főnév + bAn : helyet jelölő főnév• Le + mozgást jelentő ige : lefelé mozgást jelentő

ige

Page 9: Az alaktan az  információs pszicholingvisztikában

A szavak világa

• Tövek és végződések: a szavak felépítése

barátomat

barát om at

Feladatok

szegmentálás tő felismerés Végződések kezelése

felismerés összegzés

Page 10: Az alaktan az  információs pszicholingvisztikában

Mi történik egy bonyolult szónál? A pszichológusok régóta méricskélik ezt

• Holisztikus hozzáférés: erdők

• Teljesen analitikus • erdőben

• egyes kenyeret kenyér kenyeret ? ? ? gyakori idiomatikus szabálytalan

Feldolgozás

Elemződefault

EgészlegesGyakori

Egyedi: házasság

Page 11: Az alaktan az  információs pszicholingvisztikában

Az áttetszőség szerepe Magyari Lilla előfeszítéses

kiolvasási kísérletei

0

10

20

30

40

50

60

70

80

90

100

ÁttetszőSzeszély - Szeszélyes

HomályosÍr - Iroda

Elő

fesz

íté

s (m

sec)

Page 12: Az alaktan az  információs pszicholingvisztikában

Taft: prefixum levágási modell

Page 13: Az alaktan az  információs pszicholingvisztikában

Magyar példák

• Meg-olvas

• Fel-gondol

• Ki-teg

• Melyiket nehezebb eldönteni?

• Levágás: megolvas meg + olvas

• nem megy a kombináció

Page 14: Az alaktan az  információs pszicholingvisztikában

A levágási modell a a magyarban

• Szegmentálást segíti: hangsúly elől, szóalak korlátok

• A töveket és a ragot dolgozzuk fel elsődlegesen (Juhász és Pléh), lassabban, mint az angol vagy olasz

• Fürdőkád hatás 15001600170018001900200021002200230024002500

buolv

asás

ában

bem

erek

ül

kitag

adás

akov

Page 15: Az alaktan az  információs pszicholingvisztikában

Döntések hosszú sok morfémás szavaknál: Pléh és Juhász 1995

bathtub effectAithchison

Page 16: Az alaktan az  információs pszicholingvisztikában

Eleje – vége jó Eleje jó Vége jó

Ha egy pinaglló mbengbereti a sznyráát Pgenbiken, az akár tdoánrot is getheszejrt Amikerában. Vinalgkábun mdenin mninnedel öfüsszegg, menidn cseketüedlenk abápjalan vtja áltoztatha meg a jvöőt. Még elzépeklni is reémes,

A nő nyumlogaar vákgyi. A házsagaás elrtotmol, a láany kamkdioasz- ő eregy kevbéés tajallá a hetlyé, és úgy ézir, rdviöidőre mujszá tálvo keneirlü a hétkölótpaijzan. Eztré fodjaag el egy bajatrá megtáváhí, aknike van egy kis motjeel

A ágmany acsk sesűrkeéget üszl és aszőrekot. Max enm thite nolva, ohgy a ajsát őrbén lkel taszegpamtalnia zet. Jó arzsu olvt, kai glodoban él a leséefge és álksinya lelmett. A

A szavak eleje számít Fazekas szövegjavítási feladat

Page 17: Az alaktan az  információs pszicholingvisztikában

A szavak rekonstrukciója sikeresebb, ha mind a szó eleje mind a vége helyesen van leírva

Page 18: Az alaktan az  információs pszicholingvisztikában

Az előfeszítési helyzet

RPOBLÉMA

PROBLÉMA

Page 19: Az alaktan az  információs pszicholingvisztikában

Előfeszítési hatás a kezdetnél: A rontott szó lelassít az elején és a

végén

200

220

240260

280

300

320

340

360380

1 2 3 4 5 Azonos

RT

PORB

LÉM

A

PRO

LBÉM

A

PRO

BLM

ÉA

PRO

BLÉ

AM

Várhelyi Klára

Page 20: Az alaktan az  információs pszicholingvisztikában

Hasonló szavak, mint a gatingnél Böllár Tő

Böllér-ak bölléruk Jel

Böllér-nak böllér-nuk Rag

Böllér-ak-nek böllér-uk-nek Jel belül

Page 21: Az alaktan az  információs pszicholingvisztikában

A vizsgálati anyag alapja

• 60 kétszótagú főnév, Németh Kornél gating vizsgálata alapján

• Forrás: MOKK korpusz(www.szoszablya.hu)

• 4 csoport egyediségi pont és gyakoriság alapján

Gyakori Ritka

Korai kenyér,

műsor

böllér ,

gyűszű

Késői város ,

csapat

pincsi ,

krokett

Page 22: Az alaktan az  információs pszicholingvisztikában

A ragozott szavak

kenyérnek   kenyérben   kenyérre  

kenyerekkenyerak/ kenyerik kenyerem

kenyeram/ kenyerim kenyered

kenyerad/ kenyerid

kenyereknekkenyeraknek/kenyeriknek kenyerekben

kenyerakben/ kenyeriken

kenyerekre

kenyerakra/ kenyerikra

kenyeremnekkenyeramnek/kenyerimnek kenyeremben

kenyeramben/kenyerimben

kenyeremre

kenyeramra/kenyerimre

kenyerednekkenyeradnek/ kenyeridnek kenyeredben

kenyeradben/ kenyeridben

kenyeredre

kenyeradra/ kenyeridra

• Előfordulások: csak tő, jel, rag vagy jel és rag

• Rontás a tőben (kunyérem) a jelben (kenyérid) vagy a ragban (kenyeredbun)

• Létező, de rosszul illesztett (kenyérim) vagy nem létező toldalékok (kenyérum)

Page 23: Az alaktan az  információs pszicholingvisztikában

A vizsgálat felépítése

• 72, 18 és 34 év közötti résztvevő a Budapesti Műszaki Egyetem hallgatói közül

• 44 (átlag életkor: 21,41 év) nő és 28 (átlag életkor: 21,75 év) férfi

• Minden kísérleti személy döntést hozott az összes szóról, az ingerek fele létező, fele nem létező szó volt

• A szavak egy fixációs kereszt felvillanása után jelentek meg és a kísérleti személyek az i (létező) és r (nem létező) billentyűk segítségével válaszoltak

Page 24: Az alaktan az  információs pszicholingvisztikában

Eredmények – helyes válaszok

• Mind a gyakoriság mind a hibatípus hatása szignifikáns

• A szó gyakorisága és a hibatípus felismerésének gyakorisága között is szignifikáns korreláció figyelhető meg

• Minél később fordul elő a hiba a szóban, elutasítása annál könnyebb és gyorsabb

ritka

gyakori

Page 25: Az alaktan az  információs pszicholingvisztikában

Eredmények - reakcióidők

• Mind a gyakoriság, mind a hibatípus hatása szignifikáns

• A létező szavak elfogadása lassabb, mint a nem létezők elutasítása

• A nem létező tövek elutasítása lassabb, mint a nem létező toldalékoké

• Nincs egyértelmű fürdőkád hatás

• A két magánhangzó harmóniát sértő hibatípus közt nincs különbég, viszont ezekhez képest a nem létező toldalékok elutasítása gyorsabb

ritka

gyakor

i

Page 26: Az alaktan az  információs pszicholingvisztikában

Szóközepén előforduló rontások gyakori szavaknál

• Gyorsabb reakcióidő, de gyakoribb hibázások• Lehet egy optimalizálási mechanizmus eredménye

Reakcióidő

Helyes válaszok

Gyakori

Page 27: Az alaktan az  információs pszicholingvisztikában

A rontás alattomossága

• A rontás előtt lévő 4 karakter előfordulási gyakorisága a MOKK korpuszban, pl.: bölléred - böllérudléru-782 előforduláslére-75283 előfordulás

• A két szám hányadosának logaritmusa (ngram-faktor) határozza meg a rontás alattomosságának a mértékét

Page 28: Az alaktan az  információs pszicholingvisztikában

Tényleg külön dolgozzuk fel a ragokat hallva is ?

• „A hálószobában kóválygott a fejem a csókjaidtól.”

• „A hálószobában mindent belengett illatával a levendula.”

• A második közben nehezebb meghallani a kattanást, mert fel kell dolgozni a szót.

Page 29: Az alaktan az  információs pszicholingvisztikában

Menetközbeni feldolgozás és az alaktan (Gergely és Pléh)

• Extra hang felismerése és az alaktani terhelés

• A végződés feldolgozás már menet közben, hallgatáskor végbemegy 250

270

290

310

330

350

370

390

410

csók ja id tól ~

több morf

tőszó

Page 30: Az alaktan az  információs pszicholingvisztikában

Jellegzetes hangrekonstrukciós anyag (Dankovics Natali )

A majmot nézik a gyerekek. – kattanó zaj

Page 31: Az alaktan az  információs pszicholingvisztikában

Mondatpéldák a rekonstrukcióban

• Többesszám helye • (1a) A macskák megették a kolbászt.• (1b) A kolbászt megették a macskák.

• Tárgyrag helye• (2a) A macskát kergeti a kutya.• (2b) A kutya kergeti a macskát.

• Ige vonzatkerete• (3 a) Kati hitt Imrének Velencében.• (3b) Kati hitt az ének erejében.

• Elhagyható esetragok:• (4a) Hiányzik a papucsomnak a bojtja.• (4b) Hiányzik a motorcsónak a partról.

Page 32: Az alaktan az  információs pszicholingvisztikában

Az alaktan hatásai

• A komplexebb alaktan-mondattan kölcsönhatás megfigyelhető

Elhagyható

Vonzat

Tárgy

Többes

0 50 100

Ala

ktan

i tén

yező

k

Hanghelyreállítás %

Alap Morfológia

Page 33: Az alaktan az  információs pszicholingvisztikában

Az információelmélet beemelése

Page 34: Az alaktan az  információs pszicholingvisztikában

Kostic, Baayen, Moscoso

• Kostic: infomennyiség szabja meg az időt, nem a formaszám

Page 35: Az alaktan az  információs pszicholingvisztikában

a morféma összes alakjához viszonyítva az adott alakPl. háznak Dat Gen

Kostic adatai és az Információ mércéje

Page 36: Az alaktan az  információs pszicholingvisztikában

Milin RI frekvencia és entrópia függő

Page 37: Az alaktan az  információs pszicholingvisztikában

Modell: információs maradvány magyaráz jobban

Page 38: Az alaktan az  információs pszicholingvisztikában

RI meghatározói a szerbben

Page 39: Az alaktan az  információs pszicholingvisztikában

Házi feladat

• Szuffixumok információs elemzése a magyarban. Entrópiamércék ragokkal s képzőkkel

• Különböző gyakoriságú tövek szaturációja. Hány alakjuk fordul elő, s milyen entrópiával.

• Entrópia és szegmentáció. Hogyan segít?

• Főnevek és igék entrópiája

• Szóhossz, nyelvtani komplexitás és mozgósított szókincs (tokenek) irodalom szövegben