adattípusok, ábrák és grafikonok az...

33
Adattípusok, ábrák és grafikonok az excelben

Upload: others

Post on 05-Nov-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Adattípusok,ábrák és grafikonok az excelben

Táblázatok és grafikonok

• Elsőként mindig érdemes táblázatokba rendezni és ábrázolni az adatokat!

• Miért?

• Ismerkedjünk az adatokkal!

• Milyen különbségek látszanak? Milyen irányba?

• A statisztika semmit nem mond, ha mindezt nem látjuk! Az soha nem elég információ, hogy szignifikánsak a különbségek!!!

• Bizonyos esetekben a teszt megválasztását is befolyásolhatja, amit a vizuális benyomások keltenek! (l. később az egy vagy kétoldalas tesztek)

Amit ne

• Ne felejtsük el a PONTOS tengelycímeket !!!darab?? %?? Más??! Mi a dimenzió???

• Se a jelmagyarázatot! (mi a két oszlop?)

• Kétdimenziós adatokat soseábrázoljunk 3D-ben!

• 2 db adatot általában nem ábrázolunk grafikonon

0

5

10

15

kutya cica tehénke

Me

gaka

dás

jele

nsé

g

Táblázatok és grafikonok

Kérdés: hogyan változik a magánhangzók azonosítása az éneklésben az f0 függvényében? (identification_test_halg.xlsx)

Hipotézis: csökken az ejtési szándék szerinti azonosítás aránya, mert egyre jobban megváltozik a magánhangzók ejtése.

• Észlelési kísérlet (identification_test.xlsx)

• Excel táblázat (milyen infók vannak benne? Honnan?)

• Alakítsuk át a nyers adatokat! nyers_egyadatkozlo fül

• Hogyan elemezzem?

• Confusion matrices (SPSS): inger – válasz párok

Táblázatok és grafikonok

Kérdés: hogyan változik a magánhangzók azonosítása az éneklésben az f0 függvényében? (identification_test_halg.xlsx)

Hipotézis: csökken az ejtési szándék szerinti azonosítás aránya, mert egyre jobban megváltozik a magánhangzók ejtése.

• Alakítsuk át a nyers adatokat! nyers_egyadatkozlo fül

darab(), darab2(), darabteli(), jobb(), bal(), sorokból oszlopok

Confusion matrices (SPSS): inger – válasz párok

Analyze > tables > Custom tables

Darabszám vagy az összes válasz százalékos aránya: count + row totalN %,

Adatok szétszedése csoportokra: split file f0-ra és test/filler-re!!!

Táblázatok és grafikonok

Táblázatok és grafikonok

Kérdés: Hogyan ítélnek meg bizonyos innovatív nyelvi formákat felnőtt magyar anyanyelvű beszélők? A nyelvi formák két változatának elfogadottsága érdekel! (innovativ_halg.xlsx)

Hipotézis: ? (exploratív elemzés)

Elfogadható a mondat?

1: egyáltalán nem 5: teljesen

• Likert skálás válaszok hogyan elemezzem?

Táblázatok és grafikonok

innovativ_halg.xlsx

• Sorsz.: adatközlő száma

• Valtozo: nyelvi változó, aminek a két variánsát

teszteltük

• Valtozo variansa: a két variáns

• valaszTipus: a két variáns a konzervatív és innovatív

kategóriák szerint átkódolva (ez érdekel minket, mert

ettől lesz minden nyelvi változó együtt kezelhető)

• Ertekeles: válasz 1-5-ig terjedő skálán

Táblázatok és grafikonok

Elfogadható a mondat?

1: egyáltalán nem 5: teljesen

Arra vagyok kíváncsi, hogy milyen az újabb

(innovatív) vagy a régebbi (konzervatív) változó

megítélése az összes változó esetben: Van eltérés

köztük? Ha van, melyiket preferálják a kettőből?

Boxplot (spss): clustered!

Variable: ertekeles, Cathegory Axis:

kerdesKategoria, Clusters by: innovKonzValasz

Mit tehetek, ha arra vagyok kíváncsi, hogy

• relatíve, az összes nyelvi változóban, egymáshoz képest van-e eltérés a két változat megítélése között?

• ezek a relatív eltérések mekkora horderejűek –azaz van-e kiugróan eltérő (jó vagy rossz) megítélésű relatíve, az átlagoshoz képest

És szeretném kivonni a képletből az egyéni válaszadási stratégiákat is.

Standardizálás SPSSben & boxplot

Mivel az emberek egyedi válaszadási stratégiákkal élnek, és az egy emberen belüli kiugrások érdekelnek standardizálás egyénenként.

• Split by subject

• Analyze > Descriptive Statistics > Descriptives > Variables: ertekeles > TICK boksz: save standardizedvalues as variables egy új oszlopban elmenti a standardizált értékeket.

• Ábra? Boxplot: split visszavonása, clustered byinnovKonz

Standardizálás: az adott érték hány szórásnyira van az átlagtól0: átlagos Előjel: (--) kisebb vagy (+) nagyobb mint az átlagÉrtelmezés: Az akiami „innovatív”, az anema „innovatív” és kisebb mértékben az iknemik „ikes” értékelése kirívó kirívóan elutasítják.

Táblázatok és grafikonok

Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott.xlsx)

Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb.

• Formánsfrekvenciák Hogyan elemezzem?

• Első körben grafikusan excel!!!

Táblázatok és grafikonok

Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott.xlsx)

Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb.

• Akusztikus magánhangzótér #1 az összes adat pontdiagramon – elkülönítés a Vk mentén.

Pontdiagram

700

1200

1700

2200

2700

3200

100 300 500 700 900 1100 1300 1500

F2 (

Hz)

F1 (Hz)

a:

i:

u:

a:

i:

u:

• Minden V egy adatsor• X-Y pontdiagram• Tengelycímek!!!

• Alakítsuk úgy a diagram orientációját, hogy

megfeleljen az IPA konvenciónak. Mit kell

ehhez tenni?

• Alakítsuk úgy a diagram orientációját, hogy

megfeleljen az IPA konvenciónak. Mit kell

ehhez tenni?

• x-tengely: F2

• y-tengely: F1

• Tengelyek megfordítása

• Akusztikus magánhangzótér #2

• ugyanezen adatokkal, összekötött pontdiagram mediánokkal vagy átlagokkal –elkülönítés az életkor mentén.

Összekötött pontdiagram átlagokkal

í

ú

á

1000

1500

2000

2500

3000

3500

200 400 600 800 1000 1200

F2 (

Hz)

F1 (Hz)

gyermek

felnott

Táblázatok és grafikonok

Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott_halg.xlsx)

Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb.

• Formánsfrekvenciák Hogyan elemezzem?

• Szorgalmi: centralizáció mértékének operacionalizálása az egyes V-k euklideszi távolságának kiszámítása a V-tér középpontjától

𝑒𝑢𝑘 𝑑𝑖𝑠𝑡 = (𝑥1 − 𝑥2)2 + (𝑦1 − 𝑦2)2

Ahol az egyik pont koordinátái (x1, y1), a másiké (x2,y2)

𝑦𝑐𝑒𝑛𝑡𝑟 =𝐹2𝑖 + 𝐹2ú

2

V-tér középpontja pl. a szélső V-k átlaga :

𝑥𝑐𝑒𝑛𝑡𝑟 =𝐹1ú + 𝐹1á

2

í

úá

1000

1500

2000

2500

3000

3500

200 700 1200

F2 (

Hz)

F1 (Hz)

gyermek

felnott

Otthoni feladat gyakorlásképpen

Ugyanolyan időtartamúak a nyelvileg hosszú magánhangzók (a nyelvállástól függetlenül)? (longvow.xlsx)

Hipotézis:

Nem, a magánhangzók időtartama a nyelvállásfokkal változik (felső < középső < alsó és legalsó).

• Adatok: veláris V-k időtartamai Hogyan elemezzem (grafikusan)?

• Egy lehetőség: Boxplot.

Adatok forrása: http://clara.nytud.hu/~mady/courses/statistics/2012tavasz/index.html

Otthoni feladat gyakorlásképpen

Ugyanolyan időtartamúak a nyelvileg hosszú

magánhangzók (a nyelvállástól függetlenül)?

(longvow.xlsx)

Hipotézis:

Nem, a magánhangzók időtartama a nyelvállásfokkal

változik

(felső < középső < alsó és legalsó).

• Egy további lehetőség: átlag + szórás ábrázolása (SPSS)

Adatok forrása: http://clara.nytud.hu/~mady/courses/statistics/2012tavasz/index.html

Táblázatok és grafikonok

Kérdés: Átlagosan az állat vagy a növénynevek a hosszabbak? (ratings.xlsx)

Hipotézis: ? (exploratív)

• boxplot (otthon!)

• Hisztogram ezt csináljuk meg!

• Error bar (otthon!)

• Mi az összefüggés a szó hossza és a gyakorisága között? Lásd a folytatásban: korrelációelemzés.

Adatok forrása: R, „languageR” csomag

Összefüggés a szóhossz és gyakoriság között?

• Intuitívan:

• Készítsünk egy pont-diagramot, ami a két tengelya két adat

Érzékelünk valamiféle trendet

Érzékelünk valamiféle trendet

Házi feladatÁbrázoljuk a felnőtt nő és a gyermek magánhangzóit az akusztikus magánhangzótérben (F1 × F2 tér) úgy, hogy annak állása az az IPA elrendezéssel (azaz az artikulációs V-térrel) egyezzen!

• Érdemes használni az adatsor hozzáadása opciót!

• Állítsuk az x tengelyt a (200, 1300) tartományra!

• Állítsuk az y tengelyt az (500, 3500) tartományra!

• Mindkét skálán állítsuk be fő léptéknek az 500 Hz-et, kisléptéknek a 250 Hz-et!

• Vegyük fel a segédrácsokat!

• Vegyük fel a megfelelő tengelyfeliratokat (zárójelben a mértékegységgel)!

• Formázzuk meg úgy az adatsorokat, hogy elkülönüljenek a gyermek és a felnőtt nő adatai, de a megfelelő magánhangzók összetarozzanak (pl. más szín, de azonos forma)!

• Mentsük el a grafikont pdf-ben!

• Készítsük el a grafikont logaritmizált skálával is! Hasonlítsuk össze a két grafikont.