statisztika - bzmatek.eu · statisztika a statisztika adatok gyűjtésével, rendszerezésével,...
TRANSCRIPT
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
1
Statisztika
A statisztika adatok gyűjtésével, rendszerezésével, illetve adatsorok elemzésével,
szemléltetésével foglalkozik.
Adatok rendszerezése
DEFINÍCIÓ: (Populáció)
Populációnak (statisztikai sokaságnak) nevezzük az objektumok, események azon összességét,
amelyre a statisztikai vizsgálat vonatkozik.
DEFINÍCIÓ: (Statisztikai minta)
Statisztikai mintának nevezzük a populáció azon (valódi) részhalmazát, amelyről adatokkal
rendelkezünk.
Megjegyzés:
Az összegyűjtött adatokat adatsokaságnak, mintának is nevezzük.
DEFINÍCIÓ: (Osztályokba sorolás)
Az adatfeldolgozás során nagy mennyiségű adat esetén általában nem sorolunk fel minden
értéket egyenként, hanem azokat, amelyek egy meghatározott intervallumba esnek, egy
osztályba gyűjtjük.
Megjegyzés:
Az osztályba sorolással a felbontás durvább lesz, de az adathalmaz áttekinthetőbbé válik.
Az osztályköz hosszán az osztály felső és alsó határának különbségét értjük.
Az osztályok jellemzője az osztályközép: az osztály felső és alsó határának számtani közepe.
Egy adott osztályba tartozó valamennyi adatot osztályközép értékűnek tekintünk.
DEFINÍCIÓ: (Gyakoriság)
Egy statisztikai adat gyakorisága az a szám, amely megmutatja, hogy ezen adat értéke az
adatsorban hányszor fordul elő.
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
2
DEFINÍCIÓ: (Relatív gyakoriság)
Egy statisztikai adat relatív gyakorisága az a szám, amely megmutatja, hogy ezen adat értéke
az adatsor hányad részében fordulhat elő, vagyis az adat gyakoriságának és az összes adat
számának hányadosa.
Megjegyzés:
A relatív gyakoriság százalékban való megadását százalékos gyakoriságnak nevezzük.
DEFINÍCIÓ: (Kumulált gyakoriság)
Egy adat kumulált gyakoriságát kapjuk, ha meghatározzuk, hogy a mintában mennyi olyan adat
van, amelynek értéke legfeljebb akkora, mint az adott adat.
DEFINÍCIÓ: (Gyakorisági táblázat)
A statisztikai feladatoknál célszerű olyan táblázatot készíteni, melyben feltüntetjük a
rendszerezett adatok gyakoriságát. Ezt a táblázatot nevezzük gyakorisági táblázatnak.
Adatok szemléltetése
Az adatokat sokféleképpen prezentálhatjuk, ezek közül a leggyakrabban használt diagram
típusok a következők:
oszlopdiagram: Ezt akkor célszerű használni, ha az adatok egymáshoz való viszonya az
érdekes számunkra, illetve ha a gyakoriságokat szeretnénk összehasonlítani. Nem érdemes
használni, ha az adatok között van kiugró érték, vagy ha az értékek közötti eltérés kicsi. Az
oszlopok hézag nélküli ábrázolását hisztogramnak nevezzük.
vonaldiagram, poligon (összefüggő törött vonal): Ezt akkor használjuk, ha egy mennyiség
időbeli változását szeretnénk szemléltetni derékszögű koordináta - rendszerben.
kördiagram: Ezt akkor érdemes használni, ha az adatok az egésznek arányában érdekesek
számunkra, illetve ha a sokaság szerkezetét szeretnénk szemléltetni. A kört az ábrázolandó
adatok relatív gyakoriságaival arányos középponti szögű körcikkek alotják.
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
3
Középértékek
Ezek az értékek az adatsokaságot valamilyen szempontból tömören jellemzik.
DEFINÍCIÓ: (Módusz)
Az adatsorban a leggyakrabban előforduló adatot a minta móduszának nevezzük.
Megjegyzés:
Egy mintában több módusz is lehetséges.
A módusz nem függ sem az összes adattól, sem a szélsőséges értékektől.
DEFINÍCIÓ: (Medián)
A nagyság szerint rendezett adatsor középső értékét mediánnak nevezzük. Jele: 𝐾.
Megjegyzés:
Páros számú adat esetén ez a két középső érték számtani közepe.
A mediántól kisebb értékekből ugyanannyi van, mint a mediántól nagyobbakból.
A medián nem függ sem az összes adattól, sem a szélsőséges értékektől.
DEFINÍCIÓ: (Számtani - , aritmetikai közép; átlag)
A számtani közép az adatok olyan középértéke, amellyel az adatok mindegyikét helyettesítve
az adatsor összege változatlan marad. Jele: 𝐴.
Megjegyzés:
A számtani közép értéke megegyezik az átlagolandó adatok összegének és számának
hányadosával, vagyis 𝐴 =𝑥1 + 𝑥2 + … + 𝑥𝑛
𝑛, ahol 𝑥1, 𝑥2, … , 𝑥𝑛 az átlagolandó adatokat jelöli.
A számtani közép érzékeny a szélsőségesen nagy értékekre, főleg kisebb adathalmaz esetén.
TÉTEL:
Ha egy minta átlaga 𝐴, s a minta összes adatához hozzáadunk egy 𝑘 számot, akkor az így előálló
adathalmaz számtani közepe: 𝐴 + 𝑘.
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
4
TÉTEL:
Ha egy minta átlaga 𝐴, s a minta összes adatát egy 𝑘 számmal megszorozzuk, akkor az így
előálló adathalmaz számtani közepe: 𝑘 ∙ 𝐴.
DEFINÍCIÓ: (Súlyozott közép)
A 𝑘1 darab 𝐴1 átlagú, a 𝑘2 darab 𝐴2 átlagú, …, a 𝑘𝑛 darab 𝐴𝑛 átlagú elem egyesítésével kapott
𝑛 = 𝑘1 + 𝑘2 + ⋯ + 𝑘𝑛 elemű halmazra számított súlyozott számtani közép:
𝐴 =𝑘1 ∙ 𝐴1 + 𝑘2 ∙ 𝐴2 + … + 𝑘𝑛 ∙ 𝐴𝑛
𝑘1 + 𝑘2 + … + 𝑘𝑛.
Megjegyzés:
A súlyozott átlag általában valamilyen súlyokkal ellátott értékek számtani közepére utal, ahol
a nagyobb súlyú elem jobban számít az átlag meghatározásakor, mint a kisebb súlyú elemek.
TÉTEL:
Ha két, egymással megegyező elemszámú adatsor elemeit páronként összegezzük, akkor az
összegek alkotta adatsor átlaga megegyezik a két adatsor számtani közepének összegével.
DEFINÍCIÓ: (Harmonikus közép)
A harmonikus közép az az átlag, amellyel az átlagolandó adatok mindegyikét helyettesítve az
adatsor reciprokainak összege változatlan marad. Jele: 𝐻.
Megjegyzés:
A harmonikus közepet csak nullától különböző értékekre értelmezzük.
A harmonikus közép az átlagolandó számok reciprok értékéből számított számtani középnek
a reciprok értéke, vagyis 𝐻 =𝑛
1
𝑥1 +
1
𝑥2 + … +
1
𝑥𝑛
, ahol 𝑥1, 𝑥2, … , 𝑥𝑛 az átlagolandó adatok.
DEFINÍCIÓ: (Mértani - , geometriai közép)
A mértani közép az az átlag, amellyel az átlagolandó adatok mindegyikét helyettesítve az
adatsor szorzata változatlan marad. Jele: 𝐺.
Megjegyzés:
A mértani közepet csak nem negatív számokra értelmezzük.
A mértani közép az 𝑛 darab adat szorzatának 𝑛 - edik gyöke, vagyis 𝐺 = √𝑥1 ∙ 𝑥2 ∙ … ∙ 𝑥𝑛𝑛
,
ahol 𝑥1, 𝑥2, … , 𝑥𝑛 az átlagolandó adatokat jelöli.
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
5
DEFINÍCIÓ: (Négyzetes -, kvadratikus közép)
A négyzetes közép az az átlag, amellyel az átlagolandó adatok mindegyikét helyettesítve az
adatsor négyzeteinek összege változatlan marad. Jele: 𝑁.
Megjegyzés:
A négyzetes közép az átlagolandó értékek négyzeteiből számított számtani középnek a
négyzetgyöke, vagyis 𝑁 = √𝑥1
2 + 𝑥22 + … + 𝑥𝑛
2
𝑛, ahol 𝑥1, 𝑥2, … , 𝑥𝑛 az átlagolandó adatokat jelöli.
TÉTEL:
𝑛 darab pozitív szám esetén igaz a következő összefüggés: 𝐻 ≤ 𝐺 ≤ 𝐴 ≤ 𝑁. Egyenlőség akkor
és csak akkor áll fenn, ha minden szám egyenlő.
Adatok szóródásának vizsgálata, szóródási mutatók:
A szóródási mutatók az adatok változékonyságát, szóródását jellemzik. Ezek segítségével
megmutathatjuk, hogy az egyes értékek valamilyen középértékhez viszonyítva hogyan
helyezkednek el.
DEFINÍCIÓ: (Terjedelem)
Annak az intervallumnak a hosszát, amelyben az adatok elhelyezkednek, a minta terjedelmének
nevezzük. Jele: 𝑅.
Megjegyzés:
A minta terjedelme az adatok között előforduló legnagyobb és legkisebb érték különbsége:
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛.
A terjedelem a legszélsőségesebb adatoktól függ, így nem feltétlenül jellemzi jól az adatsort.
DEFINÍCIÓ: (Középeltérés)
Középeltérésnek a mediántól való eltérések abszolútértékének a számtani közepét értjük.
Jele: 𝑆(𝐾).
𝑆(𝐾) =|𝑥1 − 𝐾| + |𝑥2 − 𝐾| + … + |𝑥𝑛 − 𝐾|
𝑛
Megjegyzés:
A középeltérés értéke megmutatja, hogy átlagosan mennyire térnek el az adatok a mediántól.
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
6
DEFINÍCIÓ: (Átlagos abszolúteltérés)
Átlagos abszolúteltérésnek a számtani középtől való eltérések abszolútértékének a számtani
közepét nevezzük. Jele: 𝑆(𝐴).
𝑆(𝐴) =|𝑥1 − 𝐴| + |𝑥2 − 𝐴| + … + |𝑥𝑛 − 𝐴|
𝑛
Megjegyzés:
Az átlagos abszolúteltérés értéke megmutatja, hogy átlagosan mennyire térnek el az adatok a
számtani középtől.
DEFINÍCIÓ: (Szórás, deviancia)
Szórásnak nevezzük a számtani középtől számított eltérések négyzetének számtani közepéből
vont négyzetgyök értékét. Jele: 𝜎.
𝜎 = √(𝑥1 − 𝐴)2 + (𝑥2 − 𝐴)2 + … + (𝑥𝑛 − 𝐴)2
𝑛
Megjegyzés:
A szórás szintén azt mutatja meg, hogy átlagosan mennyire térnek el az adatok a számtani
középtől, de sokkal érzékenyebb a kiugró értékekre.
DEFINÍCIÓ: (Szórás négyzet, variancia)
Varianciának nevezzük az átlagtól való eltérések négyzetének átlagát, vagyis a szórás
négyzetét. Jele: 𝑉.
𝑉 =(𝑥1 − 𝐴)2 + (𝑥2 − 𝐴)2 + … + (𝑥𝑛 − 𝐴)2
𝑛
Megjegyzés:
A variancia az átlagtól való négyzetes eltérés.
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
7
Gyakorló feladatok
K: középszintű feladat E: emelt szintű feladat
1. (K) A 𝟑𝟎 fős osztály dolgozatot írt matematikából és a következő jegyek születtek:
𝟔 darab jeles, 𝟗 darab jó, 𝟖 darab közepes, 𝟓 darab elégséges és 𝟐 darab elégtelen.
Készíts gyakorisági táblázatot, majd számítsd ki az egyes adatok relatív gyakoriságát!
Számítsd ki továbbá a következőket is: módusz, medián, terjedelem, számtani közép,
szórás. Szemléltesd a dolgozat eredményeit oszlop - , illetve kördiagram segítségével!
2. (E) Számítsd ki az előző feladatban szereplő adatok középeltérését, illetve átlagos
abszolúteltérését!
3. (K) Egy csoportban megmérték a magasságokat (𝒄𝒎) és a következő értékek születtek:
𝟏𝟔𝟓, 𝟏𝟕𝟓, 𝟏𝟕𝟓, 𝟏𝟕𝟎, 𝟏𝟖𝟎, 𝟏𝟔𝟓, 𝟏𝟖𝟓, 𝟏𝟕𝟓, 𝟏𝟕𝟎, 𝟏𝟔𝟓, 𝟏𝟕𝟎, 𝟏𝟕𝟎, 𝟏𝟕𝟓, 𝟏𝟖𝟎, 𝟏𝟕𝟎. Számítsd
ki a leggyakoribb érték relatív gyakoriságát! Számítsd ki továbbá a következőket is:
módusz, medián, terjedelem, számtani közép, szórás. Szemléltesd a mérések
eredményeit oszlop - , illetve kördiagram segítségével!
4. (E) Számítsd ki az előző feladatban szereplő adatok középeltérését, illetve átlagos
abszolúteltérését!
5. (K) Egy tálban van 𝟐 narancs, 𝟒 citrom, 𝟓 alma, 𝟑 szőlő és 𝟏 banán. Szemléltesd
kördiagramon a gyümölcsök megoszlását!
6. (E) Egy dolgozat eredményei a következők lettek: 𝟏 elégtelen, 𝟑 elégséges, 𝟒 közepes,
𝟓 jó, 𝟐 jeles. Számítsd ki a jegyek harmonikus -, mértani (geometrikus) –,
számtani (aritmetikai) - és négyzetes közepét!
7. (K) Hogyan változik az átlag és a szórás, ha az 𝟏, 𝟑, 𝟕, 𝟐, 𝟓 minta minden eleméhez
hozzáadunk 𝟓 - öt?
8. (K) Mit jelent, ha egy adathalmaz terjedelme 𝟎? Mit jelent, ha a szórása 𝟎?
Következik - e egyik a másikból?
9. (K) Adj meg egy olyan 𝟖 elemű adathalmazt, amelynek mediánja 𝟒, módusza 𝟐 és az
átlaga 𝟓!
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
8
10. (K) Egy kézilabdacsapat játékosainak átlagéletkora 𝟐𝟐 év. Szabálytalanság miatt az
egyik játékost kiállították, aminek hatására a csapat átlagéletkora 𝟐𝟏 évre csökkent.
Mennyi éves a kiállított játékos, ha a csapat 𝟕 emberből áll?
11. (K) Melyik számot kell elhagyni az 𝟏, 𝟐, 𝟑, 𝟒, 𝟓, 𝟔, 𝟕, 𝟖, 𝟗, 𝟏𝟎 számok közül úgy, hogy a
megmaradt számok átlaga 𝟓 legyen?
12. (K) Tamás januárban 𝟑 napon 𝟏𝟕 órát, 𝟖 napon 𝟏𝟐 órát és 𝟕 napon 𝟗 órát dolgozott.
A többi napokon pedig nem dolgozott. Határozd meg, hogy Tamás januárban
mennyit dolgozott átlagosan naponta!
13. (E) Évának év vége előtt matematikából a következő jegyei voltak: Felelet (𝟒; 𝟓; 𝟑; 𝟓),
Röpdolgozat (𝟒; 𝟐; 𝟑) és Témazáró (𝟑; 𝟒; 𝟑; 𝟒; 𝟐). A tanár úgy osztályoz, hogy a
röpdolgozat jegyeit 𝟏, 𝟓 - szeres, a témazáró jegyeit pedig 𝟐 - szeres súllyal véve
figyelembe átlagot számol, majd kerekít a szokásos módon. Milyen jegyet kap év
végén Éva matematikából?
14. (K) Egy léceket gyártó cég termékei közül 𝟏𝟎 % 𝟏𝟏𝟎 𝒄𝒎, 𝟏𝟓 % 𝟏𝟑𝟎 𝒄𝒎,
𝟐𝟎 % 𝟏𝟔𝟎 𝒄𝒎, 𝟑𝟓 % 𝟏𝟖𝟎 𝒄𝒎, 𝟐𝟎 % 𝟐𝟎𝟎 𝒄𝒎 hosszúságú. Határozd meg a lécek
hosszának szórását!
15. (K) Egy tantestület átlagéletkora 𝟒𝟎 év. A tanárnők átlagéletkora 𝟑𝟓 év, a tanár
uraké pedig 𝟓𝟎 év. Mennyi a tanárnők és tanár urak számaránya a tantestületben?
16. (K) Egy 𝟏𝟕𝟔 diákból álló évfolyam matematika átlaga 𝟑, 𝟓. Tudjuk, hogy 𝟓𝟎 - en
kaptak jelest, 𝟒𝟎 - en négyest és 𝟏𝟔 - an buktak meg. Hányan kaptak hármast, illetve
kettest?
17. (E) Egy tehetséges osztályban távolugrást mértek fel, amelynek négy legjobb
eredményét írta fel a tanár. Ezek átlagát és szórását is meghatározta: 𝟒, 𝟎 𝒎, illetve
𝟎, 𝟏𝟐𝟐 𝒎. Jegyzetében két adat a kiolvashatatlanságig elmosódott. A megmaradt két
eredmény 𝟒, 𝟏 𝒎 és 𝟑, 𝟖 𝒎. Mi volt a másik két mérési eredmény?
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
9
18. (K) Egy 𝟑𝟎 fős osztályban fizikából 𝟑 jeles, 𝟏𝟎 közepes és 𝟓 elégséges dolgozat
született. Az osztály átlaga 𝟐, 𝟗 és 𝟐, 𝟗𝟓 közé esik. Hányan írtak négyes dolgozatot?
19. (K) Egy televíziós műsor hatásának felmérésére különböző embereket kérdeztek meg.
Az eredményeket az alábbi táblázat mutatja:
nagyon tetszett tetszett nem tetszett nagyon nem tetszett
férfi 1 3 5 10
nő 6 8 3 1
fiú 5 5 3 2
lány 8 5 1 1
a) Hány személyt kérdeztek meg összesen?
b) Hány nőnemű személynek nem, vagy nagyon nem tetszett?
20. (K) A következő táblázat általános iskolákra vonatkozó adatokat tartalmaz:
Tanév 1999/2000 2001/2002
Iskolák száma 3 897 3 852
Összes tanuló (1000 fő) 972,9 947
Nappali tanulók száma (1000 fő) 969,8 944,2
Nappali első évfolyamon (1000 fő) 127,3 117,6
Osztályok száma 47 626 47 682
Pedagógusok száma 89 424 90 294
Osztálytermek száma 52 526 43 195
a) Az összes nappali tagozatos tanulóknak hány százaléka járt az első évfolyamra?
b) Hány tanulóra jut egy osztályterem?
c) Hány tanuló jut egy pedagógusra?
d) Mennyi az átlagos osztálylétszám?
e) Hány százalékkal csökkent a tanulói összlétszám?
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
10
21. (K) Egy helyhatósági választáson az első fordulóban 𝟓 jelölt indult. Az egyes jelöltekre
leadott szavazatokat az alábbi kördiagram segítségével ábrázoltuk, ahol feltüntettük
a körcikkekhez tartozó középponti szögeket. Tudjuk, hogy összesen 𝟔 𝟔𝟎𝟎 érvényes
szavazat érkezett.
a) Hány érvényes szavazatot kaptak az egyes jelöltek?
b) Hogyan alakult az érvényes szavazatok százalékos eloszlása
c) Átlagosan hány érvényes szavazatot kapott egy jelölt?
22. (K) Az alábbi vonaldiagram a Tisza vízállásának alakulását mutatja Szolnoknál
centiméterben mérve egy adott hét napján. Mennyi az átlagos napi vízállás, a minta
terjedelme, illetve a medián?
45°120°
90°
60°
45°
8682
73
6568 70 72
0
10
20
30
40
50
60
70
80
90
100
hétfő kedd szerda csütörtök péntek szombat vasárnap
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
11
23. (E) Egy jól sikerült röpdolgozat jegyeinek összege 𝟏𝟒𝟕 lett, az átlag 𝟒, 𝟐 és senki nem
írt elégtelen dolgozatot.
a) Hányan írtak dolgozatot?
b) Legalább hány ötös dolgozat születhetett?
c) Legfeljebb hány ötös dolgozat születhetett?
24. (K) Egy matek dolgozat átlaga 𝟑, 𝟓 lett. Az egyik diák utólag négyesre írta meg a
pótdolgozatát és így az átlag 𝟑, 𝟓𝟐 - re nőtt. Hányan írták meg eredetileg a dolgozatot?
25. (K) Egy 𝟐𝟓 fős osztályban egy dolgozat során az osztályátlag 𝟐, 𝟗𝟔 lett. Tudjuk, hogy
senki sem írt egyest, négyszer annyi hármas dolgozat lett, mint ötös, valamint kétszer
annyi kettes, mint négyes. Melyik osztályzatból mennyi született?
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)
12
Felhasznált irodalom
(1) Hajdu Sándor; 2005.; Matematika 12.; Műszaki Könyvkiadó; Budapest
(2) Urbán János; 2007.; Sokszínű matematika 12; Mozaik Kiadó; Szeged
(3) Ábrahám Gábor; 2010.; Matematika 11 − 12 emelt szint; Maxim Könyvkiadó; Szeged
(4) Urbán János; 2012.; Sokszínű matematika feladatgyűjtemény 12; Mozaik Kiadó; Szeged
(5) Vancsó Ödön; 2005.; Egységes Érettségi Feladatgyűjtemény Matematika II.;
Konsept H Könyvkiadó; Piliscsaba
(6) Ruff János; 2012.; Érettségi feladatgyűjtemény matematikából 11 − 12. évfolyam;
Maxim Kiadó; Szeged
(7) Fröhlich Lajos; 2006.; Alapösszefüggések matematikából – emelt szint; Maxim Kiadó; Szeged
(8) https://users.itk.ppke.hu/itk_dekani/files/matematika/list.html
(9) Saját anyagok