Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ......

18
1 Материјал за предавања 17.03.2020. и за вежбе 19.03.2020. из предмета Пословна статистика, Статистика у туризму (СП Менаджмент и Менаджмент туризма) и Статистика (СП Јавна управа). Предметни наставник проф. др Славица Дабетић

Upload: others

Post on 01-Aug-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

1

Материјал за предавања 17.03.2020. и за вежбе 19.03.2020.

из предмета Пословна статистика, Статистика у туризму (СП Менаджмент и Менаджмент туризма) и

Статистика (СП Јавна управа).

Предметни наставник проф. др Славица Дабетић

Page 2: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

2

Raspored verovatnoće neprekidne

slučajne promenljive

Kod prekidne slučajne promenljive, do rasporeda verovatnoće se dolazi

tako što se formira lista pojedinih vrednosti i odgovarajućih verovatnoća.

Međutim, kod neprekidne slučajne promenljive nemoguće je sastaviti takvu

listu, jer je broj njenih vrednosti beskonačan, odnosno ima smisla odrediti

samo verovatnoću da se X nalazi u nekom intervalu.

Grafički prikaz prekidna slučajna promenljiva sastiji se samo od

ordinata, dok se kod neprekidne promenljive sastoji od neprekidne glatke

krive. Takva kriva naziva se kriva gustine verovatnoća. Matematička

funkcija gustine verovatnoća označava se sa f (x).

Osobine funkcije gustine verovatnoća su:

F-ja je uvek pozitivna tj. f (x) ≥ 0

Površina ispod krive je jednaka 1, tj. ∫ 𝑓 (𝑥)𝑑𝑥 ∞

−∞ =1.

Verovatnoća da X uzme vrednost u interval (a,b) jednaka je površini

između krive f(x) i x ose duž intervala (a,b), važi da je:

P(a < X < b) =∫ 𝑓 (𝑥)𝑑𝑥 = 𝐹(𝑏) − 𝐹(𝑎) .𝑏

𝑎

P(X = a) = P(X = b) =0.

U okviru modela neprekidnih rasporeda verovatnoće, u statističkoj praksi se

najčešće koriste normalan, Student-ov, χ2 - raspored i Snedecor-ov

(Fisher-ov) raspored.

1. Normalna – Gaus-ova raspodela verovatnoće

Page 3: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

3

Normalan raspored ima centralnu ulogu u statističkoj teoriji i praksi, posebno

u domenu statističkog zaključivanja.

Normalan raspored je prvi otkrio francuski matematičar Abraham de Moivre

1733, kao granični slučaj binomnog rasporeda. Ovaj raspored je bio poznat i

P. Laplace-u u drugoj polovini osamnaestog veka, ali ni njegovo otkriće nije

privuklo nikakvu pažnju. Tek kada ga je C. Gauss 1809. godine opisao,

normalan raspored je potpuno prihvaćen od strane matematičara i statističara.

Gauss je izveo ovaj raspored kao matematičku funkciju namenjenu opisu

rasporeda grešaka u merenjima astronomskih opservacija, pa se ovaj

raspored dugo i zvao Gausov raspored grešaka.

Za slučajnu promenljivu X kažemo da ima normalan raspored ako je

karakterišu neprekidne vrednosti, a njena funkcija gustine ima izraz:

f(x)= 1

𝜎√2𝜋𝑒

−(𝑥−µ)2

2𝜎2 , u oznaci X: N (µ,σ2 ), −∞ < x < +∞,

gde su:

π - matematička konstanta približno jednaka 3,14159,

e - matematička konstanta približno jednaka 2,71828,

μ - aritmetička sredina normalne slučajne

promenljive,

σ - standardna devijacija normalne slučajne promenljive.

Karakteristike normalnog rasporeda lako se mogu uočiti iz grafičkog

prikaza, koji se naziva normalna kriva.

Slika 1. Normalna kriva

Page 4: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

4

Osobine normalnog rasporeda:

1. Kriva ima oblik zvona, unimodalna je, simetrična u odnosu na µ.

2. Budući da je raspored simetričan, njegova aritmetička sredina, modus i

medijana su međusobno jednaki.

3. Normalna kriva se proteže od −∞ do +∞ , tj. asimptotski se približava x

osi, pa je njen interval varijacije beskonačan.

4. Relativna mera asimetrije je 0, a relativna mera spljoštenosti ima vrednost

3.

5. Ukupna površina ispod krive jednaka je 1. Verovatnoća da promenljiva

uzme vrednost manju (ili veću) od aritmetičke sredine iznosi 0,5.

6. Normalna kriva je u potpunosti definisana sa dva parametra µ i σ, tj.

raspored se označava sa N(µ, σ2).

7. Površina označena linijama na udaljenosti od jedne standardne devijacije

od aritmetičke sredine, x-osom i krivom f(x) iznosiće 68% od čitave površine

P(µ−σ≤ X ≤ µ+σ) = 0,68.

8. Slično može se zaključiti da je

P(µ−2σ≤ X ≤ µ+ 2σ) = 0,95, P(µ−3σ≤ X ≤ µ+ 3σ) = 0,997

Slika 2. Odnos između površine formirane na rastojanju ±σ, ±2σ, ±3σ od 𝜇 i površine

ispod krive

Za raspodele u obliku zvona to znači:

i površine ispod krive

Page 5: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

5

68% vrednosti je u opsegu od jedne standardne devijacije od aritmetičke

sredine, 95% vrednosti je u opsegu od dve standardne devijacije od

aritmetičke sredine, 99,7% vrednosti je u opsegu od tri standardne devijacije

od aritmetičke sredine.

2. Značaj normalnog rasporeda

Normalan raspored predstavlja najznačajniji teorijski raspored

verovatnoće jer je:

1. Veliki broj pojava u prirodi i društvu ima normalan raspored.

Tipični primeri su: visina, težina, krvni pritisak, rezultati na testovima

inteligencije, greške pri merenju itd. Generalno, ako veliki broj faktora utiče

na neku pojavu na aditivan način, i uticaj svakog od njih je veoma mali, može

se očekivati da ta pojava sledi normalan raspored. U devetnaestom veku se

čak, tvrdilo da sve pojave slede normalan raspored, ali je ovo kasnije

odbačeno.

2. Normalan raspored može poslužiti kao odlična aproksimacija raznih

prekidnih rasporeda, za one vrednosti koje nisu date u tablicama verovatnoće.

Veliki broj prekidnih rasporeda, pod posebnim uslovima, teži normalnom

rasporedu.

3. Iz normalnog rasporeda je izveden veliki broj drugih neprekidnih

rasporeda, koji takođe imaju značajno mesto u statističkoj analizi. Kao što su

Studentov ili t-raspored, χ2 - raspored i F (Fišerov ) raspored.

4. Normalan raspored predstavlja osnovu za parametarsko statističko

zaključivanje zbog:

a) njegove veze sa Centralnom graničnom teoremom,

b) parametarski metodi imaju zajedničku predpostavku da osnovni

skup iz koga se uzima uzorak ima normalan raspored.

c) čak i neparametarske statističke metode koriste normalan raspored

kao sredstvo za donošenje odluke u slučaju velikih uzoraka.

Veliki broj statističkih problema se rešava uz predpostavku da populacija

kojoj pripada uzorak ima normalan raspored.

3. Standardizovan normalni raspored

U zavisnosti od parametara µ, σ postoji čitava familija normalnih rasporeda.

Kako izračunavanje verovatnoće u konkretnom slučaju zavisi od

izračunavanja određenih integrala, to znatno komplikuje analizu.

Page 6: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

6

Prevazilaženje ovog problema moguće je korišćenjem jednog posebnog

normalnog rasporeda koji služi kao međusredstvo za rešavanje

praktičnih problema i izbegavanje integracije.

Takav normalan raspored se naziva standardizovan normalan raspored. U

praksi se koriste tablice verovatnoće ovog modela, a postupkom

standardizacije se bilo koji normalan raspored svodi na standardizovan.

Z = 𝑋−𝜇

𝜎

Uobičajeno je da se standardizovana normalna promenljiva označava sa Z.

Njena aritmetička sredina je jednaka 0, a varijansa je 1.

Slika 4.. Standardizovan normalni raspored

Verovatnoća da je Z u interval (z1, z2) se izračunava kao

P(z1 ≤ Z ≤ z2) = F(z2)−F(z1) ,

Iz osobina krive simetrične u odnosu na koordinatni početak važi da je

F (−z) = 1− F (z),

Na osnovu toga sledi da je

P(−z ≤ Z ≤ z) = F (z)− F (−z) = F (z)−(1− F (z)) = F (z)−1+ F (z) = 2F (z)−1

Specijalno, za z=1 dobija se

Page 7: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

7

P(−1≤ Z ≤1) = F(1) − F(−1) = 2F(1) −1= 2∙0,8413−1= 0,6825.

Poznavajući verovatnoću da Z uzme vrednosti u nekom intervalu,

možemo odrediti granice tog intervala. Ako je, na primer, poznato da

verovatnoća iznosi 0,95, tj 95%, granice intervala izračunavamo iz

0,95=2F(z) - 1, pa je F(z) = 0,975.

Iz tablica se može naći odgovarajuća vrednost za z koja iznosi z = 1,96;

sledi traženi interval je (-1,96; 1,96).

Važi sledeće

P(x1 ≤ X ≤ x2) = P(z1 ≤ Z ≤ z2) , gde su: z1 = x1 −µ i z2 = x2 −µ.

Lako se vidi da je promenljiva X u granicama (µ-1,96σ; µ+1,96σ), sa

verovatnoćom od 95%.

Slika 5. Povezanost između normalnog rasporeda N (μ; σ

2) i standardizovanog z

rasporeda sa aritmetičkom sredinom 0 i standardnom devijacijom 1

Page 8: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

8

Postupak „antistandardizacije“ moguće je primeniti i na

izračunavanje veličine x iz na primer sledeće jednakosti:

P(X ≤ x) = P(Z ≤ z) = F (z) = 0,95.

Za nađenu vrednost z = 1,64 može se lako istim postupkom može

dobiti i granica x = µ + 1,64σ. Verovatnoća da slučajna veličina ima

vrednost do nađene veličine x iznosi 95% predstavlja i odgovor na

postavljeno pitanje.

4. Studentova raspodela (t - raspodela)

Postoji neprekidna slučajna promenljiva koja uzima vrednosti iz

intervala (-∞, +∞) kao i normalna raspodela, ali čija funkcija gustine sadrži

parametar koji se naziva „broj stepena slobode” (df ili ν). Ova raspodela je

prvi put uvedena u jednom članku o uzorku čiji se autor (W. S. Gosselett)

potpisao s pseudonimom „Student”, tako da je u literaturi ova raspodela

poznata kao Studentova ili t- raspodela.

Neka su slučajne promenljive Z~ N(0, 1) i χn2 nezavisne. Raspodela slučajne

promenljive 𝑡 =𝑧

√χ𝑛2

𝑛

naziva se Studentova t-raspodela sa n stepeni slobode.

Ako je populacija normalno raspoređena, tada standardizovana statistika t

= �̅�−𝜇

𝑆

√𝑛

ima t-raspored sa n-1 stepenom slobode.

Za bilo koju celu vrednost df = 1, 2, 3,..., n postoji odgovarajuća

Studentova t-raspodela sa sledećim karakteristikama:

- aritmetička sredina ove t - distribucije je 0.

- za df > 2, varijansa t-distribucije je 𝑑𝑓

𝑑𝑓 −2 .

Budući da je t-raspored simetričan i zvonastog oblika sa širim

krajevima u odnosu na Z raspodelu važi sledeća jednakost :

Page 9: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

9

P(tν <tν,α)=1−α , df = ν -broj stepeni slobode.

ZADACI ZA VEŽBU

Primer 1.

Jedna fabrika proizvodi sijalice čiji vek trajanja ima približno

normalnu raspodelu sa aritmetičkom sredinom μ = 100h i standardnom

devijacijom σ = 20h. Koliko iznosi verovatnoća da će slučajno izabrana

sijalica imati vek trajanja:

a) između 60 i 90 časova,

b) više od 90 časova,

c) manji od 95 časova.

Rešenje:

a) P(60 < X < 90) = P(60−𝜇

𝜎<

𝑋−𝜇

𝜎<

90−𝜇

𝜎) =

P(60−100

20< 𝑍 <

90−100

20) = P(−2 < Z < −0,5) = F(−0,5)−F(−2)

= 1 − F (0,5) − (1−F(2)) = 1 − 0,6915 − (1 − 0,9772)

= 0,3085 − 0,0228 = 0,2857

Verovatnoća da će sijalica imati vek trajanja između 60 i 90 časova je 0,2857.

b) P(X > 90) =1− P(X < 90) =1− P( 𝑋−𝜇

𝜎 <

90−𝜇

𝜎 )

1− P(Z < 90−100

20 )=1− P(Z <−0,5)=1− F (−0,5)=

= 1− (1− F (0,5)) = F (0,5) = 0,6915.

Verovatnoća da će sijalica imati vek trajanja više od 90 časova je

0,6915.

Page 10: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

10

c) P(X < 95) = P(Z <95−100

20 ) = P(Z <−0,25) = F(−0,25) =1−F(0,25)

= 0,4013

Verovatnoća da će sijalica imati vek trajanja manje od 95 časova je 40,13%.

Primer 2.

Broj klijenata u jednoj banci u toku dana ima približno normalan

raspored sa srednjom vrednošću 360 i standardnom devijacijom 30. Koliko

klijenata se može očekivati ponedeljkom ako je učešće klijenata tog dana

95%?

Rešenje:

a) P(X < x) = P( 𝑋−𝜇

𝜎 <

𝑥−𝜇

𝜎 ) =P (𝑍 <

𝑥−360

30 )=0,95

Sledi F ( 𝑥−360

30 ) = 0,95. Iz tablice F (z) = 0,95⇒ z =1,64

Rešenje jednačine z = 𝑥−360

30 ⇒ 1,64 =

𝑥−360

30 ⇒ x = 360+1,64∙30 =

409,2

Znači 95% je verovatnoća da će u ponedeljak banka imati 409 klijenata.

Primer 3.

Broj putnika prevezenih u toku dana u julu mesecu 2012. godine prevoznika “Lasta” na relaciji Beograd – Novi Sad ima približno normalan raspored sa srednjom vrednošću od 180 putnika i standardnom devijacijom

od 20 putnika. Koliko putnika se može očekivati radnim danom 2015. godine u julu mesecu ako je učešće putnika u toku dana 95%?

Page 11: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

11

Rešenje:

X: N(180;20), Z= 𝑋−180

20 : N(0;1).

P(Z <z1) = 0,95, z1=1,64

𝑥1−180

20=1,64;

𝑥1=180+20∙1,64 = 212,8

Može se očekivati da radnim danom u julu mesecu 2015. god. bude 213

putnika.

Primer 4.

Za pakovanje šećera može se reći da ima normalan raspored sa aritmetičkom sredinom od 1000 gr i standardnom devijacijom od 50 gr. Kolika je verovatnoća da slučajno odabrano pakovanje šećera imati težinu:

a) Do 1005 gr.

b) Više od 1100 gr.

c) Između 990 i 1050 gr.

Rešenje:

X: N(1000;50), Z= 𝑋−𝜇

𝜎 : N(0;1).

a) P(X < 1005) = P(Z < 0,1) = F(0,1) = 0,5398; b) P(X > 1100) = 1 – P(X ≤ 1100) =1 – P(Z < 2)=1 – F(2) =

=1-0,9772 = 0,0228; c) P(990 < X < 1050) = P(‒0,2 < Z < 1) = 0,8413 – (1 + 0,5793 =

0,4206.

Primer 5.

Jedna mašina proizvodi 5% defektnih proizvoda. Koja je verovatnoća da će u 100 proizvoda biti:

a) od 5–10 defektnih proizvoda,

Page 12: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

12

b) najviše 10 defektnih proizvoda.

Rešenje:

Slučajna promenljiva X koja predstavlja broj defektnih proizvoda u 100

komada ima binomnu raspodelu.

Moze se reći da je n = 100 dovoljno veliki broj, a p = 0,05 dovoljno mali,

Kako je np =100∙0,05 ≤ 5 i npq = 100 ∙ 0,05 ∙ 0,95 = 4,75 ≤ 5 binomni raspored

ćemo aproksimirati normalnim, gde je:

𝜇 = 𝑛𝑝 = 5; σ2=𝑛𝑝𝑞=4,75;

σ = √𝑛𝑝𝑞=√4,75=2,18.

Z = Z= 𝑋−𝑛𝑝

√𝑛𝑝𝑞=

𝑋−5

2,18 : Z(0,1).

Kako se sa diskretne prelazi na neprekidnu slučajnu promenljivu,

intervali se proširuju za 0,5, važi da je:

a) P(5 ≤ X ≤10) = P(4,5 ≤ X ≤ 10,5) = P(‒0,23 ≤ Z ≤ 2,52) =

0,5851;

b) P(X ≤ 10) = P(0 ≤ X ≤ 10) = P(‒0,5 ≤ X ≤ 10,5) = P(‒2,52 ≤ Z ≤

2,52)

= 0,9882.

Primer 6.

Izračunati vrednost tν;α za ν = 15 stepeni slobode i za površinu od 0,01

na desnom kraju krive t-raspodele.

Rešenje: Ako je ν =15 i verovatnoću 99% nalazimo da je t15; 0,01= 2,602. To

znači da je :

P(t < 2,602) = 0,99

Page 13: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

13

Slika 6. Studentova t- raspodela

Primer 7.

U kom intervalu će se naći apsolutna vrednost promenljive tν sa

verovatnoćom od 95%.

Rešenje:

Za ν = 5 i (1−α) = 0,95 tj. α = 0,05 granične vrednosti nalazimo iz

tablice t-raspodele

P(−t5;0,025 ≤ t ν ≤ t 5;0,025 )= 0,95

P(−2,5706 ≤ tν ≤ 2,5706) = 0,95

Sa verovatnoćom od 0,95 realizovana vrednost promenljive t5 naći će

se u intervalu od -2,5706 do 2,5706.

Page 14: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

14

Primer 8.

Slučajna promenljiva X ima Studentovu raspodelu sa 14 stepeni slobode. Odrediti verovatnoću:

a) P(X < 1,34); b) P(X > 2,62); c) P(1,34 < X < 2,62).

Rešenje:

Iz tablica Studentovog t rasporeda sa 14 stepeni slobode vidi se da je za

X = 1,345, P(X>x) = 0,10; za x = 2,624, P(X>x) = 0,01;

Odatle sledi

a) P(X < 1,34)=1- P(X > 1,34)=1-0,10=0.90;

b) P(X > 2,62)=0,01

P(1,34<X < 2,62)= P(X < 2,62) - P(X <1,34) =0,99 -0,90

=0,09.

ZAKLJUČAK:

Na osnovu rezultata dobijenog u predhodnom zadatku može se uočiti

da je interval t-raspodela širi u odnosu na interval normalne promenljive Z za

istu verovatnoću.

Za verovatnoću 0,95 i promenljivu Z sa normalnom raspodelom taj

interval je [-1,96, 1,96], a za promenljivu sa t-raspodelom i 5 stepeni slobode

interval je [-2,57, 2,57]. Porastom broja stepena slobode n → ∞, ν→ ∞ t-

raspodela→ z-raspodeli.

Na osnovu toga se izvodi zaključak:

Za n ≥ 30 može se koristiti normalna z- raspodela umesto t-raspodele.

Page 15: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

15

Tabela 1- Normalni raspored

Page 16: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

16

Tabela 2- Normalni raspored-funkcija raspodele

Page 17: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

17

Tabela 3. Kritične vrednosti (Studentovog t- rasporeda)

Page 18: Материјал за предавања 17.03.2020. и за вежбе 19.03.2020 ... Статистика (СП Јавна управа). Предметни наставник

18