tema5_Методи на статистическия извод

13
Методи на статистическия извод Предишният път се запознахме с описателната статистика. Това е обобщеното наименование на този дял от статистиката, чийто методи имат за цел да опишат данните по един сумарен начин така, че да се разкрие разпределението на променливите. При този подход обикновено се изчисляват средната стойност, стандартното отклонение, модата, медианата и т.н. за метричните променливи и честотните разпределения за неметричните. Д а предположим, че разполагаме с измерванията на група пациенти и сме изчислили средната по тези данни. Какво отразява тази средна? Естествено, нашите очаквания са, че по някакъв начин тази стойност ще ни даде информация за средната на генералната съвкупност, популацията. Вероятно истинската, но неизвестна стойност на популационната средна няма да е равна точно на изчислената по извадката, поради извадковата неопределеност, дължаща се на непълнотата на информацията, която се обуславя от ограничения брой случай в извадката. Следователно, изчислената по извадката стойност ще отразява съответния популационен параметър, но в рамките на някаква флуктуацияили грешка. Следователно, изследователят може да направи извод относно популационния параметър, използвайки знанията от извадката, но имайки предвид горните ограничения. Тази верига от разсъждения носи наименованието статистически извод. Статистическият извод е процедура, която се използва от изследователя, за да се направи правдоподобен извод относно популационните параметри на базата на информацията, която се съдържа в съответните извадкови статистики. Обикновено методите на статистическия извод се разделят на две групи, известни като оценяване и проверка на хипотези. Оценяване на параметри на генералната съвкупност Съществуват два подхода към статистическото оценяване на параметри, като вторият от тях е продължение на първия. Първият подход се състои в оценяването на параметъра чрез отделна стойност и е известен като точково оценяване, а съответната оценка – като точкова оценка. Точковата оценка е отделна стойност, която се разглежда като „най-добра” оценка на параметъра на генералната съвкупност. Такива са например средната стойност, стандартното отклонение, модата, медианата и др. характеристики на извадката, някои от които разгледахме миналия път. Смисълът на точковата оценка е не толкова в нейната конкретна стойност, колкото в използването на тази стойност в по-нататъшни изследвания.

Upload: rujdie-salieva

Post on 28-Jul-2015

209 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Tema5_Методи на статистическия извод

Методи на статистическия извод

Предишният път се запознахме с описателната статистика. Това е обобщеното наименование на този дял от статистиката, чийто методи имат за цел да опишат данните по един сумарен начин така, че да се разкрие разпределението на променливите. При този подход обикновено се изчисляват средната стойност, стандартното отклонение, модата, медианата и т.н. за метричните променливи и честотните разпределения – за неметричните.

Д а предположим, че разполагаме с измерванията на група пациенти и сме изчислили средната по тези данни. Какво отразява тази средна? Естествено, нашите очаквания са, че по някакъв начин тази стойност ще ни даде информация за средната на генералната съвкупност, популацията. Вероятно истинската, но неизвестна стойност на популационната средна няма да е равна точно на изчислената по извадката, поради извадковата неопределеност, дължаща се на непълнотата на информацията, която се обуславя от ограничения брой случай в извадката. Следователно, изчислената по извадката стойност ще отразява съответния популационен параметър, но в рамките на някаква флуктуация или грешка. Следователно, изследователят може да направи извод относно популационния параметър, използвайки знанията от извадката, но имайки предвид горните ограничения. Тази верига от разсъждения носи наименованието статистически извод.

Статистическият извод е процедура, която се използва от изследователя, за да се направи правдоподобен извод относно популационните параметри на базата на информацията, която се съдържа в съответните извадкови статистики.

Обикновено методите на статистическия извод се разделят на две групи, известни като оценяване и проверка на хипотези.

Оценяване на параметри на генералната съвкупностСъществуват два подхода към статистическото оценяване на параметри, като

вторият от тях е продължение на първия. Първият подход се състои в оценяването на параметъра чрез отделна стойност и е

известен като точково оценяване, а съответната оценка – като точкова оценка. Точковата оценка е отделна стойност, която се разглежда като „най-добра” оценка на параметъра на генералната съвкупност. Такива са например средната стойност, стандартното отклонение, модата, медианата и др. характеристики на извадката, някои от които разгледахме миналия път. Смисълът на точковата оценка е не толкова в нейната конкретна стойност, колкото в използването на тази стойност в по-нататъшни изследвания.

Вторият подход в статистическото оценяване се състои в използването на точковата оценка за намиране на множество от стойности, по-точно на интервал, за който с определен процент на увереност можем да твърдим, че съдържа истинската, но неизвестна стойност на параметъра. Определянето на този интервал се нарича интервално оценяване, а самият интервал се нарича доверителен интервал.

Доверителни интервали на средната при известно стандартно отклонение на генералната съвкупност

Доверителният интервал на средната на генералната съвкупност при известно стандартно отклонение се определя по следния начин:

,

където е средната на извадката, n е обемът на извадката. Нивото на значимост се избира от изследователя, най-често . То съответства на процента от случаите, при които построената по горната формула интервална оценка няма да съдържа

. Например при , 10% от построените по горната формула интервали няма да

Page 2: Tema5_Методи на статистическия извод

съдържат средната на генералната съвкупност. На по-малките стойности на обаче съответстват по-широки доверителни интервали. Ако доверителният интервал е твърде широк той може да няма практическа стойност. Например каква е ползата, ако кажем, че средният ръст на изследваната съвкупност е число между 1,50 и 2,00м. Намаляване на ширината на доверителният интервал се постига с увеличаване на данните, т.е. на обема на извадката n. Величината се нарича ниво на доверие на построената интервална оценка. Виждаме също, че точковата оценка ще се намира в средата на интервалната оценка. Следователно интервалната оценка съдържа в себе си повече информация за оценявания параметър - освен че се казва че той е число близо до , величината

дава максималната стойност на отклонението на от средната

аритметична . Затова се нарича максимална грешка на точковата оценка .

Величината е т.нар. критична точка на нормалното разпределение. Тя се определя с помощта на таблици или чрез компютърна програма. В Ексел за определянето й се използва функцията NORMSINV. Например при (нивото на доверие на

интервала е ) функцията NORMSINV(0,01/2) връща стойността 2,576 за

. При (нивото на доверие на интервала е ) функцията

NORMSINV(0,05/2) връща стойността 1,96 за .

Максималната грешка на оценката може да бъде изчислена чрез функцията CONFIDENCE( ; ; n). След това като я прибавим и извадим от средната аритметична

получаваме съответно десният и левият край на интервалната оценка.Ако разпределението на наблюдавания признак не е нормално, но също може да се използва горния доверителен интервал.

Доверителни интервали на средната при неизвестно стандартно отклонение на генералната съвкупност

Когато стандартното отклонение на генералната съвкупност не е известно, се изчислява точковата му оценка въз основа на данните в извадката,

. В този случай интервалната оценка се изчислява по следната

формула: . Величината е критична точка на

т.нар. t-разпределение. Тя също се определя с помощта на таблици или чрез компютърна програма. В Ексел за определянето й се използва функцията TINV( ; ).

Максималната грешка може да се изчисли и чрез модула Descriptive Statistics.

Проверка на хипотези

Проверката на хипотези предполага да се прецени доколко една предварително зададена стойност на параметъра е правдоподобна, т.е. да се направи заключение дали информацията, получена по извадката, съответства на очакванията. По този начин може да се вземе решение за приемане или отхвърляне на хипотезата въз основа на резултатите от наблюденията. Най-често се проверява равенството на параметъра на една фиксирана стойност. Проверяваната хипотеза се нарича нулева хипотеза и ще я означаваме с H0. Като правило нулевата хипотеза е твърдение, което посочва липсата на разлика в очакванията ни. Формулира се, например, така:

Page 3: Tema5_Методи на статистическия извод

Нулевата хипотеза се проверява срещу алтернатива, която се нарича алтернативна хипотеза и ще я означаваме с Ha. На практика алтернативната хипотеза обикновено съдържа твърдението, към което се стреми изследователят и затова тя е желаният резултат. Алтернативните хипотези могат да бъдат определени като ненасочени и насочени. При нулева хипотеза ненасочената алтернативна хипотеза е

. В този случай не е зададена посока на алтернативата и затова тя се нарича ненасочена или двустранна алтернатива.

В случаите, когато разполагаме с допълнителна информация за изучаваното явление, по-подходящи могат да се окажат насочените (едностранните) алтернативи. Например,

срещу

или срещу .

Видове грешки при проверка на хипотези

Подобно на построяването на доверителни интервали и тук изследователят още преди извършването на проверката избира стойност за нивото на значимост - най-често 0,1, 0,05 или 0,01. Величината .100% дава процентът на случаите когато ще се извършва грешка от първи тип. Занижаването на стойността за ще означава по-рядко допускане на грешка от първи тип, но автоматично води до увеличаване на процента от случаите когато ще се допуска грешка от втори тип. Едновременното занижаване на риска от допускане на грешки от двата типа е възможно с увеличаването на обема на извадката. Грешките идват от това, че за параметрите на генералната съвкупност се съди въз основа на съответните статистики на извадката. Колкото е по-голямя извадката, по-верни ще са и нашите изводи.

Алгоритъм за проверка на хипотези1. Формулиране на Но и На;2. Избор на критерий за проверка, съгласно предположението, съдържащо се в Но.Критерият за проверка е величина, различна за различните нулеви хипотези, която се изчислява въз основа на данните в извадката и на предположението, съдържащо се в нулевата хипотеза;3. Изчисляване на емпиричната стойност на критерия;4. Определяне на критичната стойност за критерия, въз основа на избраното ниво на

значимост и въз основа на избраната алтернативна хипотеза На.

Page 4: Tema5_Методи на статистическия извод

Тази критична стойност се взема от специално подготвени за целта таблици или се изчислява с помощта на компютърна програма.5. Вземане на решение въз основа на сравняване на емпиричната с критичната

стойност на критерия.

Проверка на хипотези при една извадка1. Хипотези за средната стойност при известно средно квадратично

отклонение

срещуА)

Б)

В) .

Критерият за проверка е .

Page 5: Tema5_Методи на статистическия извод

2. Хипотези за средната стойност при неизвестно средно квадратично отклонение

Page 6: Tema5_Методи на статистическия извод

За определяне на критичните стойности на t в зависимост от нивото на значимост и степените на свобода може да се използва функцията TINV. За Пример 5 функцията ще има вида TINV(0,05*2; 14) - нивото на значимост 0,05 се умножава по две при едностранен тест, обемът на извадката е n = 15, следователно степените на свобода са 14 - вторият аргумент на функцията представлява степените на свобода (n - 1).

Проверка на хипотези за средната на генералната съвкупност при две извадки

Проверката на хипотези за средната на генералната съвкупност при две извадки се извършва с различни изчислителни процедури в зависимост от това какви са изходните допускания: генералните съвкупности, от които са извлечени извадките, са с равни дисперсии; генералните съвкупности са с различни дисперсии; извадките са зависими (свързани) - съдържат измервания върху едни и същи обекти (лица) обикновено преди и след подлагането им на определено въздействие.

Page 7: Tema5_Методи на статистическия извод

Независимо от вида на изходните допускания нулевата и алтернативната хипотези при едностранен и двустранен тест се формулират по следния начин:

Проверка на хипотези при две идвадки с t-разпределение(неизвестни )

Проверка на хипотези за средната на генералната съвкупност при две извадки с равни дисперсии ще илюстрираме въз основа на следния

Пример 6. Преподавател по физика разделя в началото на семестъра по случаен начин студентите на две групи, като в едната група - контролна група от 9 студенти - прилага съществуващата методика на преподаване, а във втората група - експериментална група от 10 студенти - използва нова методика. Получените от студентите резултати са дадени в следващата таблица. Да се провери хипотезата, че при двете методики се получават едни и същи резултати при ниво на значимост 0,05 - прилага се двустранен тест

За проверката на тези хипотези е необходимо да се приложи инструментът на Excel t-Test: Two-Sample Assuming Equal Variances - стартира се чрез Tools/Data Analysis.

Page 8: Tema5_Методи на статистическия извод

Достатъчно е потребителят да задададе областите с данни, нивото на значимост и да се укаже къде ще се получат резултатите- тестовата статистика (t Stat) и критичните стойности както при двустранен, така и при едностранен тест и съответните вероятности - P Values:

Тестовата статистика (t Stat) в този случай е -2,18 и тъй като тя е по-малка от критичната стойност -2,11 за двустратен тест, то нулевата хипотеза за разглеждания пример се отхвърля. Това се потвърждава и от вероятността P=0,044<0,05. Иводът, който може да се направи, е: двете извадки произлизат от генерални съвкупности с различни средни.

Проверката на хипотези при две извадки с неравни дисперсии се извършва с инструмента t-Test: Two-Sample Assuming Unequal Variances, който също се намира в Data Analysis.

За илюстрация на случая на извадки с неравни дисперсии ще използваме следния

Пример 7. Психолог се интересува дали социалният статус се отразява върху

Page 9: Tema5_Методи на статистическия извод

резултатите от теста за тревожност на студентите от един университет. Резултатите, получени при този тест от студенти, чиито семейства попадат в две различни категории, са следните:Нисък статус: 23, 11, 17, 16, 6, 14, 15, 19, 10; Висок статус: 8, 6, 4, 12, 16, 17, 12, 10, 11, 13. Да се провери хипотезата, че студентите с по-висок социален статус показват по-ниска степен на тревожност при ниво на значимост 0,05.

Тъй като двете извадки са извлечени от различни генерални съвкупности, е налице случай на две независими извадки с различни дисперсии на генералните съвкупности. За решаването на задачата са формулирани следните хипотези:

За намиране на тестовата статистика и на нейните критични стойности при предварително зададено ниво на значимост се прилага t-Test: Two-Sample Assuming Unequal Variances. Диалоговият прозорец на този тест е подобен на този от Пример 5. Аналогичен е и форматът на получените резултати.

Извод: Тестовата статистика 1,72 не надвишава критичната стойност за едностранен тест 1,75, следователно нулевата хипотеза не се отхвърля. Това означава, че може да се приеме, че между нивото на тревожност на студентите от двете социални групи не съществува статистически значима разлика при ниво на значимост 0,05

Page 10: Tema5_Методи на статистическия извод

Характерно за зависимите (свързаните) извадки, е че се провеждат две измервания върху едни и същи обекти (лица) обикновено преди и след подлагането им на определено въздействие. Проверка на хипотези за такива извадки ще илюстрираме със следния

Пример 8. За да се изследва влиянието на алкохола върху времето на реакция, необходимо да се спре лек автомобил, е проведен експеримент, в който се сравнява времето на реакция на шофьор, когато не е употребил алкохол и в ситуация, когато е изпил 100 грама алкохол. Двадесет и осем души са подбрани случайно за участие в експеримента. Данните от измерванията при двете ситуации са представени в таблицата по-долу. Да се провери хипотезата, че времето за реакция, необходимо да се спре лек автомобил при употреба на алкохол е по-високо от това, когато не е употребен алкохол:

Тъй като се изследват две различни състояния за едни и същи обекти, е налице случай на свързани извадки и е необходимо да се приложи инструментът t-Test: Paired Two Sample for Means.

Както се вижда от резултатите тестовата статистика t Stat = -25,02 < -1,7 (критичната стойност при едностранен тест), поради което нулевата хипотеза се отхвърля в полза на алтернативната. Времето за реакция при употреба на алкохол е по-голямо от това без употреба на алкохол.

Page 11: Tema5_Методи на статистическия извод