Точечное оценивание параметров распределение

9
223 ТОЧЕЧНОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 1.Оценка математического ожидания случайной величины 2.Оценка дисперсии наблюдаемой случайной величины 3.Оценка вероятности случайного события 4.Упражнения 5.Контрольные вопросы Задача статистической оценки параметров распределения формулируется следующим образом. Требуется на основе однородных независимых опытов и полученной случайной выборки значений n x x x ,..., , 2 1 случайных величин n X X X ,..., , 2 1 , представляющих собой признаки случайной величины X, найти оценки a параметров а распределения случайной величины X : a = a ( n x x x ,..., , 2 1 ),

Upload: alexanderpiwetdiplom

Post on 28-Jul-2015

799 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Точечное оценивание параметров распределение

223

ТОЧЕЧНОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ

РАСПРЕДЕЛЕНИЯ

1.Оценка математического ожидания случайной величины

2.Оценка дисперсии наблюдаемой случайной величины

3.Оценка вероятности случайного события

4.Упражнения

5.Контрольные вопросы

Задача статистической оценки параметров распределения

формулируется следующим образом.

Требуется на основе однородных независимых опытов и полученной

случайной выборки значений nxxx ,...,, 21 случайных величин nXXX ,...,, 21 ,

представляющих собой признаки случайной величины X, найти оценки a

параметров а распределения случайной величины X :

a = a ( nxxx ,...,, 21 ),

Page 2: Точечное оценивание параметров распределение

224

которые в этом смысле представляют собой реализации некоторых

выборочных функций случайной величины ),...,1( niX i , распределенных

по одному и тому же закону, совпадающему с законом распределения

случайной величины X .

Поскольку элементы выборки являются случайными величинами, то

и оценки a (параметров а) являются также случайными величинами. Для

того, чтобы статистические оценки были объективными и давали

"хорошие" приближения оцениваемых параметров, они должны быть

состоятельными, несмещенными и эффективными.

Оценка a = na называется состоятельной, если ее значение

при n с вероятностью единица сходится к истинному значению

параметра, т.е. а.

1}||{lim

nn

aaP .

Состоятельность оценки означает, что при достаточно большом объеме

выборки отклонение оценки a от истинного значения параметра а с

большой достоверностью меньше заданной величины . Состоятельность

является лишь асимптотической характеристикой оценки при n .

Оценка называется несмещенной, если M[ a ] = а.

Несмещенность оценки означает, что для всех n математическое

ожидание оценки a должно быть равно оцениваемому параметру а. Если

это не удовлетворяется, то оценка называется смещенной.

Оценка a называется эффективной, если среди всех других

возможных оценок она обладает наименьшей дисперсией, т.е.

D[ a ] = min M{( a – M[a ] )2

}.

Оценка a называется достаточной статистикой, если вся

полученная из выборки информация относительно параметра а

содержится в a .

Page 3: Точечное оценивание параметров распределение

225

Наверх

Оценка математического ожидания случайной величины

Пусть имеется n однородных (равноточных и независимых)

измерений nxxx ,...,, 21 случайной выборки nXXX ,...,, 21 . Тогда оценка

n

iix x

nmx

1

1

называется статистическим (выборочным) средним.

Поскольку nXXX ,...,, 21 являются признаком случайной величины X , то

M[ ix ] = xm , D[ ix ] = 2xD .

Рассмотрим некоторые характеристики оценки математического

ожидания. Согласно теореме Чебышева 11

lim1

n

ixi

nmx

nP ,

т.е. оценка xm является состоятельной.

Определим математическое ожидание выборочного среднего:

xx

n

ii

n

iix mmn

nxM

nx

nMmM

11

1][

11][ .

Следовательно, оценка xm является несмещенной.

Найдем дисперсию оценки xm :

n

DDn

nxD

nx

nDmD x

n

ixi

n

iix

122

1

1][

11][ .

Таким образом, дисперсия оценки xm в n раз меньше дисперсии

случайной величины X, с ростом выборки при n дисперсия ][ xmD

среднего неограниченно убывает и является асимптотически эффек-

тивной.

Page 4: Точечное оценивание параметров распределение

226

Наверх

Оценка дисперсии наблюдаемой случайной величины

Для того, чтобы охарактеризовать рассеяние наблюдаемых значений

количественного признака выборки вокруг среднего значения xm , вводят

сводную характеристику 2S – выборочную дисперсию.

В том случае, если известно xm генеральной совокупности, то в

качестве оценки дисперсии принимают выборочную дисперсию 2S ,

вычисляемую по формуле

2S = 2

1

)(1

x

n

ii mx

n

.

Преобразуем это выражение к виду

2S = n

mx

nmx

n

n

i

xix

n

ii

22

1

22

1

)(1

χ2

,

где χ2

– величина «хи-квадрат» с n степенями свободы с математическим

ожиданием М(χ 2) = n и дисперсией D(χ 2

) = 2n.

Найдем теперь математическое ожидание выборочной дисперсии:

М[ 2S ] = n

Mnn

M2

22

22

n = xD2 .

Отсюда следует, что выборочная дисперсия 2S является несмещенной

оценкой.

Найдем дисперсию оценки 2S :

D[ 2S ] = nn

Dnn

D 22

42

2

42

2

=

n

42.

При n дисперсия оценки D[ 2S ]= n

42 → 0. Таким образом, оценка

дисперсии 2S является асимптотически эффективной.

Page 5: Точечное оценивание параметров распределение

227

В том случае, если xm неизвестно, то в качестве оценки дисперсии

принимают выборочную дисперсию, которая вычисляется по формуле

2S = 2

1

)(1

1x

n

ii mx

n

и называется исправленной дисперсией.

Эта оценка является несмещенной. Для доказательства этого

утверждения преобразуем оценку дисперсии 2S к виду:

2S = 11

)(1

1 22

1

22

1

n

mx

nmx

n

n

i

xix

n

ii

χ 2 ,

где χ 2 – величина «хи-квадрат» с n – 1 степенями свободы, математичес-

ким ожиданием М(χ2

) = n – 1 и дисперсией D(χ2

) = 2 (n – 1). Это

обусловлено тем, что между случайными величинами xi mx существует

одна линейная связь, определяющая xm . Поэтому в данном случае сумма

квадратов связана не с n , а с n – 1 степенями свободы. Тогда

М[ 2S ] = )1(111

22

22

2

n

nM

nnM

= xD2 .

Исправленная дисперсия является также асимптотически эффектив-

ной оценкой, так как

D[ 2S ] = )1(2)1()1(1 2

42

2

42

2

n

nD

nnD

=

1

2 4

n

.

Отметим, что оценка дисперсии 2S удовлетворяет также условиям

состоятельности. Однако доказательство этого утверждения выходит за

рамки курса, поэтому мы его опускаем.

При большом объеме выборки n практически безразлично, по какой

формуле вычислять оценку дисперсии 2S . Однако при малых выборках

следует пользоваться формулой для исправленной дисперсии.

Page 6: Точечное оценивание параметров распределение

228

Наверх

Оценка вероятности случайного события

Оценим вероятность появления события А в n опытах: P(A) = p.

В качестве оценки рассмотрим частоту событий

nmp /** ,

где *m – число опытов (случайная величина), в которых наблюдалось

событие А , а n – общее число опытов.

Из теоремы Бернулли, согласно которой 1}||{lim *

ppPn

,

следует, что оценка вероятности случайного события *p является

состоятельной.

Определим математическое ожидание и дисперсию оценки *p .Так

как *m – случайная величина, распределенная по биномиальному закону

с математическим ожиданием npmM )( * и дисперсией npqmD )( * ,то

pn

npmM

nn

mMpM

)(

1)( *

**

,

n

pq

n

npqmD

nn

mDpD

2

*

2

** )(

1)( .

Таким образом, оценка вероятности случайного события *p

является также несмещенной и асимптотически эффективной.

Наверх

Упражнения

1. Выборочная совокупность задана таблицей распределения

ix 1 2 3 4

Page 7: Точечное оценивание параметров распределение

229

in 20 15 10 5

Найти выборочную среднюю совокупности.

2. Найти средние групп и общую среднюю совокупности, состоящей

из следующих двух групп

Первая группа Вторая группа

ix in ix in

2 1 3 2

4 7 8 3

5 2

_______________ ______________ 101 inN 52 inN

Групповые средние определяются по формуле: jiij Nxnm / , где j –номер

группы, ij nN – объем группы j.

Общая средняя m совокупности определяются по формуле:

jjj NmNm / .

3. Найти дисперсию и среднее квадратическое отклонение

xD по распределению

ix 1 2 3 4

in 20 15 10 5

4. Вычислите групповые дисперсии из совокупности двух групп

упр.2.

Для нахождения групповой дисперсии используйте формулу

jjiij NmxnD /)( 2 ,

где in частота значения ix ; j – номер группы; jm групповая средняя;

ij nN объем группы j.

5. По выборкам двух групп упражнения 2 вычислите

внутригрупповую внгрD и межгрупповую межгрD дисперсии по формулам:

NDND jjвнгр /)( , NmmND jjмежгр /)( 2 ,где

jNN объем всей совокупности.6. По выборкам двух групп

упражнения 2 вычислите общую дисперсию по

формуле: NmxnD iiобщ /)( 2 .

Убедитесь в справедливости соотношения межгрвнгробщ DDD

Наверх

Контрольные вопросы

Page 8: Точечное оценивание параметров распределение

230

Статистическая оценка параметров распределения

1.Сформулируйте основную задачу статистической оценки параметров.

2.Какими основными свойствами должны обладать оценки параметров

распределения случайной величины?

3.Какие оценки называются состоятельными?

4.Какие оценки называются несмещенными?

5.Какие оценки называются эффективными?

6.Напишите формулу оценки математического ожидания случайной

величины.

7.Докажите, что оценка математического ожидания

n

iix x

nm

1

1

состоятельная, несмещенная и асимптотически эффективная.

8.Напишите формулу оценки дисперсии с известным математическим

ожиданием случайной величины.

9.Докажите, что оценка дисперсии случайной величины с известным

математическим ожиданием

n

ixi mx

nS

1

22 )(1

состоятельная,

несмещенная и асимптотически эффективная.

10.Напишите формулу оценки дисперсии с неизвестным математическим

ожиданием случайной величины.

11.Что понимается под исправленной дисперсией?

12.Докажите, что оценка дисперсии случайной величины с неизвестным

математическим ожиданием

n

ixi mx

nS

1

22 )(1

1 состоятельная,

несмещенная и асимптотически эффективная.

13.Что понимается под оценкой вероятности случайного события?

14.Докажите, что оценка вероятности случайного события, определенная

частотой его появления nmp /* , где m – число опытов, в которых

Page 9: Точечное оценивание параметров распределение

231

наблюдалось событие, состоятельная, несмещенная и асимптотически

эффективная.

Наверх