Первинна обробка результатів спостережень. Закон...

17
Первинна обробка результатів спостережень. Закон розподілу даних 1. Основні положення та завдання. 2. Розподіл імовірностей випадкових величин. 3. Числові характеристики ВВ. 4. Перевірка статистичних гіпотез. 5. Перевірка наявності грубих промахів.

Upload: steven-castaneda

Post on 31-Dec-2015

79 views

Category:

Documents


0 download

DESCRIPTION

Первинна обробка результатів спостережень. Закон розподілу даних. Основні положення та завдання. Розподіл імовірностей випадкових величин. Числові характеристики ВВ. Перевірка статистичних гіпотез. Перевірка наявності грубих промахів. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Первинна обробка результатів спостережень. Закон розподілу даних

Первинна обробка результатів спостережень. Закон розподілу даних

1. Основні положення та завдання.

2. Розподіл імовірностей випадкових величин.

3. Числові характеристики ВВ.

4. Перевірка статистичних гіпотез.

5. Перевірка наявності грубих промахів.

Page 2: Первинна обробка результатів спостережень. Закон розподілу даних

Результати спостережень – випадкова величина, тобто змінна величина, яка в результаті випробувань з випадковими наслідками набуває одного із своїх можливих, наперед невідомих, значень.

Дискретна – це ВВ, яка приймає окремі ізольовані значення, що визначаються цілим числом, з певними ймовірностями. Кількість можливих значень дискретної ВВ є скінченою або нескінченою.

Неперервна ВВ приймає будь-які значення на деякому числовому проміжку, відповідно, кількість можливих значень неперервної ВВ є нескінченою.

Page 3: Первинна обробка результатів спостережень. Закон розподілу даних

Результати спостережень утворюють статистичну сукупність.

Генеральна сукупність – повний набір усіх можливих значень ВВ.

Вибірка (вибіркова сукупність) – це множина випадково відібраних елементів із генеральної сукупності.

Повторна вибірка формується за умов, якщо відібраний елемент після досліджень повертають до вибірки перед відбором наступного.

Безповторна вибірка формується за умов неповернення відібраних елементів до вибірки.

Page 4: Первинна обробка результатів спостережень. Закон розподілу даних

Репрезентативна вибірка - це вибірка, яка відображає властивості генеральної сукупності з достатньою точністю.

Згідно закону великих чисел вибірка репрезентативна, якщо її елементи відібрано випадково, тобто ймовірність потрапляння у вибірку кожного елементу є однакова.

Page 5: Первинна обробка результатів спостережень. Закон розподілу даних

Способи відбору вибірокБез розбиття

генеральної сукупності на частини:

Простий випадковий безповторний

Простий випадковий повторний

З розбиттям генеральної сукупності на частини:

Типовий, якщо вибірку формують із типових частин генеральної сукупності

Механічний, якщо генеральну сукупність механічно ділять на стільки груп, скільки слід відібрати елементів, і з кожної групи відбирають по одному елементу

Серійний, якщо елементи відбирають серіями за умови, що досліджувана ознака суттєво не відрізняється між серіями

Page 6: Первинна обробка результатів спостережень. Закон розподілу даних

Переваги вибіркового методу:

Менша витрата ресурсів Можливість швидкого одержання

результатів Можливість ЕД, якщо суцільне

дослідження взагалі неможливе Зменшення суб'єктивних помилок за

рахунок меншої кількості виконавців

Page 7: Первинна обробка результатів спостережень. Закон розподілу даних

При статистичному аналізі даних дослідник зіштовхується з такими проблемами:

Який обсяг ВС і спосіб її формування Достовірність перенесення висновків,

зроблених на основі ВС, на ГС Вибір оптимальних способів оцінювання Вибір способів узагальнення,

класифікації та представлення ЕД

Page 8: Первинна обробка результатів спостережень. Закон розподілу даних

Висновки, зроблені на основі ВС, є достовірні за умови достатнього обсягу ВС, тобто в силу вступає закон великих чисел і шукані характеристики втрачають властивість випадковості:

Наприклад,

yN

N

ii

mN

y

122 NSiN

i pN

m

Page 9: Первинна обробка результатів спостережень. Закон розподілу даних

Закон розподілу ВВ описує зв’язок між значеннями ВВ і ймовірностями їх появи p=f(y). Закон розподілу задається:

Таблицями

Формулами Графіками

Значення ВВ 1 2 3 4

Імовірність 0,1 0,3 0,5 0,1

0

5

10

15

20

25

30

0 2 4 6 8

значення ВВ

ча

сто

та

2

2

2

)(

2

1

myyi

ep

Page 10: Первинна обробка результатів спостережень. Закон розподілу даних

Розподіл ВВ є

Емпіричний, одержаний на основі ЕД, залежить від статистичної природи ВВ.

Теоретичний (типовий), який характерний для певної групи процесів та виду ВВ (дискретна чи неперервна).

Page 11: Первинна обробка результатів спостережень. Закон розподілу даних

Методи перевірки гіпотез про вид розподілу ВВ За критерієм Пірсона За критерієм Колмогорова За критерієм Колмогорова-Смирнова За критерієм Вілкоксона За знаковим критерієм За показниками асиметрії та ексцесу

Page 12: Первинна обробка результатів спостережень. Закон розподілу даних

Характеристики одновимірних розподілів ВВ Характеристики розташування:

середнє, медіана, мода Характеристики розсіювання: розмах,

дисперсія, середньоквадратичне відхилення, коефіцієнт варіації

Характеристики форми: асиметрія, ексцес

Page 13: Первинна обробка результатів спостережень. Закон розподілу даних

Оцінки параметрів повинні відповідати

вимогам. Незміщенність полягає в тому, що оцінка параметра

прямує до істинного значення параметра при великому обсязі ВС. Зміщенність оцінки виникає за наявності систематичної похибки.

Повнота полягає в тому, що оцінка параметра прямує до істинного значення параметра при великому обсязі ВС з імовірністю 100 %.

Ефективність полягає у мінімальній дисперсії оцінки.

Достатність полягає в тому, що оцінка параметра повинна містити всю необхідну інформацію.

Page 14: Первинна обробка результатів спостережень. Закон розподілу даних

Послідовність перевірки статистичних гіпотез

1. Сформулювати статистичну модель.2. Сформулювати нульову Н0 та альтернативну

(конкуруючу) Н1 гіпотезу.3. Вибрати критеріальну статистику, що відповідає

статистичній моделі.4. Розрахувати обраний критерій для ЕД.5. Вибрати рівень значущості та визначити критичне

значення критерію.6. Порівняти розрахункове та критичне значення

критерію.7. Зробити висновки про прийняття чи відхилення

гіпотези Н0 (Н1).

Page 15: Первинна обробка результатів спостережень. Закон розподілу даних

При перевірці гіпотез виникають похибки Першого роду – нульова гіпотеза Н0

відхиляється, коли вона вірна Другого роду – нульова гіпотеза Н0

приймається, коли вірна альтернативна Н1

Page 16: Первинна обробка результатів спостережень. Закон розподілу даних

Послідовність перевірки вибірок на наявність грубих промахів1. Визначити сумнівний елемент вибірки ус(або сумнівні).2. Для значень, що залишились, обчислити середнє значення та

середньоквадратичне відхилення.3. Розрахувати критерій Стьюдента, підставляючи у формулу той із

сумнівних елементів, що є найближче до середнього значення:

4. Прийняти рівень значущості та визначити критичне значення критерію t(q, f).

5. Якщо виконується умова tрозр<=tкр, то сумнівний елемент не є грубим промахом і включається до вибірки. Решта сумнівних значень перевіряється аналогічно, враховуючи включений до вибірки елемент.

6. Якщо ж виявиться, що tрозр>tкр, то всі сумнівні елементи є грубими промахами і виключаються із вибірки.

S

ууt

с

розр

Page 17: Первинна обробка результатів спостережень. Закон розподілу даних

Задача При прийнятті дизайнера на роботу , його конкурсну роботу

оцінювали 10 працівників дизайнерського відділу за 100-бальною системою. Чи можна вважати думку експертів неупередженою, якщо оцінки такі: 60, 55, 35, 40, 70, 70, 65, 75, 75, 80.