Первинна обробка результатів спостережень. Закон...

Первинна обробка результатів спостережень. Закон розподілу даних

1. Основні положення та завдання.

2. Розподіл імовірностей випадкових величин.

3. Числові характеристики ВВ.

4. Перевірка статистичних гіпотез.

5. Перевірка наявності грубих промахів.

Результати спостережень – випадкова величина, тобто змінна величина, яка в результаті випробувань з випадковими наслідками набуває одного із своїх можливих, наперед невідомих, значень.

Дискретна – це ВВ, яка приймає окремі ізольовані значення, що визначаються цілим числом, з певними ймовірностями. Кількість можливих значень дискретної ВВ є скінченою або нескінченою.

Неперервна ВВ приймає будь-які значення на деякому числовому проміжку, відповідно, кількість можливих значень неперервної ВВ є нескінченою.

Результати спостережень утворюють статистичну сукупність.

Генеральна сукупність – повний набір усіх можливих значень ВВ.

Вибірка (вибіркова сукупність) – це множина випадково відібраних елементів із генеральної сукупності.

Повторна вибірка формується за умов, якщо відібраний елемент після досліджень повертають до вибірки перед відбором наступного.

Безповторна вибірка формується за умов неповернення відібраних елементів до вибірки.

Репрезентативна вибірка - це вибірка, яка відображає властивості генеральної сукупності з достатньою точністю.

Згідно закону великих чисел вибірка репрезентативна, якщо її елементи відібрано випадково, тобто ймовірність потрапляння у вибірку кожного елементу є однакова.

Способи відбору вибірокБез розбиття

генеральної сукупності на частини:

Простий випадковий безповторний

Простий випадковий повторний

З розбиттям генеральної сукупності на частини:

Типовий, якщо вибірку формують із типових частин генеральної сукупності

Механічний, якщо генеральну сукупність механічно ділять на стільки груп, скільки слід відібрати елементів, і з кожної групи відбирають по одному елементу

Серійний, якщо елементи відбирають серіями за умови, що досліджувана ознака суттєво не відрізняється між серіями

Переваги вибіркового методу:

Менша витрата ресурсів Можливість швидкого одержання

результатів Можливість ЕД, якщо суцільне

дослідження взагалі неможливе Зменшення суб'єктивних помилок за

рахунок меншої кількості виконавців

При статистичному аналізі даних дослідник зіштовхується з такими проблемами:

Який обсяг ВС і спосіб її формування Достовірність перенесення висновків,

зроблених на основі ВС, на ГС Вибір оптимальних способів оцінювання Вибір способів узагальнення,

класифікації та представлення ЕД

Висновки, зроблені на основі ВС, є достовірні за умови достатнього обсягу ВС, тобто в силу вступає закон великих чисел і шукані характеристики втрачають властивість випадковості:

Наприклад,

yN

N

ii

mN

y

122 NSiN

i pN

m

Закон розподілу ВВ описує зв’язок між значеннями ВВ і ймовірностями їх появи p=f(y). Закон розподілу задається:

Таблицями

Формулами Графіками

Значення ВВ 1 2 3 4

Імовірність 0,1 0,3 0,5 0,1

0

5

10

15

20

25

30

0 2 4 6 8

значення ВВ

ча

сто

та

2

2

2

)(

2

1

myyi

ep

Розподіл ВВ є

Емпіричний, одержаний на основі ЕД, залежить від статистичної природи ВВ.

Теоретичний (типовий), який характерний для певної групи процесів та виду ВВ (дискретна чи неперервна).

Методи перевірки гіпотез про вид розподілу ВВ За критерієм Пірсона За критерієм Колмогорова За критерієм Колмогорова-Смирнова За критерієм Вілкоксона За знаковим критерієм За показниками асиметрії та ексцесу

Характеристики одновимірних розподілів ВВ Характеристики розташування:

середнє, медіана, мода Характеристики розсіювання: розмах,

дисперсія, середньоквадратичне відхилення, коефіцієнт варіації

Характеристики форми: асиметрія, ексцес

Оцінки параметрів повинні відповідати

вимогам. Незміщенність полягає в тому, що оцінка параметра

прямує до істинного значення параметра при великому обсязі ВС. Зміщенність оцінки виникає за наявності систематичної похибки.

Повнота полягає в тому, що оцінка параметра прямує до істинного значення параметра при великому обсязі ВС з імовірністю 100 %.

Ефективність полягає у мінімальній дисперсії оцінки.

Достатність полягає в тому, що оцінка параметра повинна містити всю необхідну інформацію.

Послідовність перевірки статистичних гіпотез

1. Сформулювати статистичну модель.2. Сформулювати нульову Н0 та альтернативну

(конкуруючу) Н1 гіпотезу.3. Вибрати критеріальну статистику, що відповідає

статистичній моделі.4. Розрахувати обраний критерій для ЕД.5. Вибрати рівень значущості та визначити критичне

значення критерію.6. Порівняти розрахункове та критичне значення

критерію.7. Зробити висновки про прийняття чи відхилення

гіпотези Н0 (Н1).

При перевірці гіпотез виникають похибки Першого роду – нульова гіпотеза Н0

відхиляється, коли вона вірна Другого роду – нульова гіпотеза Н0

приймається, коли вірна альтернативна Н1

Послідовність перевірки вибірок на наявність грубих промахів1. Визначити сумнівний елемент вибірки ус(або сумнівні).2. Для значень, що залишились, обчислити середнє значення та

середньоквадратичне відхилення.3. Розрахувати критерій Стьюдента, підставляючи у формулу той із

сумнівних елементів, що є найближче до середнього значення:

4. Прийняти рівень значущості та визначити критичне значення критерію t(q, f).

5. Якщо виконується умова tрозр<=tкр, то сумнівний елемент не є грубим промахом і включається до вибірки. Решта сумнівних значень перевіряється аналогічно, враховуючи включений до вибірки елемент.

6. Якщо ж виявиться, що tрозр>tкр, то всі сумнівні елементи є грубими промахами і виключаються із вибірки.

S

ууt

с

розр

Задача При прийнятті дизайнера на роботу , його конкурсну роботу

оцінювали 10 працівників дизайнерського відділу за 100-бальною системою. Чи можна вважати думку експертів неупередженою, якщо оцінки такі: 60, 55, 35, 40, 70, 70, 65, 75, 75, 80.

Первинна обробка результатів спостережень. Закон...

Documents