Статистический анализ количественных и...

35
Статистический анализ количественных и качественных признаков

Upload: others

Post on 05-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Статистический анализ количественных и качественных признаков

Page 2: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

План лекции

Программные средства статистической обработки результатов медико-биологического исследования

Этапы статистической обработки

Элементы описательной статистики

Элементы доказательной статистики

Page 3: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

ПРОГРАММНЫЕ СРЕДСТВА

СТАТИСТИЧЕСКОЙ ОБРАБОТКИ

Page 4: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Microsoft Excel

Page 5: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Специализированные пакеты

Page 6: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Последовательность действий при статистическом анализе данных

1.Подготовка данных – формирование массива, чистка, контроль корректности загрузки

2.Исследование типа распределения

3.Описательная статистика

4.Аргументированный выбор соответствующего статистического метода

Сравнение групп с использованием соответствующего статистического метода

Исследование взаимосвязи с использованием соответствующего статистического метода

Page 7: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

ПОДГОТОВКА ДАННЫХ ДЛЯ

ОБРАБОТКИ ПАКЕТАМИ ПРИКЛАДНЫХ СТАТИСТИЧЕСКИХ ПРОГРАММ

Page 8: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Представление данных

Данные представляют в виде таблицы:

столбцы - Переменные,

строки – Наблюдения

Наиболее часто используемые форматы для переменных:

Текст (пол, характер процесса и т.д.)

Число

Дата

Page 9: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Пример таблицы

ФИО

пол: 1- м; 2- д

Апгар на 1 мин

коды: 0 (<5); 1 (=5-6); 2 (>6)

Апгар на 2 мин

(балл)

вес при рождении

(гр)

длина при рождении

(см)

окружность головы при рождении

(см)

окружность груди при рождении

(см)

Patient 1 1 1 6 630 29,5 24,5 18

Patient 2 1 1 6 1136 35 26 22

Patient 3 1 0 4 2360 43 32 31

Patient 4 1 0 6 650 30 26 20

Patient 5 1 0 5 1330 39 31 28

Patient 6 1 1 7 670 31 23 18

Patient 7 2 2 8 2140 39 31 29

Patient 8 2 2 8 1450 40 28 24

Patient 9 2 1 7 1202 36 20 25

……. …. …. … … … … …

Patient 20 2 2 8 2520 47 33 30

Группирующие переменные

Page 10: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Проверка корректности данных

Артефакты

Ошибки распознавания формата данных при импорте

Различия в задании одинаковых по смыслу текстовых переменных

Page 11: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

ИССЛЕДОВАНИЕ ТИПА

РАСПРЕДЕЛЕНИЯ

Page 12: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Значение вида распределения параметра

Распределение параметра – совокупность

частот встречаемости интервалов его

значений в исследуемой выборке.

Вид распределения влияет на выбор статистического метода:

Нормальное распределение – параметрические методы

Любое другое распределение – непараметрические методы

Page 13: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Нормальное распределение Параметры нормального распределения:

среднее значение (M) ; стандартное отклонение (σ)

Нормальное распределение

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 3 6 9 12 15 18 21 24 27

Плотность

ГРАФИК ПЛОТНОСТИ

НОРМАЛЬНОГО

РАСПРЕДЕЛЕНИЯ С

ПАРАМЕТРАМИ:

M = 12; Ϭ = 3 Ϭ =3 Ϭ =3

M M- σ M+ σ

12 15 9

Page 14: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Количественные данные

Нормальное распределение

Распределение отличное от нормального

Исследование типа распределения

Как узнать? • Визуальная оценка

• Сравнение среднего и медианы

• Проверка гипотез

Page 15: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Проверка статистической гипотезы о виде распределения Н0 – исследуемое распределение соответствует нормальному закону распределения

Если вероятность случайного отличия мала (Р – значение меньше 0,05), то отличие признается достоверным (не случайным) - распределение признака не является нормальным.

Используемые критерии:

Колмогорова-Смирнова (K-S)

Лилиефорса (Liliefors)

Шапиро-Уилка (Shapiro-Wilk).

Page 16: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

ОПИСАТЕЛЬНАЯ

СТАТИСТИКА

Page 17: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Количественные данные

Нормальное распределение

Распределение отличное от нормального

Число наблюдений

Среднее (M)

Среднее квадратичное отклонение (S)

Число наблюдений

Медиана (Me)

Верхний и нижний квартили

Описание количественных признаков

Page 18: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

«Ящик с усами»

Ящик с усами, диаграмма размаха — график, использующийся в описательной статистике, компактно изображающий одномерное распределение вероятностей.

Page 19: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Частоты встречаемости значения признака:

Абсолютная частота – число объектов с определенным значением качественного признака

Относительная частота – отношение числа объектов с каким-либо значением признака к общему числу объектов

Таблица сопряженности

Описание качественных признаков

Конституция Мужчины Женщины всего

Астеники 5 8 13

Нормостеники 25 30 55

Гиперстеники 12 11 23

всего 42 49 91

Page 20: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Качественные данные

Порядковые Номинативные

• параметр положения медиана (Me) и характеристики рассеяния нижний (LQ) и верхний (UQ) квартиль

• относительные частоты встречаемости значения признака

Описание качественных признаков

Page 21: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

СРАВНЕНИЕ ГРУПП

С ИСПОЛЬЗОВАНИЕМ СООТВЕТСТВУЮЩЕГО СТАТИСТИЧЕСКОГО МЕТОДА

Page 22: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Проверка статистической гипотезы о различии групп по признаку

Н0 – исследуемые группы не различаются по анализируемому признаку

Н1 – исследуемые группы различаются по анализируемому признаку

Page 23: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Выбор критерия для сравнения групп по количественному признаку

Выборки Число групп

Параметрические (для данных, имеющих нормальное распределение)

Непараметрические (для данных, чьё распределение отличается от нормального или неизвестно)

Не

зав

иси

мы

е

2

t-критерий Стьюдента U-критерий Манна-Уитни,

За

ви

сим

ые

2

t-критерий Стьюдента для зависимых групп

критерий Вилкоксона

Page 24: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Сравнение двух групп по качественному признаку

Выборки Признак бинарный

Признак номинальный

Признак порядковый

Независимые точный критерий Фишера

тест χ2

критерий Манна-Уитни

т е с т χ2

Зависимые Критерий МакНемара

тест χ2

критерий Вилкоксона

Page 25: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Интерпретация результата

Если р>0,05, то нулевая гипотеза об отсутствии различий групп по изучаемому признаку не отклоняется.

Если вероятность случайного отличия мала (Р – значение меньше 0,05), то отличие признается достоверным (не случайным) –

нулевая гипотеза отклоняется (принимается гипотеза о существовании различий групп с уровнем статистической значимости р)

Page 26: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Представление результатов

Для количественных данных: Характер групп и число объектов в каждой из них

Результат проверки распределения на нормальность

Название критерия, используемого для оценки различий групп по определенному признаку

Точное значение р и интерпретация результата

Для качественных данных: Характер групп и число объектов в каждой из них

Название критерия, используемого для оценки различий групп по определенному признаку

Точное значение р и интерпретация результата

Page 27: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

ИССЛЕДОВАНИЕ

ВЗАИМОСВЯЗИ ПРИЗНАКОВ В ГРУППЕ

Page 28: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Типы связей между признаками

• Есть ли зависимость между ростом и весом человека? Две количественные переменные

• Есть ли зависимость между ожирением и артериальным давлением человека? Качественная и количественная переменные

• Есть ли взаимосвязь между ожирением и уровнем холестерина в крови? Две качественные переменные

• Корреляция

• Корреляция

• Ассоциация

Page 29: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Характер и силу взаимосвязи признаков в группе характеризует коэффициент корреляции.

Коэффициент корреляции изменяется в интервале от -1 до 1.

Мера взаимосвязи признаков

Page 30: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Проверка статистической гипотезы о взаимосвязи признаков в группе

Н0 – отсутствует взаимосвязь между исследуемыми признаками в группе

Н1 – исследуемые признаки в группе взаимосвязаны

Page 31: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Методы исследования взаимосвязи признаков

Характер и тип распределения признаков

Статистический критерий

Исследование взаимосвязи нормально распределенных количественных

Параметрический метод корреляционного анализа Пирсона

Исследование взаимосвязи: • количественных признаков, чьё

распределение отличается от нормального или неизвестно;

• количественного и качественного порядкового признака;

• двух порядковых признаков

Непараметрический метод корреляционного анализа Спирмена

Page 32: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Оценка коэффициента корреляции

Значение коэффициента корреляции оценивают по силе и знаку. в зависимости от величины модуля коэффициента корреляции:

меньше 0,3 – слабая сила связи; от 0,31 до 0,5 – умеренная; от 0,51 до 0,7 – заметная; 0,71 и больше – высокая.

в зависимости от знака коэффициента корреляции:

положительное число – прямая взаимосвязь отрицательное число – обратная взаимосвязь

Page 33: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Интерпретация результатов

Если р>0,05, то независимо от значения коэффициента корреляции нулевая гипотеза об отсутствии взаимосвязи изучаемых признаков не отклоняется.

Если р<0,05, то нулевая гипотеза об отсутствии взаимосвязи изучаемых признаков отклоняется. В этом случае необходимо оценить значение коэффициента корреляции

Page 34: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

Резюме

• Оценка нормальности распределения

• Нормальное распределение

• М(S),

• Критерий Стьюдента

• Корреляция по Пирсону

• Распределение, отличное от нормального

• Мe ( Q1, Q3),

• Критерий Манна-Уитни,

• критерий Вилкоксона

• Корреляция по Спирмену

Количественные данные

• Частота встречаемости

• Номинальные (Mo)

• Порядковые Мe ( Q1, Q3)

• Критерий Фишера,

Метод хи-квадрат,

Корреляция по Спирмену

Качественные данные

Page 35: Статистический анализ количественных и ...do.rsmu.ru/fileadmin/user_upload/mbf/c_kibernetiki/LNo5... · 2020. 4. 5. · Представление

СПАСИБО ЗА ВНИМАНИЕ!