Лекция 5 Особенности подбора математических методов в...

Post on 10-Aug-2015

50 Views

Category:

Education

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Особенности подбора методов

и критериев статистической

обработки

Параметрические и непараметрические

критерии

Определение

•Параметрические критерии - Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

•Непараметрические критерии - Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.

Особенности применения

•Непараметрические критерии применяются на выборке (n) меньше 100 испытуемых. При выборке менее 10 – используются только как промежуточные.

•Параметрические критерии применяются при выборке более 100 испытуемых, либо после проверки на нормальность распределения.

Нормальное распределение.

Существуют такие способы проверки на нормальность распределения как • графический способ, • критерий асимметрии и эксцесса, • критерий нормальности Колмогорова-Смирнова.

Проверка распределения на нормальность с помощью асимметрии и эксцесса

• Чтобы оценить отличие теоретического распределения от нормального, необходимо сопоставить показатели асимметрии и эксцесса распределения эмпирических данных с их критическими значениями, полученными по формулам Н.А. Плохинского :

Статистические гипотезы

•Нулевая гипотеза ( ) – различий между выборками нет.

•Альтернативная гипотеза ( ) – отрицает нулевую гипотезу. Между выборками есть различия.

Степень свободы

• В таблицах критических значений приводятся или показатели объема выборки, или показатели степеней свободы. Степень свободы (обозначается как df или υ) - это величина, зависимая от объема выборки. • Число степеней свободы - это число данных из выборки, значения которых могут быть случайными.

• Если у нас имеются две независимые выборки, то число степеней свободы для первой из них составляет -1, а для второй - - 1. Таким образом, число степеней свободы для этих независимых выборок будет составлять ( + ) - 2.• В случае зависимых выборок число степеней свободы равно - 1.

Уровень статистической достоверности

(р-уровень значимости)

• P-level – отображает вероятность получения данного результата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза - то есть связи нет. • Иначе говоря, это вероятность того, что обнаруженная связь носит случайный характер, а не является свойством совокупности.

• В отношении научной гипотезы уровень статистической значимости – это количественный показатель степени недоверия к выводу о наличии связи, вычисленный по результатам выборочной, эмпирической проверки этой гипотезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.

Особенности выбора критериев

Назначение критерия

Параметрические критерии

Непараметрические критерии

Сравнение двух независимых выборок

t-критерий Стьюдента для независимых выборок

U-критерий Манна — Уитни

Сравнение двух зависимых выборок

t-критерий Стьюдента для зависимых выборок

T- Вилкоксона

Корреляционный анализ

Коэффициент корреляции Пирсона

Коэффициент ранговой корреляции Спирмена

Параметрическиекритерии

Критерий t-Стьюдента для независимых

выборок•Данный метод сравнения позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга.

• Результатом данного анализа будет наличие или отсутствие достоверного различия между двумя группами испытуемых, учитывая, конечно, уровень достоверности (p<0,05).

Критерий t-Стьюдента для зависимых выборок• Этот метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга.

• Зависимая выборка – когда определенные признак измерен на одной и той же выборке дважды, например, до и после воздействия, лечения и т.п.

Коэффициент корреляции Пирсона

• r-Пирсона применяется для изучения взаимосвязи двух метрических переменных, измеренных на одной и той же выборке.

• Корреляция Пирсона есть мера линейной связи между двумя переменными. Она позволяет определить, насколько пропорциональна изменчивость двух переменных. Если переменные пропорциональны друг другу, то графически связь между ними можно представить в виде прямой линии с положительным (прямая пропорция) или отрицательным (обратная пропорция) наклоном.

Непараметрическиекритерии

U-критерий Манна-Уитни

• Критерий Манна-Уитни представляет непараметрическую альтернативу t-критерию для независимых выборок. Опция предполагает, что данные расположены таким же образом, что в и t-критерии для независимых выборок. В частности, данные должны содержать группирующую переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.

• U-критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерию для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий.

Критерий Т-Вилкоксона

•Критерий Вилкоксона парных сравнений является непараметрической альтернативой t-критерию для зависимых выборок. •Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.

Коэффициент корреляции Спирмена

• Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

• Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции. • Коэффицент ранговой корреляции Спирмена целесообразно применять при наличии небольшого количества наблюдений (при большом количестве одинаковых рангов поодной или обеим сопоставляемым переменным дает огрубленные значения. ).

Сравнение двух выборок

Особенности интерпретации

Т-критерия Стьюдента

•Для анализа данных и принятия или отвержения нулевой гипотезы (между выборками различий нет) необходимо сравнить полученное t значение с t-критическим.

• Если t больше , то выборки различаются. ( )

• Если t меньше , то выборки не различаются.

Пример

  t Значимост

ь

Потребность в

аффилиации

2,589 ,010

Потребность в

безопасности

,118 ,906

Потребность в общении 4,534 ,000

tкр = 1.9640 при p = 0,05 Если t больше , то выборки различаются. ( )

Если t меньше , то выборки не различаются.

U-критерий

• По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных и . • Если полученное значение U меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза).

• Если же полученное значение U больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U.

Пример

SPSS Excel

  U-

крите

рий

Уровен

ь

значим

ости

«звезды

»

153,00

0

0,0001

«отверга

емые»

102,00

0

0,0003

«адекват

ные»

93,000 0,0002Критическим значением Uэмп для n=30 при p<0,05  является 64,000

Корреляционный анализ

Определение

•Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.

• Выборочный коэффициент корреляции обозначается - r

Коэффициент корреляции

•Коэффициент корреляции изменяется на отрезке от –1 до +1. • Если между переменными существует сильная положительная связь, то значение r будет близко к +1. • Если между переменными существует сильная отрицательная связь, то значение r будет близко к –1. •Когда между переменными нет линейной связи или она очень слабая, значение r будет близко к 0.

Интерпретация коэффициента корреляции

Значение r Уровень связи между переменными

• 0,75 – 1.00 Очень высокая положительная• 0,50 – 0.74 Высокая положительная• 0,25 – 0.49 Средняя положительная• 0,00 – 0.24 Слабая положительная• 0,00 – -0.24 Слабая отрицательная• -0,25 – -0.49 Средняя отрицательная• -0,50 – -0.74 Высокая отрицательная• -0,75 – -1.00 Очень высокая отрицательная

Корреляция и причинная связь

Когда проверка гипотезы показывает, что существует значимая линейная связь между переменными, исследователь должен рассмотреть возможные виды связи между переменными и выбрать ту, которая диктуется логикой исследования.

Пять видов связи между переменными

1. Прямая причинно-следственная связь2. Обратная причинно-следственная связь 3. Связь вызвана третьей (скрытой)

переменной 4. Взаимосвязь вызвана несколькими

скрытыми переменными5. Связи нет, наблюдаемая зависимость

случайна

1. Прямая связь

Прямая причинно-следственная связь между переменными (переменная х определяет значение переменной у).

•Наличие воды ускоряет рост растений. • Яд вызывает смерть. • Температура воздуха прямо влияет на скорость таяния льда.

2. Обратная связь

Обратная причинно-следственная связь между переменными (переменная у определяет значение переменной х).

•Исследователь может думать, что чрезмерное потребление кофе вызывает нервозность. Но, может быть, очень нервный человек выпивает кофе, чтобы успокоить свои нервы?

3. Связь определена третьей переменной

Связь между переменными может быть вызвана третьей переменной.

•Исследователь установил, что существует некая зависимость между числом утонувших людей и числом выпитых безалкогольных напитков в летнее время. А может быть, обе переменные связаны с жарой и потребностью людей во влаге?

4. Несколько переменных

Взаимосвязь может быть определена несколькими скрытыми переменными. •Исследователь может обнаружить значимую связь между оценками студентов в университете и оценками в школе. Но, возможно, действуют и другие переменные: IQ, количество часов занятий, влияние родителей, мотивация, возраст, авторитет преподавателей.

5. Зависимость случайна•Исследователь может найти значимую зависимость между увеличением количества людей, которые занимаются спортом и увеличением количества людей, которые совершают преступления. Но здравый смысл говорит, что любая связь между этими двумя переменными должна быть случайной.

Пример использования

• На основании данных корреляционного анализа показателей испытуемых с ОНР выявлена статически значимая связь между мотивацией достижения и мотивацией к обучению, а также мотивацией взаимодействия с окружающими и стремлением к лидерству; мотивацией достижения и ЗАН.

  Мотивация к логопедическим занятиям

Мотивация достижения

Мотивация к обучению

Мотивация к взаимодействию с окружающими

Мотивация к лидерству

ЗАН

Мотивация к логопедическим занятиям

  ,347* ,305* ,219* ,085 ,023

Мотивация достижения

,347*   ,318* ,321* ,226* ,296*

Мотивация к обучению

,305* ,318*   ,167* -,026 -,011

Мотивация к взаимодействию с окружающими

,219* ,321* ,167*   ,299* ,247*

Мотивация к лидерству

,085 ,226* -,026 ,299*   ,242*

ЗАН ,023 ,296* -,011 ,247* ,242*  

Пример корреляционной

плеяды

top related