Название: Математические методы в психологии - Л. С. Титкова

Жанр: Психология

Рейтинг:

Просмотров: 3037

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 |




1.5. Статистические критерии

″Статистический   критерий  –  это  решающее  правило,  обеспечивающее   надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью″ (Суходольский Г.В.). Статистические критерии обозначают также метод расчета  определенного числа и само это число.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, в некоторых критериях придерживаются противоположного правила. Эти правила оговариваются в описании каждого критерия.

В   некоторых   случаях   расчетная   формула   критерия   включает   в   себя   количество наблюдений в исследуемой выборке, обозначаемое как n. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице определяется, какому уровню статистической значимости различий соответствует данная эмпирическая величина.

В большинстве случаев, одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в выборке (n) или от так называемого количества степеней свободы, которое обозначается как ν.

Число степеней свободы. Число степеней свободы равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относятся: объем выборки, средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и

подсчитали количество наблюдений в каждой ячейке классификации, то мы получаем так называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его формировании – объем выборки n.

Допустим у нас три класса: ″Умеет работать на ПК – умеет выполнять лишь определенные операции – не умеет работать″.

Выборка состоит из 50 человек. Если в первом классе – 20 человек, во втором классе – 20

человек, то в третьем должны оказаться 10 человек. Мы ограничены только одним условием –

объемом выборки. Мы не свободны в определении количества испытуемых в третьем классе,

″свобода″ простирается только на первые два класса

ν=с-1=3-1=2

Аналогичным образом, если бы у нас была классификация из 10 разрядов или классов, то мы были бы свободны только в 9 и т.д.

Зная n и/или число степеней свободы, по специальным таблицам можно определить критические значения критерия и сопоставить с ними полученное эмпирическое значение.

Среди возможных статистических критериев выделяют: односторонние и двусторонние,

параметрические и непараметрические, более и менее мощные.

Односторонние и двусторонние. Понятие одностороннего либо двустороннего критерия

связано с формулировкой гипотез. Если ″нулевая″ гипотеза формулируется о равенстве (Х1 = Х2), то для проверки используется двусторонний критерий. Если же ″нулевая″ гипотеза формулируется о неравенстве, то возможны три варианта:

1)   если Х1≠Х2, то используется двусторонний критерий;

2)   если Х1Х2 или Х1Х2, то односторонний критерий.

Параметрические критерии – это некоторые функции от параметров совокупности, они

служат  для  проверки гипотез  об  этих  параметрах или  для  их  оценивания. Параметрические

критерии включают в формулу расчета параметры распределения, т.е. средние и дисперсии.

Непараметрические критерии – это некоторые функции от функций распределения или непосредственно  от   вариационного  ряда   наблюдавшихся  значений  изучаемого  случайного явления. Они служат только для проверки гипотез о функциях распределения или рядах наблюдавшихся значений.

Непараметрические критерии не включают в формулу расчета параметров распределения и основанные на оперировании частотами или рангами.

И те, и другие критерии имеют свои преимущества и недостатки.

Параметрические  критерии могут оказаться несколько более мощными, чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. Лишь с некоторой натяжкой мы можем считать данные, представленные в стандартизованных оценках, как интервальные. Кроме того, проверка распределения «на нормальность» требует достаточно сложных расчетов, результат которых заранее не известен.

Может оказаться, что распределение признака отличается от нормального, и нам так или

иначе все равно придется обратиться к непараметрическим критериям.

Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном – с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака.

Уровни статистической значимости. Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.

Когда мы указываем, что различия достоверны на 5% уровне значимости, или при р≤0,05,

то мы имеем ввиду, что вероятность того, что они недостоверны, составляет 0,05.

Если же мы указываем, что различия достоверны на 1% уровне значимости, или при р≤0,01, то имеем ввиду, что вероятность того, что они все-таки недостоверны равна 0,01.

Иначе, уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна.

Вероятность такой ошибки обычно обозначается как α. Поэтому правильнее указывать уровень значимости: α≤0,05 или α≤0,01.

Если вероятность ошибки – это α, то вероятность правильного решения равна: 1–α. Чем меньше α, тем больше вероятность правильного решения.

В  психологии  принять  считать  низшим  уровнем  статистической  значимости  5%-ный

уровень, а достаточным 1%-ный. В таблицах критических значений обычно приводятся значения критериев,  соответствующих  уровням  значимости  р≤0,05  и  р≤0,01  иногда  для  р≤0,001.  Для некоторых критериев в таблицах указан точный уровень значимости их разных  эмпирических значений. Например, для значения критерия Фишера ϕ=1,56 р=0,06.

До  тех  пор  пока  уровень  значимости  не  достигнет  р=0.05,  мы  еще  не  имеем  право отклонить нулевую гипотезу. Будем придерживаться следующего правила отклонения гипотезы

об отсутствии различий (Н0) и принятии гипотезы о статистической достоверности различий (Н1).

Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.

 

 

Для облегчения принятия решения можно вычерчивать ″ось значимости″.

Критические  значения  критерия  обозначены  как  Q0,05   и  Q0,01,  эмпирическое  значение критерия как Qэмп. Оно заключено в эллипс.

Вправо от критического значения Q0,01  простирается ″зона значимости″ – сюда попадают эмпирические значения Q, которые ниже Q0.01 и, следовательно, значимые.

Влево от критического значения Q0.05 простирается ″зона незначимости″, – сюда попадают эмпирические значения Q, которые ниже Q0,05 и, следовательно, незначимы.

В нашем примере, Q0,05 =6; Q0,01=9; Qэмп=8.

Эмпирическое  значение  критерия  попадает  в  область  между  Q0,05   и  Q0,01.  Это  ″зона

неопределенности″: мы уже можем отклонить гипотезу о недостоверности различий (Н0), но еще не можем приять гипотезы об их достоверности (Н1).

Практически, можно считать достоверными уже те различия, которые не попадают в зону

незначимости, сказав, что они достоверны при р≤0,05.

Мощность  критерия.  Важнейшей  характеристикой любого  статистического критерия является его мощность.

Мощность критерия – это его способность выявлять различия, если они есть. Иначе, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Вероятность ошибки второго рода статистического критерия обозначим как β, тогда величина 1–β будет мощностью критерия. Ясно, что мощность может принимать любые значения от 0 до 1. Чем ближе мощность к единице, тем эффективнее критерий.

Мощность определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать.

Основанием для выбора критерия может быть не только его мощность, но и другие его характеристики, а именно:

а) простота;

б) более широкий диапазон исследования (по отношению к данным, определенным по номинативной шкале, или по отношению к большим n);

в) применимость по отношению к неравным по объему выборкам;

г) большая информативность результатов.




Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 |

Оцените книгу: 1 2 3 4 5

Добавление комментария: