T статистика отрицательная. Определение достоверности различий по t - критерию Стьюдента

В большинстве случаев для сравнения средних значений двух независимых выборок (с. 91) применяют критерий Стью­дента. Так как критерий Стьюдента относится к параметриче­ским, его использование возможно только в том случае, когда ре­зультаты исследования представлены в виде измерений по шкале отношений (с. 90).

Критерий Стьюдента обозначается t и вычисляется по фор­муле*:

t = х1 – x2 / √ m1² + m2²

В случаях, когда число наблюдений (n) более 500, уровень значимости при р = 0,05 достигается при t = 1 ,96, уровни значи­мости при р = 0,01 или р = 0,001, соответственно достигаются при t = 2,59 и t = 3,29.

Если число наблюдений менее 500, необходимая величина t для различных уровней значимости определяется по таблице 10.

Прежде чем обратиться к таблице, необходимо определить число степеней свободы. Этим термином называют число неза­висимых величин, участвующих в образовании того или иного параметра (f). Правила определения степеней свободы представ­лены в различных пособиях по математической статистике (Ю.К. Демьяненко, 1968). При вычислении критерия Стьюдента t общее число степеней свободы (f) будет равно n1 + n2 - 2.

Так, например, при сравнении результатов, показанных лыжниками экспериментальной и контрольной групп в прохож­дении контрольной дистанции получены следующие данные: средний показатель в экспериментальной группе (n = 12 чело­век) составил х = 34,6 сек, ошибка среднего значения m = 0,47 сек; в контрольной группе (n = 14 человек) эти данные были, со­ответственно, х = 37,3 сек, m = 0,49 сек.

Подставив значения в формулу, получаем значение t.

t = 37,3 - 34,6 / √ V 0,49 2 + 0,47 2 = 2,7 / 0,68 = 3,97

После определения числа степеней свободы (f =12 + 14 - 2 = 24) по таблице находим значение t. Полученное значение 3,97 превышает табличное значение для 99% доверительного уровня. Значит, мы можем утверждать, что между результатами двух сравниваемых групп существуют достоверные различия при уровне значимости р < 0,01.



При сравнительно больших числах измерений условно при­нято считать, что если разница между средними арифметиче­скими показателями равна или больше трех своих ошибок, разли­чия считаются достоверными. В этом случае достоверность раз­личий определяется по следующему уравнению:

Х Э -Х К >3√ mэ + mк ²

В приведенном примере велось сравнение результатов зани­мающихся разных групп, то есть независимых выборок. В случае, когда сравниваются результаты, полученные в начале и конце эксперимента в одной и той же группе, то есть при зависимых вы­борках, вычислить критерий Стьюдента по обычной формуле нельзя . Критерий Стьюдента в этом случае должен вычисляться по формуле:

t = Х 1 -Х 2 / m1 ² + m2² - 2rm1 m2

где r - коэффициент корреляции между начальными и конечными резуль­татами по изучаемому признаку.

Таблица 10

Граничные значения t(критерий Стьюдента)

f Доверительные уровни (Р)
95% . 99% 99,9%
12,71 63.60
4.30 9.93 31.60
3.18 5.84 12.94
2.78 4.60 8.61
2.57 4.03 6.86
2.45 3.71 5.96
2.37 3.50 5.41
2.31 3.36 5,04
2.26 3.25 4.78
2.23 3.17 4.59
П 2.20 3.11 4.44
2.18 3.06 4.32
1.16 3.01 4.22
2.15 2,98 4,14
2.13 2.95 4.07
2.12 2,92 4.02
2.11 2.90 3.97
2.10 2.88 3.92
2.09 2.86 3.88
2.09 2.85 3.85
2.08 2,83 3.82
2.07 2.82 3.79
2.07 2.81 3,77
2.06 2.80 3.75
2,06 2.79 3.73
2.06 2.78 3.71
2.05 2.77 3.69
2.05 2.76 3.67
2.04 2.76 3.66
2.04 2,75 " 3.65
2.02 2,70 3.55
2.01 2.68 3,50
2.00 2.66 3.46
1.99 2.64 3.42
1.98 2.63 3.39
1.98 2,62 3.37
1.97 2.60 3.34
1.96 2,59 3.31
оо 1.96 2.59 3.29
Уровни значимости (р)
0,05 0,01 0,001

Формулирование выводов

(заключение)

В конце работы делаются выводы. Формулирование выводов, наряду с формулированием введения, является одним из самых сложных и ответственных этапов оформления любой курсовой работы.

В выводах необходимо отразить наиболее существенные результаты исследования.

Существуют несколько распространенных ошибок при формулировании выводов. Часто студент строит предложение так, что оно звучит как декларация о результатах проделанной им работы («изучено», «разработано» и т.п.). Например:

«В ходе исследования были определены основные положения экспериментальной методики…» или «Выделены показатели, позволя­ющие оценивать коммуникативные умения студентов педагогических специальностей по осуществлению физкультурно-оздоровительной работы со школьниками…».

Чтобы изложенное являлось выводами, фразы следовало построить примерно так: «Сформулированные нами положения экспериментальной методики позволяют…» и, соответственно: «Из выделенных показателей наиболее информативными, позволяющими оценивать уровень коммуникативных умений студентов педагогических специальностей , являются...»

Другой распространенной ошибкой является утверждение студентом в выводе чего-то очевидного, для констатации которого не требуется проводить специального исследования. Например:

«На занятиях физическими упражнениями со школьниками необходимо учитывать особенности развития подростка этого возраста».

Иногда вывод оказывается, вовсе бессо­держательным. Таким обычно бывает первый вывод, который студент делает на основе анализа литературы. Например:

«Анализ научно-методической литературы показал, что в теории физического воспитания вопрос об использовании тренажеров в спортивной подготовке пловцов еще не полностью раскрыт».

Выводы должны информативно отражать проделанную студентом работу, но не должны быть многословными.


ТРЕБОВАНИЯ К ОФОРМЛЕНИЮ

КУРСОВЫХ РАБОТ

В выпускной квалификационной работе должны быть представлены следующие структурные компоненты:

· титульный лист ;

· введение;

· основной текст (глава 1, глава 2);

· выводы (заключение);

· список литературы;

· приложения (если в них имеется необходимость).

Оптимальный объем курсовой работы составляет 40-50 страниц машинописного текста через 1,5 интервала (включая рисунки, таблицы, графики, список литературы и приложения).

Размер шрифта 14 Times New Roman.

Работа оформляется в компьютерном или рукописном виде (второй вариант менее желателен).

В компьютерном варианте текст работы печатается через полтора интервала на одной стороне стандартного листа бумаги форматом А4 (210x297 мм). Поля страницы работы должны иметь следующие размеры: левое - 30 мм, правое -10 мм, верхнее - 20 мм, нижнее - 25 мм.

Таблицы, рисунки, чертежи, схемы, графики должны быть выполнены на стандартных листах форматом А4 (210x297 мм). Подписи и пояснения должны быть с лицевой стороны.

Все страницы выпускных аттестационных работ, включая иллюстрации и приложения, нумеруются по порядку от титульного листа до последней страницы без пропусков и повторений. Первой страницей считается титульный лист, на ней цифра "1" не ставится, на следующей странице ставится цифра "2" и т.д. Порядковый номер ставится в середине нижнего поля страницы.

Весь материал выпускных аттестационных работ в соответствии с оглавлением (планом) разделяется на параграфы. Наименование параграфов должно соответствовать содержанию и печататься в виде заголовка строчными буквами без подчеркивания.

В работе допустимы стандартные общепринятые сокращения типа "и т.д.", "и т.п.", "и др." "и проч.", "см.", "стр."

Образец оформления таблиц и иллюстраций дан в Приложении 3.

Титульный лист

Титульный лист- это информация о работе. На нем указывается название учреждения, где выполнялась работа; фамилия, имя, отчество ав­тора; название; фамилия, имя, отчество, ученая сте­пень и ученое звание научного руководителя (консультанта); город, год. Вид титульного листа выпускных аттестационных работ представлен на рисунке 1.

Федеральное государственное автономное образовательное учреждение

Высшего образования

«Нижегородский государственный университет им. Н.И. Лобачевского»

Арзамасский филиал

Естественно-географический факультет

Кафедра физической культуры

Курсовая работа по дисциплине

«Теория и методика физической культуры»

на тему:

"Методические особенности физкультурно-оздоровительных занятий

с детьми дошкольного возраста"

Выполнил:

Иванов А.В.,

студент(ка) направления 034300 (49.03.01)

Физическая культура

профиль «Менеджмент в сфере

физической культуры»

форма обучения – заочная

(полный срок обучения /

ускоренная программа обучения)

1 (2) курс обучения, группа 11(12)

Научный руководитель:

к.п.н., доцентСидорова Т.В.

Арзамас

Рис. 1. Образец титульного листа курсовой работы

В выпускных аттестационных работах используется слово «оглавление», а не «содержание». Оглавление – это указатель рубрик (глав) единого произведения, в то время как содержание – это указатель заглавий различных произведений, включенных в издание. С точки зрения культуры чтения оглавление размещается в начале работы: читающий именно с оглавления начинает знакомство с исследованием.

При оформлении оглавления необходимо каждый подчиненный заголовок располагать с отступом вправо от предшествующего основного заголовка, к которому он относится, располагая первую цифру под заглавной буквой заголовка, к которому он непосредственно относится. Все заголовки равной ступени следует начинать от одной вертикальной линии. Подобное построение плана позволяет четко видеть соподчиненность всего материала. Например:

Введение. . . . . . . . . . . . . . . . . . . . . . . .. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Проблема формирования у студентов знаний с целью повышения у них мотивации к занятиям физическими упражнениями. . . . ………….. . . .
1. Физическая культура студентов на современном этапе. . . . .………...
1.11.1 Изменение приоритетов в занятиях студентов физическими упражнениями в 20-90-х годах. . . . . . . . ………..
1.1 1.2 Направленность современного образования студентов в области физической культуры. . . . . . . . …………
2. Формирование мотивации студентов к занятиям физическими упражнениями. . . . . . . . . . . . . . . . . . . . ………
2.12.2 Отношение студентов к занятиям физическими упражнениями.
Заключение…………………………………………………………………… . 14
Список литературы………………………………………………………………
Приложения

Для того чтобы сделать отступы в оглавлении одинаковыми и выровнять номера страниц, целесообразно использовать формат таблицы, линии которой задать в параметрах невидимыми.

В выпускных аттестационных работах большое значение имеет рубрикация текста. Рубрики раскрывают строение текста, показывают связь и взаимозависимость разделов и подразделов.

Заголовки параграфов должны точно отражать содержание относящегося к ним текста. Они не должны сокращать или расширять объем смысловой информации, которая в них заключена.

Заголовки параграфов и подпараграфов располагаются посередине отдельной строки и печатаются полужирным прямым шрифтом, строчными буквами, кроме первой – заглавной (рис. 2).

1.1. Понятие об осанке

Рис. 2. Образец оформления названия параграфа

Заголовок отделяется от идущего за ним текста одним интервалом (одним непечатным символом), а от предшествующего текста – двумя интервалами (двумя непечатными символами, стоящими друг под другом). Заголовок не может быть последней строчкой на странице.

Абзацный отступ выставляется через опции «Формат» ® «Абзац» ® «Отступы и интервалы» ® «Первая строка» ® «Отступ» ® 1,25 см (1,27 см). Ударом клавиши абзацный отступ не выставляется!

Выделения шрифтом

Соподчинение содержания внутри параграфа, разграничение частей и элементов текста по значимости оформляется при помощи выделения шрифтом (другой насыщенности, с наклоном штрихов букв, в разрядку).

В научных работах принято использовать соподчинение шрифтов (табл. 11).

Эквивалентным подходом к интерпретации результатов теста будет следующий: допустив, что нулевая гипотеза верна, мы можем рассчитать, насколько велика вероятность получить t -критерий, равный или превышающий то реальное значение, которое мы рассчитали по имеющимся выборочным данным. Если эта вероятность оказывается меньше, чем заранее принятый уровень значимости (например, Р < 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Предположим, у нас имеются данные по суточному потреблению энергии, поступающей с пищей (кДж/сутки), для 11 женщин (пример заимствован из книги Altman D. G. (1981) Practical Statistics for Medical Research , Chapman & Hall, London ):


Среднее значение для этих 11 наблюдений составляет:


Вопрос: отличается ли это выборочное среднее значение от установленной нормы в 7725 кДж/сутки? Разница между нашим выборочным значением и этим нормативом довольно прилична: 7725 - 6753.6 = 971.4. Но насколько велика эта разница статистически? Ответить на этот вопрос поможет одновыборочный t -тест. Как и другие варианты t -теста, одновыборочный тест Стьюдента выполняется в R при помощи функции t.test() :


Вопрос: различаются ли эти средние значения статистически? Проверим гипотезу об отсутствии разницы при помощи t -теста:

Но как в таких случаях оценить наличие эффекта от воздействия статистически? В общем виде критерий Стьюдента можно представить как

Метод позволяет проверить гипотезу о том, что средние значения двух ге-неральных совокупностей, из которых извлечены сравниваемые зависимые вы-борки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воз-действия и после него. В общем же случае каждому представителю одной вы-борки поставлен в соответствие представитель из другой выборки (они по-парно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 — мужья, вы-борка 2 — их жены; выборка 1 — годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.

Проверяемая статистическая гипотеза, как и в предыдущем случае, Н 0: М 1 = М 2 (средние значения в выборках 1 и 2 равны). При ее отклонении принимается альтернативная гипотеза о том, что М 1 больше (меньше) М 2 .

Исходные предположения для статистической проверки:

Каждому представителю одной выборки (из одной генеральной совокупно-сти) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);

Данные двух выборок положительно коррелируют (образуют пары);

Распределение изучаемого признака и в той и другой выборке соответству-ет нормальному закону.

Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).

Ограничения: распределения признака и в той, и в другой выборке должно суще-ственно не отличаться от нормального; данные двух измерений, соответству-ющих той и другой выборке, положительно коррелируют.

Альтернативы: критерий Т-Вилкоксона , если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок — если данные для двух выборок не корре-лируют положительно.

Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений при-знака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность d i = х 1 i - x 2 i .

где M d - средняя разность значений; σ d - стандартное отклонение разностей.

Пример расчета:

Предположим, в ходе проверки эффективности тренинга каждому из 8 членов груп-пы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» — дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 — никогда, 5 — в половине случаев, 10 — всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).


Таблица 3

Среднее арифметической для разности M d = (-6)/8 = -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).

Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d. Подставляем все нужные значения, получаем:

σ d = = 0,886.

Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя раз-ность M d = -0,75; стандартное отклонение σ d = 0,886; t э = 2,39; df = 7.

Шаг 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится меж-ду критическими для р = 0,05 и р — 0,01. Следовательно, р < 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Шаг 3. Принимаем статистическое решение и формулируем вывод. Статистичес-кая гипотеза о равенстве средних значений отклоняется. Вывод: показатель само-оценки конформизма участников после тренинга увеличился статистически досто-верно (на уровне значимости р < 0,05).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера . Иногда этот метод приводит к ценным содержатель-ным выводам, а в случае сравнения средних для независимых выборок срав-нение дисперсий является обязательной процедурой.

Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.

Сравнение дисперсий . Метод позволяет проверить гипотезу о том, что дисперсии двух генераль-ных совокупностей, из которых извлечены сравниваемые выборки, отлича-ются друг от друга. Проверяемая статистическая гипотеза Н 0: σ 1 2 = σ 2 2 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.

Исходные предположения : две выборки извлекаются случайно из разных ге-неральных совокупностей с нормальным распределением изучаемого признака.

Структура исходных данных: изучаемый признак измерен у объектов (ис-пытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.

Ограничения: распределения признака и в той, и в другой выборке суще-ственно не отличаются от нормального.

Альтернатива методу: критерий Ливена (Levene"sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).

Формула для эмпирического значения критерия F-Фишера:

(4)

где σ 1 2 большая дисперсия, a σ 2 2 — меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если F э > F Kp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример расчета:

Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а ос-тальным — обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного за-дания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекват-ность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н 0: σ 1 2 = σ 2 2).

Были получены следующие данные:

Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):

Шаг 2. По таблице критических значений критерия f-Фишера для ненаправлен-ных альтернатив находим критическое значение для df числ = 11; df знам = 11. Однако критическое значение есть только для df числ = 10 и df знам = 12. Боль-шее число степеней свободы брать нельзя, поэтому берем критическое значение для df числ = 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.

Шаг 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем бо-лее — для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следователь-но, после сообщения о неудаче неадекватность самооценки выше, чем после сооб-щения об удаче.

Метод позволяет проверить гипотезу о том, что средние значения двух ге­неральных совокупностей, из которых извлечены сравниваемые зависимые вы­борки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воз­действия и после него. В общем же случае каждому представителю одной вы­борки поставлен в соответствие представитель из другой выборки (они по­парно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 - мужья, вы­борка 2 - их жены; выборка 1 - годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.

Проверяемая статистическая гипотеза, как и в предыдущем случае, Н 0: М 1 = М 2 (средние значения в выборках 1 и 2 равны).При ее отклонении принимается альтернативная гипотеза о том, что М 1 больше (меньше) М 2 .

Исходные предположения для статистической проверки:

□ каждому представителю одной выборки (из одной генеральной совокупно­сти) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);

□ данные двух выборок положительно коррелируют (образуют пары);

□ распределение изучаемого признака и в той и другой выборке соответству­ет нормальному закону.

Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).

Ограничения: распределения признака и в той, и в другой выборке должно суще­ственно не отличаться от нормального; данные двух измерений, соответству­ющих той и другой выборке, положительно коррелируют.

Альтернативы: критерий Т-Вилкоксона, если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок - если данные для двух выборок не корре­лируют положительно.

Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений при­знака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность d i = х 1 i - x 2 i .

(3) где M d – средняя разность значений; σ d – стандартное отклонение разностей.

Пример расчета:

Предположим, в ходе проверки эффективности тренинга каждому из 8 членов груп­пы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» - дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 - никогда, 5 - в половине случаев, 10 - всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).

Таблица 3

Среднее арифметической для разности M d = (-6)/8= -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).

Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d.Подставляем все нужные значения, получаем

σ d = = 0,886.

Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя раз­ность M d = -0,75; стандартное отклонение σ d = 0,886; t э = 2,39; df = 7.

Ш а г 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится меж­ду критическими для р = 0,05 и р - 0,01. Следовательно, р < 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Ш а г 3. Принимаем статистическое решение и формулируем вывод. Статистичес­кая гипотеза о равенстве средних значений отклоняется. Вывод: показатель само­оценки конформизма участников после тренинга увеличился статистически досто­верно (на уровне значимости р < 0,05).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера. Иногда этот метод приводит к ценным содержатель­ным выводам, а в случае сравнения средних для независимых выборок срав­нение дисперсий является обязательной процедурой.

Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.

Сравнение дисперсий . Метод позволяет проверить гипотезу о том, что дисперсии двух генераль­ных совокупностей, из которых извлечены сравниваемые выборки, отлича­ются друг от друга. Проверяемая статистическая гипотеза Н 0: σ 1 2 = σ 2 2 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.

Исходные предположения : две выборки извлекаются случайно из разных ге­неральных совокупностей с нормальным распределением изучаемого признака.

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.

Ограничения: распределения признака и в той, и в другой выборке суще­ственно не отличаются от нормального.

Альтернатива методу: критерий Ливена (Levene"sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).

Формула для эмпирического значения критерия F-Фишера:

(4)

где σ 1 2 - большая дисперсия, a σ 2 2- меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если F э > F Kp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример расчета:

Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а ос­тальным - обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного за­дания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекват­ность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н 0: σ 1 2=σ 2 2).

Были получены следующие данные:


Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):

Шаг 2. По таблице критических значений критерия f-Фишера для ненаправлен­ных альтернатив находим критическое значение для df числ = 11; df знам = 11. Однако критическое значение есть только для df числ = 10 и df знам = 12. Боль­шее число степеней свободы брать нельзя, поэтому берем критическое значение для df числ = 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.

Ш а г 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем бо­лее - для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следователь­но, после сообщения о неудаче неадекватность самооценки выше, чем после сооб­щения об удаче.

/ практикум-статистика / справочные материалы / значения t-критерия стьюдента

Значение t -критерия Стьюдента при уровне значимости 0,10, 0,05 и 0,01

ν – степени свободы вариации

Стандартные значения критерия Стьюдента

Число степеней свободы

Уровни значимости

Число степеней свободы

Уровни значимости

Таблица XI

Стандартные значения критерия Фишера, используемые для оценки достоверности различий между двумя выборками

Степени свободы

Уровень значимости

Степени свободы

Уровень значимости

t-Критерий Стьюдента

t-критерий Стьюдента - общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

t -статистика строится обычно по следующему общему принципу: в числителе случайная величина с нулевым математическим ожиданием (при выполнении нулевой гипотезы), а в знаменателе - выборочное стандартное отклонение этой случайной величины, получаемое как квадратный корень из несмешенной оценки дисперсии.

История

Данный критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Требование нормальности распределения данных является необходимым для точного t {\displaystyle t} -теста. Однако, даже при других распределениях данных возможно использование t {\displaystyle t} -статистики. Во многих случаях эта статистика асимптотически имеет стандартное нормальное распределение - N (0 , 1) {\displaystyle N(0,1)} , поэтому можно использовать квантили этого распределения. Однако, часто даже в этом случае используют квантили не стандартного нормального распределения, а соответствующего распределения Стьюдента, как в точном t {\displaystyle t} -тесте. Асимптотически они эквивалентны, однако на малых выборках доверительные интервалы распределения Стьюдента шире и надежнее.

Одновыборочный t-критерий

Применяется для проверки нулевой гипотезы H 0: E (X) = m {\displaystyle H_{0}:E(X)=m} о равенстве математического ожидания E (X) {\displaystyle E(X)} некоторому известному значению m {\displaystyle m} .

Очевидно, при выполнении нулевой гипотезы E (X ¯) = m {\displaystyle E({\overline {X}})=m} . С учётом предполагаемой независимости наблюдений V (X ¯) = σ 2 / n {\displaystyle V({\overline {X}})=\sigma ^{2}/n} . Используя несмещенную оценку дисперсии s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) {\displaystyle s_{X}^{2}=\sum _{t=1}^{n}(X_{t}-{\overline {X}})^{2}/(n-1)} получаем следующую t-статистику:

t = X ¯ − m s X / n {\displaystyle t={\frac {{\overline {X}}-m}{s_{X}/{\sqrt {n}}}}}

При нулевой гипотезе распределение этой статистики t (n − 1) {\displaystyle t(n-1)} . Следовательно, при превышении значения статистики по абсолютной величине критического значения данного распределения (при заданном уровне значимости) нулевая гипотеза отвергается.

Двухвыборочный t-критерий для независимых выборок

Пусть имеются две независимые выборки объемами n 1 , n 2 {\displaystyle n_{1}~,~n_{2}} нормально распределенных случайных величин X 1 , X 2 {\displaystyle X_{1},~X_{2}} . Необходимо проверить по выборочным данным нулевую гипотезу равенства математических ожиданий этих случайных величин H 0: M 1 = M 2 {\displaystyle H_{0}:~M_{1}=M_{2}} .

Рассмотрим разность выборочных средних Δ = X ¯ 1 − X ¯ 2 {\displaystyle \Delta ={\overline {X}}_{1}-{\overline {X}}_{2}} . Очевидно, если нулевая гипотеза выполнена E (Δ) = M 1 − M 2 = 0 {\displaystyle E(\Delta)=M_{1}-M_{2}=0} . Дисперсия этой разности равна исходя из независимости выборок: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 {\displaystyle V(\Delta)={\frac {\sigma _{1}^{2}}{n_{1}}}+{\frac {\sigma _{2}^{2}}{n_{2}}}} . Тогда используя несмещенную оценку дисперсии s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 {\displaystyle s^{2}={\frac {\sum _{t=1}^{n}(X_{t}-{\overline {X}})^{2}}{n-1}}} получаем несмещенную оценку дисперсии разности выборочных средних: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 {\displaystyle s_{\Delta }^{2}={\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}} . Следовательно, t-статистика для проверки нулевой гипотезы равна

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 {\displaystyle t={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{\sqrt {{\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}}}

Эта статистика при справедливости нулевой гипотезы имеет распределение t (d f) {\displaystyle t(df)} , где d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) {\displaystyle df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}}

Случай одинаковой дисперсии

В случае, если дисперсии выборок предполагаются одинаковыми, то

V (Δ) = σ 2 (1 n 1 + 1 n 2) {\displaystyle V(\Delta)=\sigma ^{2}\left({\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}\right)}

Тогда t-статистика равна:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 {\displaystyle t={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{s_{X}{\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}}~,~~s_{X}={\sqrt {\frac {(n_{1}-1)s_{1}^{2}+(n_{2}-1)s_{2}^{2}}{n_{1}+n_{2}-2}}}}

Эта статистика имеет распределение t (n 1 + n 2 − 2) {\displaystyle t(n_{1}+n_{2}-2)}

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t {\displaystyle t} -критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

T = M d s d / n {\displaystyle t={\frac {M_{d}}{s_{d}/{\sqrt {n}}}}}

где M d {\displaystyle M_{d}} - средняя разность значений, s d {\displaystyle s_{d}} - стандартное отклонение разностей, а n - количество наблюдений

Эта статистика имеет распределение t (n − 1) {\displaystyle t(n-1)} .

Проверка линейного ограничения на параметры линейной регрессии

С помощью t-теста можно также проверить произвольное (одно) линейное ограничение на параметры линейной регрессии, оцененной обычным методом наименьших квадратов. Пусть необходимо проверить гипотезу H 0: c T b = a {\displaystyle H_{0}:c^{T}b=a} . Очевидно, при выполнении нулевой гипотезы E (c T b ^ − a) = c T E (b ^) − a = 0 {\displaystyle E(c^{T}{\hat {b}}-a)=c^{T}E({\hat {b}})-a=0} . Здесь использовано свойство несмещенности МНК-оценок параметров модели E (b ^) = b {\displaystyle E({\hat {b}})=b} . Кроме того, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c {\displaystyle V(c^{T}{\hat {b}}-a)=c^{T}V({\hat {b}})c=\sigma ^{2}c^{T}(X^{T}X)^{-1}c} . Используя вместо неизвестной дисперсии её несмещенную оценку s 2 = E S S / (n − k) {\displaystyle s^{2}=ESS/(n-k)} получаем следующую t-статистику:

T = c T b ^ − a s c T (X T X) − 1 c {\displaystyle t={\frac {c^{T}{\hat {b}}-a}{s{\sqrt {c^{T}(X^{T}X)^{-1}c}}}}}

Эта статистика при выполнении нулевой гипотезы имеет распределение t (n − k) {\displaystyle t(n-k)} , поэтому если значение статистики выше критического, то нулевая гипотеза о линейном ограничении отклоняется.

Проверка гипотез о коэффициенте линейной регрессии

Частным случаем линейного ограничения является проверка гипотезы о равенстве коэффициента b j {\displaystyle b_{j}} регрессии некоторому значению a {\displaystyle a} . В этом случае соответстующая t-статистика равна:

T = b ^ j − a s b ^ j {\displaystyle t={\frac {{\hat {b}}_{j}-a}{s_{{\hat {b}}_{j}}}}}

где s b ^ j {\displaystyle s_{{\hat {b}}_{j}}} - стандартная ошибка оценки коэффициента - квадратный корень из соответствующего диагонального элемента ковариационной матрицы оценок коэффициентов.

При справедливости нулевой гипотезы распределение этой статистики - t (n − k) {\displaystyle t(n-k)} . Если значение статистики по абсолютной величине выше критического значения, то отличие коэффициента от a {\displaystyle a} является статистически значимым (неслучайным), в противном случае - незначимым (случайным, то есть истинный коэффициент вероятно равен или очень близок к предполагаемому значению a {\displaystyle a})

Замечание

Одновыборочный тест для математических ожиданий можно свести к проверке линейного ограничения на параметры линейной регрессии. В одновыборочном тесте это «регрессия» на константу. Поэтому s 2 {\displaystyle s^{2}} регрессии это и есть выборочная оценка дисперсии изучаемой случайной величины, матрица X T X {\displaystyle X^{T}X} равна n {\displaystyle n} , а оценка «коэффициента» модели равна выборочному среднему. Отсюда и получаем выражение для t-статистики, приведенное выше для общего случая.

Аналогично можно показать, что двухвыборочный тест при равенстве дисперсий выборок также сводится к проверке линейных ограничений. В двухвыборочном тесте это «регрессия» на константу и фиктивную переменную, идентифицирующую подвыборку в зависимости от значения (0 или 1): y = a + b D {\displaystyle y=a+bD} . Гипотеза о равенстве математических ожиданий выборок может быть сформулирована как гипотеза о равенстве коэффициента b этой модели нулю. Можно показать, что соответствующая t-статистика для проверки этой гипотезы равна t-статистике, приведенной для двухвыборочного теста.

Также к проверке линейного ограничения можно свести и в случае разных дисперсий. В этом случае дисперсия ошибок модели принимает два значения. Исходя из этого можно также получить t-статистику, аналогичную приведенной для двухвыборочного теста.

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна - Уитни. Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Литература

Student. The probable error of a mean. // Biometrika. 1908. № 6 (1). P. 1-25.

Ссылки

О критериях проверки гипотез об однородности средних на сайте Новосибирского государственного технического университета

Чаще всего в психологическом исследовании наблюдается задачи на выявление различий между двумя или более группами признаков. Выяснение таких различий на уровне средних арифметических рассмотрено в процедуре анализа первичных статистик. Однако возникает вопрос, насколько эти различия достоверны и можно ли их распространить (экстраполировать) на всю популяцию. Для решения этой задачи чаще всего используют (при условии нормального или близкого к нормальному распределению) t - критерий (критерий Стьюдента), который предназначен для выяснения, насколько достоверно отличаются показатели одной выборки испытуемых от другой (например, когда исследуемые получают в результате тестирования одной группы высшие баллы, чем представители другой). Это параметрический критерий, имеет две основные формы:

1) несвязанный (нечетная) t - критерий, предназначенный для того, чтобы выяснить, есть ли различия между оценками, полученными при использовании одного и того же теста для тестирования двух групп, сформированных из разных людей. Например, это может быть сравнение уровня интеллекта или нервно-психической устойчивости, тревожности успевающих и неуспевающих учеников или сравнение по этим признакам учеников разных классов, возрастов, социальных уровней и тому подобное. Могут быть и разнополые, разнонациональные выборки, а также подвыборки в исследуемых выборках, выделены по определенному признаку. Критерий называют "несвязанный", потому что сравниваемые группы сформированы из разных людей;

2) связан (парный) t - критерий, применяемый для сравнения показателей двух групп, между элементами которых существует специфическая связь. Это означает, что каждому элементу первой группы соответствует элемент второй группы, похожий на него по определенным параметром интересующей исследователя. Чаще всего сравнивают параметры одних и тех же лиц до и после определенного события или действия (например, в процессе проведения лонгитюдного исследования или формирующего эксперимента). Поэтому этот критерий используют для сравнения показателей одних и тех же лиц до и после обследования, эксперимента или истечении определенного времени.

Если данные не подлежат нормальному закону распределения, используют непараметрические критерии, эквивалентные t - критерия: критерий Манна - Уитни, эквивалентный нечетном t - критерия, и Двухвыборочный критерий Вилкоксона, эквивалентный парном t - критерия.

С помощью t - критериев и их непараметрических эквивалентов можно только сравнивать результаты двух групп, полученные с использованием одного и того же теста. Однако в некоторых случаях возникает необходимость сравнения нескольких групп или оценок нескольких видов. Это можно сделать поэтапно, разбив задачу на несколько пар сравнений (например, если надо сравнить группы А, Б и Y по результатам тестов X и Y, то можно с помощью t - критерия сначала сравнить группы А и Б по результатам теста X, затем А и Б по результатам теста В, А и В по результатам теста Х и т. д.). Однако это очень трудоемкий метод, поэтому прибегают к более сложному методу дисперсионного анализа.

Метод оценки достоверности различий средних арифметических по достаточно эффективным параметрическим критерием Стьюдента предназначен для решения одной из задач, чаще всего наблюдаются при обработке данных - выявление достоверности различий между двумя или более рядами значений. Такая оценка часто необходимо при сравнительном анализе полярных групп. их выделяют на основе различной выраженности определенной целевой признаки (характеристики) изучаемого явления. Как правило, анализ начинают с подсчета первичных статистик выделенных групп ", затем оценивают достоверность различий. Критерий Стьюдента вычисляют по формуле:

Значение критерия Стьюдента для трех уровней доверительной (статистической) значимости (р) приводят в справочниках по матстатистику. Количество степеней свободы определяют по формуле:

С уменьшением объемов выборок (n <10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Решение о достоверности различий принимают в том случае, если исчисленная величина t превышает табличное значение для определенного количества степеней свободы (d (v)). В публикациях или научных отчетах указывают высокий уровень значимости из трех: р <0,05; р <0,01; р <0,001.

При любом числового значения критерия достоверности различия между средними этот показатель оценивает не степень выявленной различия (ее оценивают по самой разницей между средними), а только его статистическую достоверность, то есть право распространять полученный на основе сопоставления выборок вывод о наличии разницы на все явление (весь процесс) в целом. Низкий исчисленный критерий отличия не может служить доказательством отсутствия различия между двумя признаками (явлениями), потому что его значимость (степень достоверности) зависит не только от величины средних, но и от количества сравниваемых выборок. Он указывает не на отсутствие различия, а на то, что при такой величины выборок она статистически недостоверная: очень большой шанс, что разница в этих условиях случайная, очень мала вероятность ее достоверности.

Таблица 2.17. Доверительные границы для критерия Стьюдента (t-критерий) для f степеней свободы

ния среднего времени выполнения задания во второй попытке (по сравнению с первой пробой) не является достоверным.

Это выражение не равносильно утверждению о статистической однородности двух выборок, которые сопоставляют. Кроме того, применение критерия Стьюдента в случае таких неодинаковых выборок не вполне корректное математически и, безусловно, сказывается на конечном итоге о недостоверности различий Хср = 9,1 и Хср = 8,5. Пользуясь этим критерием, оценивают не степень близости двух средних, а рассматривают отнесения или невод несения случайной (при заданном уровне значимости). .



 

Возможно, будет полезно почитать: