Как посчитать достоверность различий p в excel
Перейти к содержимому

Как посчитать достоверность различий p в excel

  • автор:

Функция СТЬЮДЕНТ.ТЕСТ

Возвращает вероятность, соответствующую t-тесту Стьюдента. Функция СТЬЮДЕНТ.ТЕСТ позволяет определить вероятность того, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.

Синтаксис

Аргументы функции СТЬЮДЕНТ.ТЕСТ описаны ниже.

  • Массив1 Обязательный. Первый набор данных.
  • Массив2 Обязательный. Второй набор данных.
  • Хвосты Обязательный. Число хвостов распределения. Если значение «хвосты» = 1, функция СТЬЮДЕНТ.ТЕСТ возвращает одностороннее распределение. Если значение «хвосты» = 2, функция СТЬЮДЕНТ.ТЕСТ возвращает двустороннее распределение.
  • Тип Обязательный. Вид выполняемого t-теста.

Параметры

Выполняемый тест

Двухвыборочный с равными дисперсиями (гомоскедастический)

Двухвыборочный с неравными дисперсиями (гетероскедастический)

Замечания

  • Если аргументы «массив1» и «массив2» имеют различное число точек данных, а «тип» = 1 (парный), то функция СТЬЮДЕНТ.ТЕСТ возвращает значение ошибки #Н/Д.
  • Аргументы «хвосты» и «тип» усекаются до целых значений.
  • Если хвосты или тип не являются числом, T.TEST возвращает #VALUE! (значение ошибки).
  • Если значение tails отличается от 1 или 2, функция T.TEST возвращает #NUM! (значение ошибки).
  • Функция СТЬЮДЕНТ.ТЕСТ использует данные аргументов «массив1» и «массив2» для вычисления неотрицательной t-статистики. Если «хвосты» = 1, СТЬЮДЕНТ.ТЕСТ возвращает вероятность более высокого значения t-статистики, исходя из предположения, что «массив1» и «массив2» являются выборками, принадлежащими к генеральной совокупности с одним и тем же средним. Значение, возвращаемое функцией СТЬЮДЕНТ.ТЕСТ в случае, когда «хвосты» = 2, вдвое больше значения, возвращаемого, когда «хвосты» = 1, и соответствует вероятности более высокого абсолютного значения t-статистики, исходя из предположения, что «массив1» и «массив2» являются выборками, принадлежащими к генеральной совокупности с одним и тем же средним.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу Enter. При необходимости измените ширину столбцов, чтобы видеть все данные.

Описание статистических функций CONFIDENCE в Excel

В этой статье описывается функция CONFIDENCE в Microsoft Office Excel 2003 и Microsoft Office Excel 2007, показано, как используется функция, а также сравниваются результаты функции для Excel 2003 и Excel 2007 с результатами достоверности в более ранних версиях Excel.

Значение доверительного интервала часто неправильно интерпретируется, и мы стараемся предоставить объяснение допустимых и недопустимых утверждений, которые можно сделать после определения значения ДОСТОВЕРНОСТИ из данных.

Дополнительные сведения

Функция CONFIDENCE(альфа, сигма, n) возвращает значение, которое можно использовать для создания доверительного интервала для среднего показателя по совокупности. Доверительный интервал — это диапазон значений, сосредоточенных на известном среднем примере. Предполагается, что наблюдения в выборке получены из нормального распределения с известным стандартным отклонением, сигмой, а количество наблюдений в выборке равно n.

Синтаксис

Как правило, альфа имеет небольшую вероятность, например 0,05.

Пример использования

Предположим, что оценки коэффициента интеллекта (IQ) соответствуют нормальному распределению со стандартным отклонением 15. Вы тестируете IQ для выборки из 50 учащихся в местном учебном заведении и получаете среднее значение выборки 105. Вы хотите вычислить 95-процентный доверительный интервал для среднего значения по совокупности. Доверительный интервал 95% или 0,95 соответствует альфа = 1 – 0,95 = 0,05.

Чтобы проиллюстрировать функцию CONFIDENCE, создайте пустой лист Excel, скопируйте следующую таблицу, а затем выберите ячейку A1 на пустом листе Excel. В меню Правка выберите команду Вставить.

Примечание: В Excel 2007 нажмите кнопку Вставить в группе Буфер обмена на вкладке Главная.

Записи в таблице ниже заполняют ячейки A1:B7 на листе.

Среднее значение образца

Вставив эту таблицу на новый лист Excel, нажмите кнопку Параметры вставки, а затем выберите Пункт Форматирование назначения.

После того как вставленный диапазон по-прежнему выбран, в меню Формат наведите указатель на пункт Столбец, а затем выберите пункт Автоподбор выбора.

Примечание: В Excel 2007 с выбранным диапазоном ячеек нажмите кнопку Формат в группе Ячейки на вкладке Главная, а затем выберите Пункт Автоподбор ширины столбца.

Ячейка A6 показывает значение CONFIDENCE. Ячейка A7 отображает то же значение, так как вызов CONFIDENCE(альфа, сигма, n) возвращает результат вычислений:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Не было внесено никаких изменений непосредственно в CONFIDENCE, но в Microsoft Excel 2002 была улучшена функция НОРМИНВ, а затем были внесены дополнительные улучшения между Excel 2002 и Excel 2007. Таким образом, функция CONFIDENCE может возвращать различные (и улучшенные) результаты в этих более поздних версиях Excel, так как функция CONFIDENCE использует НОРМИНВ.

Это не означает, что для более ранних версий Excel вы должны потерять доверие к ДОВЕРИЮ. Неточности в НОРМИНВ обычно имели место для значений аргумента , очень близких к 0 или очень близких к 1. На практике альфа обычно имеет значение 0,05, 0,01 или, возможно, 0,001. Значения альфа-значения должны быть гораздо меньше, чем, например, 0,0000001, прежде чем ошибки округления в НОРМИНВ, скорее всего, будут замечены.

Примечание: Обсуждение вычислительных различий в НОРМИНВ см. в статье о НОРМИНВ.

Для получения дополнительных сведений щелкните следующий номер статьи, чтобы просмотреть статью в базе знаний Майкрософт:

826772 Статистические функции Excel: НОРМИНВ

Интерпретация результатов достоверности

Файл справки Excel для CONFIDENCE был переписан для Excel 2003 и Excel 2007, так как во всех более ранних версиях файла справки давали неверные советы по интерпретации результатов. В примере сказано: «Предположим, что в нашей выборке из 50 пассажиров средняя продолжительность поездки на работу составляет 30 минут с стандартным отклонением численности населения 2,5. Мы можем быть уверены на 95 процентов, что среднее по численности находится в интервале 30 +/- 0,692951», где 0,692951 — это значение, возвращаемое CONFIDENCE (0,05, 2,5, 50).

В этом же примере вывод гласит: «Средняя продолжительность поездки на работу равна 30 ± 0,692951 минуты или от 29,3 до 30,7 минуты». Предположительно, это также утверждение о среднем значении популяции, попадающего в интервал [30 – 0,692951, 30 + 0,692951] с вероятностью 0,95.

Перед проведением эксперимента, который дал данные для этого примера, классический статистик (в отличие от байесовского статистика) не может сделать никаких утверждений о распределении вероятностей среднего значения совокупности. Вместо этого классический статистик занимается тестированием гипотез.

Например, классический статистик может захотеть провести двухстороничный тест гипотезы, основанный на предположении о нормальном распределении с известным стандартным отклонением (например, 2,5), конкретном предварительно выбранном значении среднего значения совокупности, μ0 и предварительно выбранном уровне значимости (например, 0,05). Результат теста будет основан на значении наблюдаемого среднего образца (например, 30), а гипотеза null о том, что среднее по совокупности равно μ0, будет отклонена на уровне значимости 0,05, если наблюдаемое среднее значение выборки слишком далеко от μ0 в любом направлении. Если гипотеза null отклонена, интерпретация заключается в том, что выборка означает, что далеко или дальше от μ0 произойдет случайно менее 5 % времени при предположении, что μ0 является истинным средним значением по совокупности. После проведения этого теста классический статистик по-прежнему не может сделать никаких утверждений о распределении вероятностей среднего значения совокупности.

Байесовский статистик, с другой стороны, будет начинаться с предполагаемого распределения вероятностей для среднего по совокупности (называется априорным распределением), будет собирать экспериментальные доказательства таким же образом, как классический статистик, и будет использовать это свидетельство для пересмотра своего или его распределения вероятностей для средней совокупности и тем самым получить распределение по задним лучам. Excel не предоставляет статистических функций, которые помогли бы байесовскому статистику в этом начинании. Статистические функции Excel предназначены для классических статистиков.

Доверительный интервал связан с тестами гипотез. Учитывая экспериментальные данные, доверительный интервал делает краткое утверждение о значениях гипотетизированной совокупности среднее μ0, что даст принятие нулевой гипотезы о том, что среднее значение популяции равно μ0, и значения μ0, которые придадут отклонение нулевой гипотезы, что среднее значение популяции равно м0. Классический статистик не может сделать никаких утверждений о вероятности того, что популяция падает в какой-либо конкретный интервал, потому что она или он никогда не делает априорных предположений об этом распределении вероятностей, и такие предположения потребуются, если бы кто-то использовал экспериментальные доказательства для их пересмотра.

Изучите связь между тестами гипотез и доверительными интервалами с помощью примера в начале этого раздела. В связи между ДОСТОВЕРНОСТЬЮ и НОРМИНВ, указанной в последнем разделе, вы можете:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Так как среднее значение выборки равно 30, доверительный интервал равен 30 +/- 0,692951.

Теперь рассмотрим двухстороннюю проверку гипотезы с уровнем значимости 0,05, как описано ранее, в котором предполагается нормальное распределение со стандартным отклонением 2,5, размер выборки 50 и определенное гипотетичное среднее значение генеральной совокупности, μ0. Если это истинное среднее по совокупности, то среднее выборка будет исходить из нормального распределения со средним значением популяции μ0 и стандартным отклонением 2,5/SQRT(50). Это распределение симметрично около μ0, и вы хотите отклонить гипотезу NULL, если ABS(среднее выборка — μ0) > некоторое значение отсечения. Значение отсечения было бы таким, что если бы μ0 было истинным средним значением по совокупности, значение среднего значения выборки — на 0 μ0 выше этого отсечения или значение μ0 — среднее значение выборки выше этого отсечения каждое из них с вероятностью 0,05/2. Это значение отсечения равно

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Поэтому отклоните гипотезу NULL (среднее число населения = μ0), если одно из следующих утверждений имеет значение true:

среднее значение выборки — μ0 > 0.
692951 0 — среднее значение выборки > 0. 692951

Так как в нашем примере значение sample среднее = 30, эти два оператора становятся следующими:

30 – μ0 > 0.
692951 μ0 – 30 > 0. 692951

Перезапись их таким образом, чтобы слева отображалось только значение μ0, вы дадут следующие инструкции:

μ0 < 30 –0.
692951 μ0 > 30 + 0. 692951

Это именно значения μ0, которые не находятся в доверительном интервале [30–0,692951, 30 + 0,692951]. Таким образом, доверительный интервал [30–0,692951, 30 + 0,692951] содержит те значения μ0, где гипотеза null о том, что среднее значение по совокупности равно м0, не будет отклонена с учетом образца доказательства. Для значений μ0 за пределами этого интервала гипотеза null о том, что среднее значение генеральной совокупности равно μ0, будет отклонена с учетом образца доказательства.

Выводы

Неточности в более ранних версиях Excel обычно встречаются для очень малых или очень больших значений p в НОРМИНВ(p). Достоверность оценивается путем вызова НОРМИНВ(p), поэтому точность НОРМИНВ является потенциальной проблемой для пользователей CONFIDENCE. Однако значения p, которые используются на практике, скорее всего, не будут достаточно экстремальными, чтобы вызвать значительные ошибки округления в НОРМИНВ, и производительность CONFIDENCE не должна беспокоить пользователей любой версии Excel.

Большая часть этой статьи сосредоточена на интерпретации результатов ДОСТОВЕРНОСТИ. Другими словами, мы спросили: «Каково значение доверительного интервала?» Доверительный интервал часто неправильно понимается. К сожалению, файлы справки Excel во всех версиях Excel, предшествующих Excel 2003, способствовали этому недоразумению. Файл справки Excel 2003 был улучшен.

Расчет критерия Стьюдента в Excell

Для того, чтобы рассчитать t-критерий Стьюдента (для зависимых и для независимых выборок) в Excell необходимо сделать следующие шаги:

1.Вносим значения для двух переменных в таблицу (Например Переменная 1 и Переменная 2)

2. Ставим курсор в пустую ячейку

3. На панеле инструментов нажимаем кнопку fx (вставить формулу)

4. В открывшемся окне «Мастер функций» в поле «Категории» выбираем Полный алфавитный перечень

5. Затем в поле «Выберите функцию» находим функцию TTECT, которая возвращает вероятность, соответствующую критерию Стьюдента.

5.1. Нажимаем Ок

6. В открывшемся окне «Аргументы функции» в поле Массив1 вносим номера ячеек, содержащие значения Переменной 1, в поле Массив2 вносим номера ячеек, содержащие значения Переменной2.

7. В поле «Хвосты» пишем 2 (критерий будет рассчитываться используя двустороннее распределение, как и в SPSS); либо 1 (критерий будет рассчитываться используя одностороннее распределение).

Важно!
8. В поле «Тип» пишем 1 (рассчитывается, если выборки зависимые); либо 2 или 3 (если выборки независимые).

9. Нажимаем Ок

10. Смотрим получившийся результат

t-критерий Стьюдента для проверки гипотезы о средней и расчета доверительного интервала в Excel

Проверка статистической гипотезы позволяет сделать строгий вывод о характеристиках генеральной совокупности на основе выборочных данных. Гипотезы бывают разные. Одна из них – это гипотеза о средней (математическом ожидании). Суть ее в том, чтобы на основе только имеющейся выборки сделать корректное заключение о том, где может или не может находится генеральная средняя (точную правду мы никогда не узнаем, но можем сузить круг поиска).

Распределение Стьюдента

Общий подход в проверке гипотез описан здесь, поэтому сразу к делу. Предположим для начала, что выборка извлечена из нормальной совокупности случайных величин X с генеральной средней μ и дисперсией σ 2 . Средняя арифметическая из этой выборки, очевидно, сама является случайной величиной. Если извлечь много таких выборок и посчитать по ним средние, то они также будут иметь нормальное распределение с математическим ожиданием μ и дисперсией

Тогда случайная величина

имеет стандартное нормальное распределение со всеми вытекающими отсюда последствиями. Например, с вероятностью 95% ее значение не выйдет за пределы ±1,96.

Однако такой подход будет корректным, если известна генеральная дисперсия. В реальности, как правило, она не известна. Вместо нее берут оценку – несмещенную выборочную дисперсию:

Возникает вопрос: будет ли генеральная средняя c вероятностью 95% находиться в пределах ±1,96s. Другими словами, являются ли распределения случайных величин

Впервые этот вопрос был поставлен (и решен) одним химиком, который трудился на пивной фабрике Гиннесса в г. Дублин (Ирландия). Химика звали Уильям Сили Госсет и он брал пробы пива для проведения химического анализа. В какой-то момент, видимо, Уильяма стали терзать смутные сомнения на счет распределения средних. Оно получалось немного более размазанным, чем должно быть у нормального распределения.

Собрав математическое обоснование и рассчитав значения функции обнаруженного им распределения, химик из Дублина Уильям Госсет написал заметку, которая была опубликована в мартовском выпуске 1908 года журнала «Биометрика» (главред – Карл Пирсон). Гиннесс строго-настрого запретил выдавать секреты пивоварения, и Госсет подписался псевдонимом Стьюдент.

Несмотря на то что, К. Пирсон уже изобрел распределение Хи-квадрат, все-таки всеобщее представление о нормальности еще доминировало. Никто не собирался думать, что распределение выборочных оценок может быть не нормальным. Поэтому статья У. Госсета осталась практически не замеченной и забытой. И только Рональд Фишер по достоинству оценил открытие Госсета. Фишер использовал новое распределение в своих работах и дал ему название t-распределение Стьюдента. Критерий для проверки гипотез, соответственно, стал t-критерием Стьюдента. Так произошла «революция» в статистике, которая шагнула в эру анализа выборочных данных. Это был краткий экскурс в историю.

Посмотрим, что же мог увидеть У. Госсет. Сгенерируем 20 тысяч нормальных выборок из 6-ти наблюдений со средней () 50 и среднеквадратичным отклонением (σ) 10. Затем нормируем выборочные средние, используя генеральную дисперсию:

Получившиеся 20 тысяч средних сгруппируем в интервалы длинной 0,1 и подсчитаем частоты. Изобразим на диаграмме фактическое (Norm) и теоретическое (ENorm) распределение частот выборочных средних.

Распределение средней арифметической

Точки (наблюдаемые частоты) практически совпадают с линией (теоретическими частотами). Оно и понятно, ведь данные взяты из одной и то же генеральной совокупности, а отличия – это лишь ошибки выборки.

Проведем новый эксперимент. Нормируем средние, используя выборочную дисперсию.

Снова подсчитаем частоты и нанесем их на диаграмму в виде точек, оставив для сравнения линию стандартного нормального распределения. Обозначим эмпирическое частоты средних, скажем, через букву t.

Отличие распределения средних от нормального закона

Видно, что распределения на этот раз не очень-то и совпадают. Близки, да, но не одинаковы. Хвосты стали более «тяжелыми».

У Госсета-Стьюдента не было последней версии MS Excel, но именно этот эффект он и заметил. Почему так получается? Объяснение заключается в том, что случайная величина

зависит не только от ошибки выборки (числителя), но и от стандартной ошибки средней (знаменателя), которая также является случайной величиной.

Давайте немного разберемся, какое распределение должно быть у такой случайной величины. Вначале придется кое-что вспомнить (или узнать) из математической статистики. Есть такая теорема Фишера, которая гласит, что в выборке из нормального распределения:

1. средняя и выборочная дисперсия s 2 являются независимыми величинами;

2. соотношение выборочной и генеральной дисперсии, умноженное на количество степеней свободы, имеет распределение χ 2 (хи-квадрат) с таким же количеством степеней свободы, т.е.

где k – количество степеней свободы (на английском degrees of freedom (d.f.))

Вернемся к распределению средней. Разделим числитель и знаменатель выражения

Числитель – это стандартная нормальная случайная величина (обозначим ξ (кси)). Знаменатель выразим из теоремы Фишера.

Тогда исходное выражение примет вид

Это и есть t-критерий Стьюдента в общем виде (стьюдентово отношение). Вывести функцию его распределения можно уже непосредственно, т.к. распределения обеих случайных величин в данном выражении известны. Оставим это удовольствие математикам.

Функция t-распределения Стьюдента имеет довольно сложную для понимания формулу, поэтому не имеет смысла ее разбирать. Вероятности и квантили t-критерия приведены в специальных таблицах распределения Стьюдента и забиты в функции разных ПО вроде Excel.

Итак, вооружившись новыми знаниями, вы сможете понять официальное определение распределения Стьюдента.
Случайной величиной, подчиняющейся распределению Стьюдента с k степенями свободы, называется отношение независимых случайных величин

где ξ распределена по стандартному нормальному закону, а χ 2 k подчиняется распределению χ 2 c k степенями свободы.

Таким образом, формула критерия Стьюдента для средней арифметической

есть частный случай стьюдентова отношения

Из формулы и определения следует, что распределение т-критерия Стьюдента зависит лишь от количества степеней свободы.

При k > 30 t-критерий практически не отличается от стандартного нормального распределения.

В отличие от хи-квадрат, t-критерий может быть одно- и двусторонним. Обычно пользуются двусторонним, предполагая, что отклонение может происходить в обе стороны от средней. Но если условие задачи допускает отклонение только в одну сторону, то разумно применять односторонний критерий. От этого немного увеличивается мощность критерия.

Условия применения t-критерия Стьюдента

Несмотря на то, что открытие Стьюдента в свое время совершило переворот в статистике, t-критерий все же довольно сильно ограничен в возможностях применения, т.к. сам по себе происходит из предположения о нормальном распределении исходных данных. Если данные не являются нормальными (что обычно и бывает), то и t-критерий уже не будет иметь распределения Стьюдента. Однако в силу действия центральной предельной теоремы средняя даже у ненормальных данных быстро приобретает колоколообразную форму распределения.

Рассмотрим, для примера, данные, имеющие выраженный скос вправо, как у распределения хи-квадрат с 5-ю степенями свободы.

Распределение хи-квадрат

Теперь создадим 20 тысяч выборок и будет наблюдать, как меняется распределение средних в зависимости от их объема.

Отличие довольно заметно в малых выборках до 15-20-ти наблюдений. Но дальше оно стремительно исчезает. Таким образом, ненормальность распределения – это, конечно, нехорошо, но некритично.

Больше всего t-критерий «боится» выбросов, т.е. аномальных отклонений. Возьмем 20 тыс. нормальных выборок по 15 наблюдений и в часть из них добавим по одному случайном выбросу.

Влияние аномальных выбросов на распределение средней

Картина получается нерадостная. Фактические частоты средних сильно отличаются от теоретических. Использование t-распределения в такой ситуации становится весьма рискованной затеей.

Итак, в не очень малых выборках (от 15-ти наблюдений) t-критерий относительно устойчив к ненормальному распределению исходных данных. А вот выбросы в данных сильно искажают распределение t-критерия, что, в свою очередь, может привести к ошибкам статистического вывода, поэтому от аномальных наблюдений следует избавиться. Часто из выборки удаляют все значения, выходящие за пределы ±2 стандартных отклонения от средней.

Пример проверки гипотезы о математическом ожидании с помощью t- критерия Стьюдента в MS Excel

В Excel есть несколько функций, связанных с t-распределением. Рассмотрим их.

СТЬЮДЕНТ.РАСП – «классическое» левостороннее t-распределение Стьюдента. На вход подается значение t-критерия, количество степеней свободы и опция (0 или 1), определяющая, что нужно рассчитать: плотность или значение функции. На выходе получаем, соответственно, плотность или вероятность того, что случайная величина окажется меньше указанного в аргументе t-критерия, т.е. левосторонний p-value.

СТЬЮДЕНТ.РАСП.2Х – двухсторонне распределение. В качестве аргумента подается абсолютное значение (по модулю) t-критерия и количество степеней свободы. На выходе получаем вероятность получить такое или еще больше значение t-критерия (по модулю), т.е. фактический уровень значимости (p-value).

СТЬЮДЕНТ.РАСП.ПХ – правостороннее t-распределение. Так, 1-СТЬЮДЕНТ.РАСП(2;5;1) = СТЬЮДЕНТ.РАСП.ПХ(2;5) = 0,05097. Если t-критерий положительный, то полученная вероятность – это p-value.

СТЬЮДЕНТ.ОБР – используется для расчета левостороннего обратного значения t-распределения. В качестве аргумента подается вероятность и количество степеней свободы. На выходе получаем соответствующее этой вероятности значение t-критерия. Отсчет вероятности идет слева. Поэтому для левого хвоста нужен сам уровень значимости α, а для правого 1 — α.

СТЬЮДЕНТ.ОБР.2Х – обратное значение для двухстороннего распределения Стьюдента, т.е. значение t-критерия (по модулю). Также на вход подается уровень значимости α. Только на этот раз отсчет ведется с двух сторон одновременно, поэтому вероятность распределяется на два хвоста. Так, СТЬЮДЕНТ.ОБР(1-0,025;5) = СТЬЮДЕНТ.ОБР.2Х(0,05;5) = 2,57058

СТЬЮДЕНТ.ТЕСТ – функция для проверки гипотезы о равенстве математических ожиданий в двух выборках. Заменяет кучу расчетов, т.к. достаточно указать лишь два диапазона с данными и еще пару параметров. На выходе получим p-value.

ДОВЕРИТ.СТЬЮДЕНТ – расчет доверительного интервала средней с учетом t-распределения.

Рассмотрим такой учебный пример. На предприятии фасуют цемент в мешки по 50кг. В силу случайности в отдельно взятом мешке допускается некоторое отклонение от ожидаемой массы, но генеральная средняя должна оставаться 50кг. В отделе контроля качества случайным образом взвесили 9 мешков и получили следующие результаты: средняя масса () составила 50,3кг, среднеквадратичное отклонение (s) – 0,5кг.

Согласуется ли полученный результат с нулевой гипотезой о том, что генеральная средняя равна 50кг? Другими словами, можно ли получить такой результат по чистой случайности, если оборудование работает исправно и выдает среднее наполнение 50 кг? Если гипотеза не будет отклонена, то полученное различие вписывается в диапазон случайных колебаний, если же гипотеза будет отклонена, то, скорее всего, в настройках аппарата, заполняющего мешки, произошел сбой. Требуется его проверка и настройка.

Краткое условие в обще принятых обозначениях выглядит так.

Есть основания предположить, что распределение заполняемости мешков подчиняются нормальному распределению (или не сильно от него отличается). Значит, для проверки гипотезы о математическом ожидании можно использовать t-критерий Стьюдента. Случайные отклонения могут происходить в любую сторону, значит нужен двусторонний t-критерий.

Вначале применим допотопные средства: ручной расчет t-критерия и сравнение его с критическим табличным значением. Расчетный t-критерий:

Теперь определим, выходит ли полученное число за критический уровень при уровне значимости α = 0,05. Воспользуемся таблицей для критерия Стьюдента (есть в любом учебнике по статистике).

Таблица t-распределения Стьюдента

По столбцам идет вероятность правой части распределения, по строкам – число степеней свободы. Нас интересует двусторонний t-критерий с уровнем значимости 0,05, что равносильно t-значению для половины уровня значимости справа: 1 — 0,05/2 = 0,975. Количество степеней свободы – это объем выборки минус 1, т.е. 9 — 1 = 8. На пересечении находим табличное значение t-критерия – 2,306. Если бы мы использовали стандартное нормальное распределение, то критической точкой было бы значение 1,96, а тут она больше, т.к. t-распределение на небольших выборках имеет более приплюснутый вид.

Сравниваем фактическое (1,8) и табличное значение (2.306). Расчетный критерий оказался меньше табличного. Следовательно, имеющиеся данные не противоречат гипотезе H0 о том, что генеральная средняя равна 50 кг (но и не доказывают ее). Это все, что мы можем узнать, используя таблицы. Можно, конечно, еще p-value попробовать найти, но он будет приближенным. А, как правило, именно p-value используется для проверки гипотез. Поэтому далее переходим в Excel.

Готовой функции для расчета t-критерия в Excel нет. Но это и не страшно, ведь формула t-критерия Стьюдента довольно проста и ее можно легко соорудить прямо в ячейке Excel.

Расчет t-критерия Стьюдента в Excel

Получили те же 1,8. Найдем вначале критическое значение. Альфа берем 0,05, критерий двусторонний. Нужна функция обратного значения t-распределения для двухсторонней гипотезы СТЬЮДЕНТ.ОБР.2Х.

Сравнение расчетного и табличного значения t-критерия Стьюдента

Полученное значение отсекает критическую область. Наблюдаемый t-критерий в нее не попадает, поэтому гипотеза не отклоняется.

Однако это тот же способ проверки гипотезы с помощью табличного значения. Более информативно будет рассчитать p-value, т.е. вероятность получить наблюдаемое или еще большее отклонение от средней 50кг, если эта гипотеза верна. Потребуется функция распределения Стьюдента для двухсторонней гипотезы СТЬЮДЕНТ.РАСП.2Х.

Расчет p-value для t-критерия

P-value равен 0,1096, что больше допустимого уровня значимости 0,05 – гипотезу не отклоняем. Но теперь можно судить о степени доказательства. P-value оказался довольно близок к тому уровню, когда гипотеза отклоняется, а это наводит на разные мысли. Например, что выборка оказалась слишком мала для обнаружения значимого отклонения.

Пусть через некоторое время отдел контроля снова решил проверить, как выдерживается стандарт заполняемости мешков. На этот раз для большей надежности было отобрано не 9, а 25 мешков. Интуитивно понятно, что разброс средней уменьшится, а, значит, и шансов найти сбой в системе становится больше.

Допустим, были получены те же значения средней и стандартного отклонения по выборке, что и в первый раз (50,3 и 0,5 соответственно). Рассчитаем t-критерий.

Критическое значение для 24-х степеней свободы и α = 0,05 составляет 2,064. На картинке ниже видно, что t-критерий попадает в область отклонения гипотезы.

Отклонения гипотезы

Можно сделать вывод о том, что с доверительной вероятностью более 95% генеральная средняя отличается от 50кг. Для большей убедительности посмотрим на p-value (последняя строка в таблице). Вероятность получить среднюю с таким или еще большим отклонением от 50, если гипотеза верна, составляет 0,0062, или 0,62%, что при однократном измерении практически невозможно. В общем, гипотезу отклоняем, как маловероятную.

Расчет доверительного интервала для математического ожидания с помощью t-распределения Стьюдента в Excel

С проверкой гипотез тесно связан еще один статистический метод – расчет доверительных интервалов. Если в полученный интервал попадает значение, соответствующее нулевой гипотезе, то это равносильно тому, что нулевая гипотеза не отклоняется. В противном случае, гипотеза отклоняется с соответствующей доверительной вероятностью. В некоторых случаях аналитики вообще не проверяют гипотез в классическом виде, а рассчитывают только доверительные интервалы. Такой подход позволяет извлечь еще больше полезной информации.

Рассчитаем доверительные интервалы для средней при 9 и 25 наблюдениях. Для этого воспользуемся функцией Excel ДОВЕРИТ.СТЬЮДЕНТ. Здесь, как ни странно, все довольно просто. В аргументах функции нужно указать только уровень значимости α, стандартное отклонение по выборке и размер выборки. На выходе получим полуширину доверительного интервала, то есть значение которое нужно отложить по обе стороны от средней. Проведя расчеты и нарисовав наглядную диаграмму, получим следующее.

Проверка гипотезы через доверительные интервалы

Как видно, при выборке в 9 наблюдений значение 50 попадает в доверительный интервал (гипотеза не отклоняется), а при 25-ти наблюдениях не попадает (гипотеза отклоняется). При этом в эксперименте с 25-ю мешками можно утверждать, что с вероятностью 97,5% генеральная средняя превышает 50,1 кг (нижняя граница доверительного интервала равна 50,094кг). А это довольно ценная информация.

Таким образом, мы решили одну и ту же задачу тремя способами:

1. Древним подходом, сравнивая расчетное и табличное значение t-критерия
2. Более современным, рассчитав p-value, добавив степень уверенности при отклонении гипотезы.
3. Еще более информативным, рассчитав доверительный интервал и получив минимальное значение генеральной средней.

Важно помнить, что t-критерий относится к параметрическим методам, т.к. основан на нормальном распределении (у него два параметра: среднее и дисперсия). Поэтому для его успешного применения важна хотя бы приблизительная нормальность исходных данных и отсутствие выбросов.

Напоследок предлагаю видеоролик о том, как рассчитать критерий Стьюдента и проверить гипотезу о генеральной средней в Excel.

Иногда просят объяснить, как делаются такие наглядные диаграммы с распределением. Ниже можно скачать файл, где проводились расчеты для этой статьи.

Всего доброго, будьте здоровы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *