Лабораторное занятие № 13 по медицинской информатике
Тема: Статистическая проверка гипотез. Параметрические критерии Фишера и Стьюдента. Расчеты в Microsoft Excel.
Теоретическое введение
Статистические сравнения
Решение той или иной задачи, как правило, не обходится без сравнений. Сравнивать приходится данные опыта с контролем, урожайность одной культуры с урожайностью другой, продуктивность животных одной группы с продуктивностью другой и т. д. О преимуществе одной из сравниваемых групп судят обычно по разности между выборочными средними. Однако так как выборочные средние являются величинами случайными, варьирующими около своих генеральных параметров, которые в подавляющем числе случаев остаются неизвестными, то и разность между этими показателями может возникнуть не вследствие систематически действующих на признак, а чисто случайных причин. Чтобы решить вопрос об истинной значимости различий между выборочными средними, исходят из статистических гипотез — предположений или допущений о неизвестных генеральных параметрах.
В области биометрии применяется так называемая нулевая гипотеза ( ), т. е. предположение о том, что между генеральными параметрами сравниваемых групп разница равна нулю, и различия, наблюдаемые между выборочными показателями, носят чисто случайный характер. Так, если одна выборка X взята из совокупности с параметрами математического ожидания и выборочной исправленной дисперсией , а другая Y — из совокупности с параметрами и , то нулевая гипотеза предполагает равенство их генеральных средних и дисперсий: , . Противоположная, или альтернативная, гипотеза ( ), наоборот, исходит из предположения, что их генеральные средние и дисперсии неравны: , .
Истинность принятой гипотезы проверяется с помощью критериев значимости — специально выработанных случайных величин, функции, распределения которых известны. Для каждого критерия составляется таблица, в которой содержатся критические точки, отвечающие определенным числам степеней свободы и принятым уровням значимости a. Уровень значимости a = 1 – Р — значение вероятности, при котором различия, наблюдаемые между выборочными показателями, можно считать несущественными, случайными. В исследовательской работе обычно принимается 5%-ный уровень значимости, которому отвечает вероятность . В более ответственных случаях применяется 1%-ный уровень значимости.
Критерии значимости делятся на параметрические и непараметрические. Первые строятся на основе параметров выборочной совокупности и представляют функции этих параметров, вторые — функции от вариант данной совокупности с их частотами. Параметрические критерии применимы лишь в тех случаях, когда генеральная совокупность, из которой взята выборка, имеет нормальное распределение, и при условии, что генеральные параметры сравниваемых групп равны между собой, т. е. и . Непараметрические критерии таких ограничений не имеют и могут применяться к распределениям самых различных форм. Параметрические критерии обладают большей мощностью по сравнению с критериями непараметрическими, поэтому во всех случаях, когда исследуемая совокупность распределяется по нормальному закону или не очень сильно отклоняется от него, следует отдавать предпочтение параметрическим критериям.