ТЕМА 2. МЕТОДЫ АНАЛИЗА ЭМПИРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ
Вариация(изменчивость)– различия в индивидуальных значениях признака у единиц совокупности. Наличие вариации – важнейшее условие развития любых систем.
От степени варьирования признака в совокупности зависит надежность, устойчивость показателей центральной тенденции распределения. Чем меньше вариация, тем в большей степени среднее значение выполняет функцию характеристики типического уровня признака. Чем больше вариация, тем менее устойчивы оценочные показатели. Поэтому, как правило, расчет показателей центра распределения сопровождается оценкой степени вариации признака в изучаемой совокупности. Однако показатели вариации имеют и самостоятельное аналитическое значение. Степень варьирования значений признака в той или иной мере отражает качественную сторону изучаемого процесса или явления, например: существенно ли различается (варьирует) средняя заработная плата работников по видам экономической деятельности, по регионам России; в какой мере различается уровень рентабельности организаций одного вида деятельности, цен на товары одной категории; какова степень вариации, отклонений параметров выпускаемых изделий от установленных в технической документации;какова вариации доходности ценных бумаг и т.п.
Для оценки вариации используют абсолютные и относительные показатели.
Абсолютные показателивариации: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Абсолютные показатели вариации имеют те же единицы измерения, что и признаки, для оценки которых они рассчитываются. Рассмотрим расчет перечисленных характеристик.
Размах вариации (R) рассчитывается как разность между максимальным ( ) и минимальным ( ) значениями признака в совокупности:
. (3.1)
Показатель характеризует, на какую величину максимальное значение признака превышает минимальное. Максимальное и минимальное значения признака – это границы, в которых существует изучаемая совокупность.
Среднее линейное отклонение:
, (3.2)
где — среднее значение признака в совокупности; – значение признака у i-й единицы совокупности или середина интервала в i-й группе, если данные сгруппированы; — частота i-й группы; — сумма частот (объем совокупности, поскольку =N).
Дисперсия:
(3.3)
Показатель дисперсии содержательно не интерпретируется, поскольку отклонения значений от средней величины возводятся в квадрат. Однако дисперсия является важнейшим показателем вариации и используется в расчетах многих статистических характеристик и критериев.
Среднее квадратическое (стандартное) отклонение:
(3.4)
Показатель среднего квадратического отклонения – наиболее часто используемый в практическом анализе абсолютный показатель вариации. Он характеризует, на сколько (в конкретных единицах измерения) в среднем отклоняются индивидуальные значения признака от типического (среднего) уровня признака по совокупности, т.е. в абсолютном выражении оценивает степень рассеяния индивидуальных значений признака вокруг среднего. Чем меньше значение стандартного отклонения, тем устойчивее средняя величина.
Для нормального распределения справедливо следующее соотношение между средним квадратичным и средним линейным отклонениями:
(3.5)
По фактическому соотношению этих показателей можно косвенно судить о соответствии эмпирического распределения нормальному.
Если распределение единиц изучаемой совокупности соответствует закону нормального распределения, то величина стандартного отклонения несет информацию о том, как распределена определенная часть единиц совокупности вокруг типического уровня признака, что нашло отражение в правиле трех сигм.
Правило трех сигм (3?) – свойство нормального распределения. Если распределение единиц изучаемой совокупности подчиняется закону нормального распределения, то:
в интервале находится 68,3% всех единиц совокупности;
в интервале ;
в интервале .
Это означает, что с вероятностью 0,997 можно утверждать, что в нормально распределенной совокупности практически отсутствуют значения, отклоняющиеся от типического уровня признака (от ) на величину более чем 3?. Вероятность появления таких значений — 0, 003 (1-0,997). Это свойство нормального распределения имеет большое практическое значение, широко используется в практических выводах.
Абсолютные показатели вариации, как именованные величины, не могут быть использованы для сравнения степени вариации разноименных признаков в рамках одной совокупности, а также для сопоставления степени варьирования по разным совокупностям.Эту функцию выполняют относительные показатели вариации.
Относительные показатели вариации рассчитываются на основе абсолютных путем сопоставления их со средним значением признака. К относительным показателям относятся: коэффициент осцилляции, относительное линейное отклонение и коэффициент вариации.
Коэффициент осцилляции:
(3.6)
Относительное линейное отклонение:
(3.7)
Коэффициент вариации:
(3.8)
Наибольшее аналитическое значение имеет коэффициент вариации. Характеризуя относительную меру изменчивости,его величина позволяет судить об однородности или не однородности изучаемой совокупности. Если V?33%, совокупность признается однородной, т.е. различия в значениях признака у единиц изучаемой совокупности можно считать не существенными. В противном случае, т.е. при V33%, совокупность признается не однородной, различия в значениях признака у единиц совокупности — существенные.
Коэффициент вариации, как относительная мера изменчивости, используется для сравнения степени однородности совокупности по разноименным признакам, а также для сравнения степени вариации одноименных признаков в разных совокупностях. Так, например, при изучении распределения регионов России по показателю числа квадратных метров жилых помещений на одного человека коэффициент вариации не более 15%, а по показателю среднедушевых денежных доходов — превышает 33 %. Это говорит о том, что регионы России — однородная совокупность по обеспеченности населения жильем, а по уровню денежных доходов — неоднородна.
В таблице 3.1 представлены значения основных показателей вариации, рассчитанные по данным сквозного примера.
Таблица 3.1 — Показатели вариации распределения регионов России по величине СДДН в 2013 г.
О чем говорят приведенные цифры? Минимальное (13472 руб.) и максимальное (42463 руб.) значения СДДН говорят о границах показателя в изучаемой совокупности, т.е. уровень СДДН ниже 13472 руб. в месяц и выше 42463 руб. в 2013 году в изучаемых регионах России не встречался. Размах вариации свидетельствует о том, что максимальное значение денежных доход в 2013 году превышало минимальное на 28991 руб./чел.Уровень денежных доходов населения в регионах различался в среднем на 5962,41 рубля. По исходным данным коэффициент вариации превысил 33% (34,53), что говорит о неоднородности совокупности регионов по данному показателю. После исключения выбросов коэффициент вариации составил 27,18 процента, т.е. в совокупности регионов, распределение которых анализируется, различия в уровне СДДН можно признать не существенными.