Понятие вариации и вариационного ряда

Вариация определяет различия в значениях какого-либо признака у разных единиц изучаемой совокупности в один и тот же период (момент времени). Вариация возникает в результате того, что сами значения признака складываются под суммарным влиянием разнообразных условий, которые разным образом сочетаются в каждом отдельном случае. Вариация характерна всем без исключения явлениям природы и общества, кроме законодательно закрепленных нормативных значений отдельных социальных признаков. Исследования вариации в статистике имеют огромное значение, помогают познать сущность изучаемого явления. Нахождение вариации, выяснение ее причин, выявление влияния отдельных факторов дают важную информацию для внедрения научно обоснованных управленческих решений.

Обычно полученные в результате исследований наблюдаемые данные представляют собой множество расположенных в беспорядке чисел. Просматривая это множество чисел, трудно выявить какую-либо закономерность их варьирования (изменения). Для изучения закономерностей варьирования значений случайной величины полученные данные подвергают обработке.

Пример 1. Проводились наблюдения над числом Х оценок полученных студентами ВУЗа на экзаменах. Наблюдения в течение часа дали следующие результаты: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5. Здесь число Х является дискретной случайной величиной, а полученные о ней сведения представляют собой статистические (наблюдаемые) данные.

На первом этапе статистической обработки производят ранжированиевыборки, т.е. упорядочивание чисел x1, x2, …, xn по возрастанию. Расположив приведенные выше данные в порядке неубывания и сгруппировав их так, что в каждой отдельной группе значения величины изучаемого признака будут одинаковы, получают ранжированный ряд данных наблюдения.

В примере 1 имеем четыре группы со следующими значениями случайной величины: 2; 3; 4; 5.

Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называют вариантом (вариантой), а изменение этого значения варьированием. Варианты обозначают малыми буквами латинского алфавита с соответствующими порядковому номеру группы индексами — xi.

Число, которое показывает, сколько раз встречается соответствующий вариант значения в ряде наблюдений называют частотой варианта и обозначают соответственно — fi. Сумма всех частот ряда равна объему изучаемой совокупности.

Отношение частоты варианта к объему выборки называют относительной частотой или частостью( w

Статистическим распределением выборки называют перечень вариантов и соответствующих им частот или относительных частот.

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным рядом распределения (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным рядом распределения. Построить вариационный ряд — значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд — это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного ряда — групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

Дискретный вариационный ряд — это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет групповую таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй — число единиц совокупности с определенным значением признака.

Понятие вариации и вариационного ряда

Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения) или количество значений дискретного признака очень велико, то нужно строить интервальный вариационный ряд.

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от — до» (варианты), во второй — число единиц, входящих в интервал (частота).

Понятие вариации и вариационного ряда

Интервалы могут быть равные или неравные, закрытые или открытые.

Величина интервала для интервального вариационного ряда с равными интервалами определяется по формуле:

Понятие вариации и вариационного ряда

где R — размах колебания (варьирования) признака: R = Xмакс — Xмин; m — число групп (интервалов).

Число групп приближенно определяется по формуле Стерджесса:

Понятие вариации и вариационного ряда

где n — общее число единиц совокупности.

Полученную по этой формуле величину округляют до целого большего числа, поскольку количество групп не может быть дробным числом.

Величину интервала обычно округляют до целого (всегда большего) числа, исключение составляют лишь случаи, когда изучаются малейшие колебания признака (например, при группировке деталей по величине размера отклонений от номинала, измеряемого в долях миллиметра).

Нижнюю границу первого интервала принимают равной минимальному значению признака (чаще всего его предварительно округляют до целого меньшего числа). Верхняя граница первого интервала соответствует значению (Хmах + i). Для последующих групп границы определяются аналогично, т е. последовательно прибавляется величина интервала.

Если единица обладает значением признака, равным величине верхней границы интервала, то ее следует относить к следующей группе.

При построении атрибутивных рядов число групп соответствует числу разновидностей признака.

Ряд распределения, состоящий из двух граф (варианты и частоты), иногда дополняется другими графами, необходимыми для вычисления отдельных статистических показателей или для более отчетливого выражения характера вариации изучаемого признака.

Достаточно часто в ряд вводится графа, в которой подсчитываются накопленные частоты (S)Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и исчисляются путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

Частоты ряда (f) могут быть заменены частостями (?), которые представляют собой частоты, выраженные в относительных числах (долях или процентах) и рассчитанные путем деления частоты каждого интервала на их общую сумму, т с.

Понятие вариации и вариационного ряда

Если вариационный ряд дан с неравными интервалами, то для правильного представления о характере распределения необходимо произвести расчет абсолютной или относительной плотности распределения.

Абсолютная плотность распредеяения (р) представляет собой величину частоты, приходящейся на единицу размера интервала отдельной группы ряда :

р = f / i.

Первым этапом изучения вариационного ряда является его графическое изображение. Графическое изображение вариационных рядов облегчает их анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда в статистике строят гистограмму, полигон и кумуляту распределения. Дискретный вариационный ряд изображается в виде так называемого полигона, или многоугольника, распределения частот, являющегося разновидностью статистических ломаных. Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот. Строятся графики в прямоугольной системе координат.

При построении полигона частот

1) по оси ординат наносится шкала для выражения величин частот,

2) на оси абсцисс в одинаковом масштабе откладываются направо в порядке возрастания значения признака (для дискретного рядов) или центральные значения интервалов – середины интервалов.
Середина интервала определяется как среднее арифметическое между верхней и нижней границами интервала:

,

3) Из точек на оси абсцисс, соответствующих величине признака, восстанавливаются перпендикуляры высотой, соответствующей частоте; вершины перпендикуляров соединяются отрезками прямой. Крайние точки полученной ломаной соединяются с лежащими на оси абсцисс следующими (меньшими и большими) возможными, но

4) фактически не наблюдающимися значениями признака, частота которых, очевидно, равна 0.

Замкнутая с осью абсцисс ломаная линия представляет полигон распределения частот.

Понятие вариации и вариационного ряда

Гистограмма — столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда.

Для построения гистограммы по оси абсцисс откладывают величины интервалов, а частоты изображаются прямоугольниками, построенными на интервалах с высотой, равной частоте в масштабе оси ординат. В случае неравенства интервалов гистограмма строится не по частотам или частостям, а по плотности распределения. Очевидно, что гистограмма легко может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить отрезками прямых, при этом середины верхних сторон двух крайних прямоугольников соединить с осью абсцисс в точках, отстоящих в принятом масштабе на величину интервалов от середины первого и последнего интервалов.

Понятие вариации и вариационного ряда

В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята), она особенно удобна для сравнения вариационных рядов.

Накопленные частоты наносятся в виде ординат; соединяя вершины отдельных ординат прямыми, получают ломаную линию, которая, начиная с нуля, непрерывно поднимается над осью абсцисс до тех пор, пока не достигнет высоты, соответствующей общей сумме частот.

При построении кумуляты интервального ряда (рис. 5.3) нижней границе первого интервала соответствует нулевая частота (частость), верхней- вся частота (частость) первого интервала. Верхней границе второго интервала – сумма частот (частостей) первого и второго интервалов и т.д., верхней границе последнего интервала — сумма накопленных частот (частостей) во всех интервалах, что соответствует общей численности изучаемой совокупности или 100%.

Понятие вариации и вариационного ряда

Для признака, имеющего прерывное изменение и

принимающего небольшое количество значений, применяется

построение дискретного ряда. В первой графе ряда

указываются конкретные значения каждого индивидуального

значения признака, во второй графе — численность единиц с

определенным значением признака.

Для признака, имеющего непрерывное изменение, строится

интервальный вариационный ряд, состоящий, так же как и

дискретный ряд, из двух граф (варианты и частоты). При его

построении в первой графе отдельные значения признака

указываются в интервалах «от- до», во второй графе — число

единиц, входящих в интервал. Интервалы образуются, как

правило, равные и закрытые.

Лекция 6: Анализ вариационных рядов


Похожие статьи.

Понравилась статья? Поделиться с друзьями: