Шрифт:
Аналитическая группировка – распространенный прием статистического изучения связей, которые обнаруживаются при параллельном сопоставлении обобщенных значений признаков по группам. Различают признаки зависимые, значения которых изменяются под влиянием других признаков (их обычно в статистике называют результативными), и факторные признаки, оказывающие влияние на другие. Обычно в основе аналитической группировки лежит признак-фактор, а по результативным признакам производится расчет групповых средних, по изменению величины которых определяют наличие связи между признаками.
Таким образом, аналитическими можно назвать такие группировки, которые позволяют установить и изучить связь между результативными и факторными признаками единиц однотипной совокупности.
Важная проблема аналитических группировок – правильный выбор числа групп и определение их границ, что в последующем обеспечивает объективность характеристик связи. Поскольку анализ ведется в однокачественных совокупностях, теоретических оснований для дробления определенного типа нет. Поэтому допустима разбивка совокупности на любое число групп, удовлетворяющее определенным требованиям и условиям конкретного анализа. В процессе аналитических группировок следует соблюдать общие правила группировки, т. е. единицы в образованных группах должны быть существенно различны, количество единиц в группах должно быть достаточным для расчета надежных статистических характеристик. Кроме того, групповые средние должны подчиняться определенной закономерности: последовательно увеличиваться или уменьшаться.
Непосредственная группировка данных статистического наблюдения – это первичная группировка. Вторичная группировка – это перегруппировка ранее сгруппированных данных. Необходимость вторичной группировки возникает в двух случаях:
1) если ранее произведенная группировка не удовлетворяет целям исследования в отношении числа групп;
2) для сравнения данных, относящихся к различным периодам времени или к различным территориям, если первичная группировка была произведена по разным группировочным признакам или по разным интервалам. Существует два способа вторичной группировки:
1) объединение мелких групп в более крупные;
2) выделение определенной доли единиц совокупности.
В научно обоснованной группировке общественных явлений необходимо учитывать взаимозависимость явлений и возможность перехода постепенных количественных изменений в явлениях к коренным качественным изменениям. Группировка может быть научной лишь в том случае, если не только определены познавательные цели группировки, но и правильно выбрано основание группировки – группировочный признак. Если группировка – это распределение на однородные группы по какому-либо признаку, объединение отдельных единиц совокупности в группы, однородные по какому-либо признаку, то группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в отдельные группы.
При выборе группировочного признака важным является не способ выражения признака, а его значение для изучаемого явления. С этой точки зрения для группировки следует брать существенные признаки, выражающие наиболее характерные черты изучаемого явления.
Самая простая группировка – ряд распределения. Рядами распределения называются ряды чисел (цифр), характеризующие состав или структуру какого-либо явления после группировки статистических данных об этом явлении. Ряд распределения – это группировка, в которой для характеристики групп применяется один показатель – численность группы, т. е. это ряд чисел, показывающий, как распределяются единицы совокупности по изучаемому признаку.
Ряды, построенные по атрибутивному признаку, называют атрибутивными рядами. Приведенный ряд распределения содержит три элемента: разновидности атрибутивного признака (мужчины, женщины); численности единиц в каждой группе, называемые частотами ряда распределения; численности групп, выраженные в долях (процентах) от общей численности единиц, называемые частостями. Сумма частостей равна 1, если они выражены в долях единицы, и 100%, если они выражены в процентах.
Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Числовые значения количественного признака в вариационном ряду распределения называются вариантами и располагаются в определенной последовательности. Варианты могут выражаться числами положительными и отрицательными, абсолютными и относительными. Вариационные ряды делятся на дискретные и интервальные.
Дискретные вариационные ряды характеризуют распределение единиц совокупности по дискретному (прерывному) признаку, т. е. принимающему целые значения. При построении ряда распределения с дискретной вариацией признака все варианты выписываются в порядке возрастания их величины, подсчитыва-ется, сколько раз повторяется одна и та же величина варианта, т. е. частота, и записывается в одной строке с соответствующим значением варианта (например, распределение семей по числу детей). Частоты в дискретном вариационном ряду, как и в атрибутивном, могут быть заменены частостями.
В случае непрерывной вариации величина признака может принимать любые значения в определенном интервале, например распределение работников фирмы по уровню дохода.
При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Оптимальное число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Чаще всего число групп устанавливается по формуле:
k = 1 + 3,32lgN = 1,441lgN + 1