Шрифт:
В отличие от среднего арифметического, медиана не подвержена сильному влиянию значительных флуктуаций внутри группы. Поэтому она является относительно стабильным средним показателем и может использоваться для сравнения упорядоченных групп относительно положения их среднего термина. А, в отличие от моды, медиана может определяться с точностью и без труда. Однако медиана, в основном, используется в тех областях, где теоретические или систематические соображения обладают наименьшей значимостью. У нее нет алгебраических свойств, которые позволяли бы высчитывать медиану для некоторой группы на основании медиан составляющих ее подгрупп. Она получила популярность в измерениях в области социологии и психологии, поскольку в этих областях не всегда возможно осуществить фундаментальные измерения, но зато довольно часто можно установить порядок последовательности или шкалу свойств. Это объясняется тем, что медиана определяется по положению соответствующего термина в данной последовательности, а не в силу суммируемых свойств всех терминов. Таким образом, среднее арифметическое IQ некоторой группы детей ничего не говорит об этой группе и совершенно бесполезно для определения уровня интеллекта группы в целом. Однако медиана может использоваться в таких случаях в качестве основы для сравнения; возможность расположения детей по мере увеличения их способностей представляет достаточную значимость. Таким образом, если медианой IQ одного класса является число 95, а другого класса – 105, то при обычных условиях мы можем сказать, что во втором классе больше детей, способных соответствовать некоторому специальному стандарту, чем в первом.
Иногда считается, что числа, большие и меньшие, чем медиана, встречаются в группе с одинаковой частотой. Это не всегда так, особенно в тех случаях, где исследуемые свойства не представляют непрерывной последовательности. Таким образом, когда было рассмотрено 337 лютиков на предмет количества находящихся на них лепестков, было обнаружено, что 312 из них имеют 5 лепестков, 17—6 лепестков, 4–7, 2–8 и 2–9 лепестков. Медиана равнялась 5. Однако очевидно, что количество членов группы, содержащей по 5 лепестков, не равно количеству членов группы, содержащей большее количество лепестков.
§ 3. Виды измерения дисперсии
Мы видели, что группы могут отличаться друг от друга не только своими центральными тенденциями, но также и степенью разброса составляющих их значений.
Амплитуда вариации
Простой способ указать степень разброса значений в группе – это установить амплитуду вариации. Она представляет собой численную разность между максимальными и минимальными значениями признака в рассматриваемой группе. Если доходы в Соединенных Штатах варьируются от $500 до $10 ООО ООО, то амплитуда вариации будет равна $9 999 500. Однако этот метод не является удовлетворительным, поскольку, во-первых, крайние значения вариации могут быть неизвестны, а во-вторых, поскольку добавление или элиминация нескольких зарплат на краях совокупности могут существенно изменить амплитуду вариации. Более того, амплитуда вариации не говорит нам о том, как именно распределяются различные доходы внутри группы. Две группы чисел 1, 5, 5, 6, 6, 7, 7, 7, 10 и 1, 2, 2, 2, 2, 10 имеют одинаковую амплитуду вариации, хотя форма распределения в каждой из этих совокупностей является разной.
Можно найти и более точные методы для обозначения степени вариации. Предположим, рост мужчин в определенной группе, измеренный в дюймах, таков: 61, 63, 64, 65, 65, 66, 67, 68, 69, 72. Средний рост равен 66 дюймам. Теперь высчитаем отклонение каждого роста от среднего роста путем вычитания последнего из каждого отдельного роста. (Можно взять любой средний показатель в качестве основы для высчитывания отклонений. Мы же для простоты ограничимся средним арифметическим.) Отклонения таковы: -5, -3, -2, -1, -1, 0, 1,
2, 3, 6. У нас может возникнуть желание высчитать среднее арифметическое этих чисел. Однако это бесполезно, поскольку сумма отклонений от среднего значения всегда равна нулю. Однако мы можем пренебречь отрицательными знаками в отклонениях и высчитать среднее арифметическое. Полученный результат будет называться средним отклонением, или средней ошибкой. Среднее отклонение в нашем случае равняется 24/10, или 2,4.
Среднее отклонение приписывает одинаковую значимость как большим, так и малым отклонениям. Вообще, чем меньше среднее отклонение, тем более сконцентрированы исследуемые предметы вокруг среднего значения. Все факторы, упоминавшиеся при обсуждении среднего арифметического, также релевантны и в случае со средним отклонением.
Однако нам следует обратить внимание на то, что большое среднее отклонение не является необходимым признаком большой флуктуации в значениях группы. Быть большим можно только относительно некоторого стандарта. Если мы многократно измерим высоту горы, то среднее арифметическое наших измерений может равняться 5000 футов, а среднее отклонение – 10 футам. По сравнению со средним арифметическим среднее отклонение является маленьким числом. Однако если бы мы измеряли длину квартала в городе, то среднее отклонение в 10 футов было бы существенным. По этой причине среднее отклонение иногда делится на средний показатель, относительно которого измеряются отклонения. Получившийся результат называется «коэффициент дисперсии». В предыдущем примере об измерении роста людей этот коэффициент равнялся 2,4/66, или 0,036+.
Для многих целей, особенно тех, в которых преобладают элементы теории вероятности, в качестве меры дисперсии рассматривается стандартное отклонение. Оно вычисляется путем деления суммы квадратов отклонений от среднего показателя на количество предметов в группе и извлечения из получившегося результата квадратного корня. В примере с измерением роста мы получаем
что равняется 9 и является средним арифметическим суммы квадратов отклонений. Стандартное отклонение равняется
Стандартное отклонение, построенное указанным образом, демонстрирует экстремальные значения отклонений. При возведении отклонений в квадрат наибольшие из них обретают больший вес в общей сумме по сравнению с меньшими отклонениями. Относительно полезности стандартного отклонения нельзя сказать ничего до тех пор, пока не станут известными предположения, сделанные относительно группы значений, для которых оно высчитывается. Однако в целом стандартное отклонение является измерением дисперсии, которое в наименьшей степени подвержено влиянию флуктуаций в выборке по сравнению с другими измерениями. Если распределение в группе является примерно симметричным и если расстояние, равное стандартному отклонению, отграничено с каждой стороны среднего показателя, то около 2/3 всех предметов группы будут находиться внутри отграниченной области. В нашем примере с измерением роста эти отграничения выражаются записью: 66 ± 3. И действительно, около 2/3 величин находится между 63 и 69. Квартильное отклонение