Шрифт:
Во многих примерах использование среднего арифметического не поможет. Так, преподаватель может разделить на две части работу, рассчитанную на семестр. Он может вызывать некоторого студента к доске пять раз в течение первой половины семестра и поставить ему следующие оценки: 10, 9, 8, 10, 8. Во второй половине семестра он может вызвать его всего лишь дважды и поставить ему 0 и 4. Теперь предположим, что преподавателю нужно высчитать итоговую оценку, и для этого он высчитывает среднее арифметическое за первую половину семестра, которое равно 9, среднее арифметическое за вторую половину семестра, равное 2, а затем находит среднее арифметическое для двух половин. Итоговая оценка студента в таком случае будет равняться 5,5. Справедливо ли это? Если предположить, что работа, проделанная в первой половине семестра, является такой же важной и сложной, как работа, проделанная во второй половине, то студент будет прав, если посчитает такую оценку несправедливой. Он сможет требовать, чтобы средние оценки за каждую половину семестра взвешивались соответственно тому количеству раз, которые он выходил к доске. Тогда истинная итоговая оценка будет высчитываться следующим образом:
и тогда она будет удовлетворительной. Числа 5 и 2, на которые умножаются средние арифметические, называются весами.
Однако очевидно, что в данном примере использование весов не было необходимым, поскольку студент мог высчитать итоговую оценку, отыскав среднее арифметическое всех полученных оценок. В подобных примерах взвешивание используется только из соображений арифметического удобства. Более показательным применением среднего взвешенного будет установление изменения прожиточного минимума на протяжении периода в несколько лет. Рассмотрим несколько абсурдный пример. Предположим, что для следующих 5 пунктов цена в 1910 году была номинальной или равной 100, а в 1920 году пшеница стоила 120, говядина – 110, железо – 105, ювелирные изделия – 50, средство для волос – 40. Среднее арифметическое этих предметов для 1920 года равнялось 85. Мы не можем заключить, что прожиточный минимум снизился, поскольку перечисленные предметы обычно не рассматриваются как равнозначные. Поэтому мы можем приписать им различные веса для обозначения того, что мы понимаем под относительной важностью. Предположим, мы решим, что следующие числа означают важность указанных пунктов в том порядке, в котором они были перечислены: 10, 9, 7, 2, 1. Среднее взвешенное высчитывается следующим образом:
и будет равняться 105,7, что указывает на рост уровня прожиточного минимума. Определение весов в подобных случаях – крайне сложная задача; в их установление с неизбежностью включается случайный элемент. Относительная важность является несуммируемым свойством, и если нам удастся расставить предметы в порядке их относительной важности (что само по себе непросто), то приписывание числовых значений тем или иным пунктам осуществляется исключительно под влиянием конвенциональных и субъективных факторов. Однако при использовании различных систем придания весов среднее взвешенное все равно изменяется лишь незначительно, если, конечно, мы не имеем дела с какой-то необычной системой установления весов. Мода
Moda – это предмет группы, встречающийся наиболее часто. Поэтому мода нередко считается «типичным» представителем группы. Когда говорят о среднестатистическом человеке, указывают именно на такого, который является модой. По количеству денег в кармане студентов из примера на с. 416 модой будет 50 центов.
Каковы отличительные преимущества моды? Как и все средние показатели, она представляет распределение свойств внутри группы. Однако она также может представлять природу группы даже лучше, чем среднее арифметическое, поскольку она указывает на самую большую подгруппу некоторой совокупности и, таким образом, указывает на то, какое свойство будет встречаться наиболее часто. Когда офицер, ответственный за снабжение полка, заказывает форму, он исходит из измерений, являющихся модой для роста и талии людей, которые будут эту форму носить. Значение моды не подвержено влиянию резких флуктуаций внутри группы и поэтому может служить справедливой основой для сравнения различных групп. Если природа совокупности определяется через верно сделанную выборку, то использование моды может быть более результативным, чем использование среднего арифметического, поскольку мода является более стабильным средним показателем.
Однако мода не выполняет большинства условий, сформулированных нами для средних показателей (см. с. 412–415). Во-первых, мода недвусмысленно определяется как наиболее часто присутствующий предмет, а положение наиболее частого присутствия может изменяться в зависимости от типа классификации предметов данной группы. Так, предположим, что при рассмотрении успеваемости 47 студентов оценки распределились следующим образом:
Мода находится между 60 и 80, т. е. является больше 60 и меньше или равной 80. Однако интервалы могли бы быть выбраны и иначе. Предположим, что классификация была следующей:
Теперь мода находится между 70 и 90, т. е. больше 70 и меньше или равна 90. Если бы порог удовлетворительной оценки был бы ниже, чем интервал моды, то большее число студентов не получило бы моду при втором методе, чем при первом.
Очень часто бывает так, что в группе нет какого-либо единственного хорошо определенного типа. Это может произойти либо потому, что частота, с которой присутствуют те или иные предметы, примерно одна и та же, либо потому, что в данной группе можно усмотреть несколько различных частотных тенденций. Например, если мы изучаем статистику зарплат, то мы можем отыскать два или более перечня ставок зарплаты, имеющих относительно высокую частоту. В подобных случаях мы не можем говорить о какой-либо единственной моде. Существование нескольких «тенденций» (peaks) в распределении зарплаты указывает на отсутствие однородности в исследуемой группе. Может случиться и так, что будут иметь место несколько различных видов оценки труда, для каждого из которых будет существовать своя мода; однако когда эти различные виды объединяются, то распределение зарплат проявит несколько тенденций.
Более того, мода может оказаться не типичной, даже если она, действительно, соответствует наиболее часто присутствующему предмету в группе. Так, допустим, что в некой общине доход ее членов существенно разнится. Может случиться так, что двенадцать человек получают $1500, тогда как зарплата всех остальных членов, исчисляемых несколькими сотнями, не совпадает ни для кого из них. Тогда зарплата в $1500 будет модой, но при этом вовсе не будет типичной.
Нам следует также отметить, что мода не является функцией всех членов группы, т. к. элиминация нескольких членов может никак не отразиться на моде. Несмотря на то что зачастую данное свойство является преимуществом, тем не менее случается и так, что требуется значение, которое будет зависеть от значений всех членов группы. Более того, не существует какого-либо простого арифметического процесса, описывающего вычисление моды, поэтому на практике детерминация моды зачастую оказывается сложной и неточной. Наконец, мода составной группы не может высчитываться на основании мод тех групп, которые составляют общую группу. Для теоретических исследований данное свойство представляет серьезный недостаток. Главное же достоинство моды заключается в ее относительной стабильности при повторяющихся выборках. Однако данное преимущество является несущественным, когда о группе известно, что она является однородной. Поэтому в таких случаях применяются другие средние показатели.
Медиана – это средний термин в последовательности терминов, расставленных по мере их увеличения. Из сказанного следует, что нечетная совокупность предметов всегда будет обладать медианой. Медианой чисел 3, 4, 4, 5, 5, 5, 6 является число 5. Когда же число членов является четным, то медиана обычно определяется как среднее арифметическое двух средних терминов. Медианой группы 40, 50, 50, 60, 70, 90 является 55. Таким образом, медиана – это тот термин в некоторой последовательности терминов, упорядоченных по мере увеличения, которому предшествует столько же терминов, сколько и следует после.