Вход/Регистрация
Метод. Московский ежегодник трудов из обществоведческих дисциплин. Выпуск 4: Поверх методологических границ
вернуться

Коллектив авторов

Шрифт:

Таблица 1

Классификация методов измерения латентных переменных

Источник: [Analysis of multivariate social science data, 2008, p. 177].

В факторном анализе выделяются два типа: разведывательный (exploratory) и подтверждающий (confirmatory). В первом типе не проводится проверка гипотез, он помогает проанализировать структуру связей в данных и сформулировать гипотезы, во втором типе, наоборот, проводится проверка гипотез о количестве факторов и нагрузках.

Метод главных компонент и факторный анализ часто дают близкие результаты и иногда МГК считают частью факторного анализа. Тем не менее это не так, хотя и появились они в одно время (факторный анализ был предложен Ч.Э. Спирменом в 1904 г. для изучения интеллекта). Во-первых, они различны потому, что метод главных компонент относится к описательным методам математической статистики, а факторный анализ является методом моделирования. Это значит, что для моделей факторного анализа релевантны понятия допущения о характере распределения переменных, оценивания, статистической значимости, качества модели и статистического вывода. Во-вторых, этапы проведения факторного анализа исходно формулируются так, чтобы сначала содержательно определить ненаблюдаемую категорию, интересующую исследователя, и уже потом подбирать измеримые показатели, характеризующие ее, тогда как для МГК набор исходных признаков предполагается заданным (стоит отметить, что на практике оба метода зачастую реализуются с нарушением такой последовательности) [Analysis of multivariate social science data, 2008, p. 177].

В работе 2007 г. Р. Инглхар и К. Велзель предположили, что для установления и развития демократического режима необходим осознанный общественный запрос. Важно, чтобы демократия воспринималась не как инструмент достижения экономического процветания нации, а как способ обеспечения политических прав и свобод от принуждения и дискриминации. По мнению авторов, свобода объединяет такие категории, как «Равенство против патриархального уклада», «Толерантность против подчинения традиционным нормам», «Автономия против авторитета», «Выражение против спокойствия и обеспеченности». Для конструирования индекса ценности свободы были привлечены 14 переменных из «Всемирного исследования ценностей» в 90 странах. По каждому вопросу были получены доли положительно ответивших от общего числа опрошенных в каждой стране. По каждой из четырех категорий были вычислены средние значения, а итоговое значение индекса ценности свободы было получено из четырех переменных методом факторного анализа [Inglehart, Welzel, 2009].

Другим важным инструментом многомерного статистического анализа является кластерный анализ. Его основное назначение состоит в разбиении множества исследуемых признаков на однородные в определенном смысле группы, когда объекты внутри одного кластера более похожи друг на друга, чем на объекты из других кластеров [Айвазян, Мхитарян, 2001, с. 484].

Методы кластерного анализа актуальны, когда возникает задача классификации в признаковом пространстве большой размерности, что естественно, ведь если признаков, которыми описываются объекты, всего два, то получить группировку можно с помощью визуализации данных на диаграмме рассеяния.

Являясь описательным методом статистики, кластерный анализ позволяет проанализировать внутренние связи между единицами в группах, он может быть особенно полезен при исследовании малоизученных явлений. С его помощью можно описать большой объем информации, выявить сходную динамику или структуру распределения показателей.

Существенным достоинством метода является отсутствие каких-либо допущений о характере распределения данных и априорной информации о числе групп. Все, что необходимо для реализации кластерного анализа – задать меру схожести объектов и правило объединения в кластеры. Несмотря на то, что многие методы кластерного анализа довольно просты, их активное использование стало возможным только с появлением необходимых вычислительных мощностей, потому что эффективное решение задачи поиска кластеров требует большого числа арифметических действий [Айвазян, Мхитарян, 2001, с. 484].

Различаются иерархические и итеративные методы кластеризации. Агломеративные иерархические методы предполагают последовательное объединение объектов в группы и групп между собой до тех пор, пока все объекты не окажутся в одном кластере. Дивизивные, наоборот, построены на последовательном разбиении одного кластера со всеми объектами на более малочисленные группы.

К итеративным методам кластерного анализа относится метод k– средних. В отличие от иерархических методов, он требует предварительного определения количества кластеров, которые будут сформированы. Смысл процедуры состоит в итерационном уточнении «центров тяжести» искомых классов и классификации наблюдений в соответствии с расстоянием до ближайшего «эталонного» центра. Но итеративные методы значительно более трудоемки с точки зрения вычислений и менее популярны.

Мерой схожести (однородности) обычно принимается величина, обратная расстоянию между объектами, ведь если объекты в многомерном пространстве находятся рядом, то разумно предположить, что они похожи друг на друга. Возможных мер расстояния между точками (объектами) i и j довольно много, вот только некоторые из них:

1) Евклидово,

,

2) квадрат Евклидова

,

3) расстояние Манхеттен

,

где xi (1), xi (2), .., xi (m) – m количественных признаков, которыми описываются объекты.

Если признаки измерены на категориальном уровне, тогда мерами схожести будут такие метрики, которые основаны на совпадении или несовпадении значений по каждому признаку [Ким, Мьюллер, Клекка, 1989, с. 161].

После объединения наиболее близких друг к другу точек в один кластер, в иерархических методах необходимо задать способ агломерации – правило сравнения и объединения единичных точек к кластерам или двух кластеров в один более крупный. Для этого используются метод ближнего соседа, метод дальнего соседа, центроидный метод и метод средней связи. По результатам некоторых исследований, лучшие результаты дают метод Варда и метод средней связи [Gore, 2000, p. 315].

  • Читать дальше
  • 1
  • ...
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • ...

Ебукер (ebooker) – онлайн-библиотека на русском языке. Книги доступны онлайн, без утомительной регистрации. Огромный выбор и удобный дизайн, позволяющий читать без проблем. Добавляйте сайт в закладки! Все произведения загружаются пользователями: если считаете, что ваши авторские права нарушены – используйте форму обратной связи.

Полезные ссылки

  • Моя полка

Контакты

  • chitat.ebooker@gmail.com

Подпишитесь на рассылку: