Кластерный анализ

Материал из свободной русской энциклопедии «Традиция»
Перейти к: навигация, поиск
Результат одного из кластерных анализов выборки изображён в виде площадок, объединяющих элементы в три кластера.

Кластерный анализ (англ. Data clustering) — статистическая процедура (кластеризация), помогающая классифицировать объекты или наблюдения в однородные группы. Набор всех исследуемых объектов распределяется по подклассам, которые называются кластерами (англ. cluster), либо, в зависимости от предметной области статистического анализа - сгустками, классами, скоплениями, таксонами. Основная цель кластеризации – разделить множество элементов (начальные данные) на такие подмножества, группы, чтобы объекты в каждой группе были схожими, подобными по определённым критериям, а объекты из разных групп – существенно различались. Кластерный анализ тесно связан с понятием эвристического анализа.

  • Синонимы термина кластеризация (кластерный анализ): сегментационный анализ, сегментация, таксономия, распознавание без обучения, автоматическая классификация, неконтролируемая классификация.

Задача кластеризации относится к статистическим методам, а также к широкому классу задач обучения без учителя, и связана с понятием нечёткие множества. Кластерный анализ включает первичный сбор (и отбраковку) данных, содержащих информацию о выборке из множества объектов, с дальнейшим упорядочиванием объекты в сравнительно однородные группы (кластеры)(Q-кластеризация, или Q-техника, собственно кластерный анализ).

Кластерный анализ используется в технике, экономике, медицине, психологии, химии, биологии, государственном управлении, филологии, археологии, антропологии, маркетинге, социологии и многих других дисциплинах. Многообразие сфер использования метода привело к развитию большого количества частных форм кластерного анализа, несовместимых терминов, методов и подходов, что иногда затрудняет однозначное использование и непротиворечивую интерпретацию результатов кластерного анализа.

См. также[править]


Примечания[править]

Литература[править]

На русском языке[править]

На иностранных языках[править]

  • Romesburg, H. Clarles, Cluster Analysis for Researchers, 2004, 340 pp. ISBN 1-4116-0617-5, reprint of 1990 edition published by Krieger Pub. Co... A Japanese language translation is available from Uchida Rokakuho Publishing Co., Ltd., Tokyo, Japan.
  • Aldenderfer, M.S., Blashfield, R.K, Cluster Analysis, (1984), Newbury Park (CA): Sage.