Кластерный анализ
Кластерный анализ (англ. Data clustering) — статистическая процедура (кластеризация), помогающая классифицировать объекты или наблюдения в однородные группы. Набор всех исследуемых объектов распределяется по подклассам, которые называются кластерами (англ. cluster), либо, в зависимости от предметной области статистического анализа - сгустками, классами, скоплениями, таксонами. Основная цель кластеризации – разделить множество элементов (начальные данные) на такие подмножества, группы, чтобы объекты в каждой группе были схожими, подобными по определённым критериям, а объекты из разных групп – существенно различались. Кластерный анализ тесно связан с понятием эвристического анализа.
- Синонимы термина кластеризация (кластерный анализ): сегментационный анализ, сегментация, таксономия, распознавание без обучения, автоматическая классификация, неконтролируемая классификация.
Задача кластеризации относится к статистическим методам, а также к широкому классу задач обучения без учителя, и связана с понятием нечёткие множества. Кластерный анализ включает первичный сбор (и отбраковку) данных, содержащих информацию о выборке из множества объектов, с дальнейшим упорядочиванием объекты в сравнительно однородные группы (кластеры)(Q-кластеризация, или Q-техника, собственно кластерный анализ).
Кластерный анализ используется в технике, экономике, медицине, психологии, химии, биологии, государственном управлении, филологии, археологии, антропологии, маркетинге, социологии и многих других дисциплинах. Многообразие сфер использования метода привело к развитию большого количества частных форм кластерного анализа, несовместимых терминов, методов и подходов, что иногда затрудняет однозначное использование и непротиворечивую интерпретацию результатов кластерного анализа.
См. также[править | править код]
Примечания[править | править код]
Литература[править | править код]
На русском языке[править | править код]
На иностранных языках[править | править код]
- Romesburg, H. Clarles, Cluster Analysis for Researchers, 2004, 340 pp. ISBN 1-4116-0617-5, reprint of 1990 edition published by Krieger Pub. Co... A Japanese language translation is available from Uchida Rokakuho Publishing Co., Ltd., Tokyo, Japan.
- Aldenderfer, M.S., Blashfield, R.K, Cluster Analysis, (1984), Newbury Park (CA): Sage.