Иерархическая кластеризация - самый популярный и широко используемый метод анализа данных социальных сетей. В этом методе узлы сравниваются друг с другом на основе их сходства. Большие группы создаются путем объединения групп узлов на основе их сходства.
Когда использовать иерархическую кластеризацию по сравнению со средствами K?
Иерархическая кластеризация - это набор вложенных кластеров, организованных в виде дерева. Кластеризация K-средних хорошо работает, когда структура кластеров является гиперсферической (например, круг в 2D, сфера в 3D). Иерархическая кластеризация работает не так хорошо, как k означает гиперсферическую форму кластеров.
Когда следует использовать иерархическую кластеризацию?
Иерархическая кластеризация - это мощная техника, которая позволяет строить древовидные структуры на основе схожести данных. Теперь вы можете увидеть, как разные подкластеры связаны друг с другом и как далеко друг от друга находятся точки данных.
Когда вы не используете иерархическую кластеризацию?
Слабые стороны в том, что он редко обеспечивает лучшее решение, включает множество произвольных решений, не работает с отсутствующими данными, плохо работает со смешанными типами данных, плохо работает с очень большими наборами данных, а его основной вывод, дендрограмма, обычно неправильно интерпретируется.
Каковы преимущества иерархической кластеризации?
Сильные стороны иерархической кластеризации
- Этопонять и реализовать.
- Нам не нужно заранее указывать какое-то конкретное количество кластеров. …
- Они могут соответствовать значимой классификации.
- Легко определить количество кластеров, просто взглянув на дендрограмму.