Ce livre fournit un guide pratique pour l'analyse des clusters, la visualisation élégante et l'interprétation. Il comprend 5 parties. La partie I fournit une introduction rapide à R et présente les packages R requis, ainsi que les formats de données et les mesures de dissimilarité pour l'analyse et la visualisation des clusters. La partie II porte sur les méthodes de partitionnement des groupes, qui subdivisent les ensembles de données en un ensemble de k groupes, où k est le nombre de groupes prédéfinis par l'analyste. Les approches de partitionnement de clustering incluent : Algorithmes K-means, K-Medoids (PAM) et CLARA. Dans la Partie III, nous examinons la méthode de regroupement hiérarchique, qui est une approche alternative au cloisonnement du regroupement. Le résultat du regroupement hiérarchique est une représentation arborescente des objets appelée dendrogramme. Dans cette partie, nous décrivons comment calculer, visualiser, interpréter et comparer les dendrogrammes. La partie IV décrit les stratégies de validation et d'évaluation des grappes, qui consistent à mesurer la qualité des résultats des grappes. Parmi les chapitres couverts ici, il y en a : Évaluer la tendance au clustering, déterminer le nombre optimal de clusters, statistiques de validation des clusters, choisir les meilleurs algorithmes de clustering et calculer la p-value pour le clustering hiérarchique. La partie V présente des méthodes avancées de mise en grappes, notamment : Clustering hiérarchique k-means, clustering flou, clustering basé sur un modèle et clustering basé sur la densité.
Citer la référence
KASSAMBARA (A.), Practical Guide To Cluster Analysis in R, Grande Bretagne : Amazone, 2017, 2017