K-signifie clustering

Définition - Que signifie Clustering K-Means?

Le clustering K-means est un simple algorithme d'apprentissage non supervisé utilisé pour résoudre les problèmes de clustering. Il suit une procédure simple de classification d'un ensemble de données donné en un nombre de clusters, défini par la lettre «k», qui est fixée au préalable. Les clusters sont ensuite positionnés comme des points et toutes les observations ou points de données sont associés au cluster le plus proche, calculés, ajustés, puis le processus recommence en utilisant les nouveaux ajustements jusqu'à ce qu'un résultat souhaité soit atteint.

Le clustering K-means a des utilisations dans les moteurs de recherche, la segmentation du marché, les statistiques et même l'astronomie.

Definir Tech explique le clustering K-Means

Le clustering K-means est une méthode utilisée pour l'analyse de clustering, en particulier dans l'exploration de données et les statistiques. Il vise à partitionner un ensemble d'observations en un certain nombre de clusters (k), ce qui entraîne la partition des données en cellules de Voronoi. Cela peut être considéré comme une méthode permettant de déterminer à quel groupe appartient réellement un objet donné.

Il est principalement utilisé dans les statistiques et peut être appliqué à presque toutes les branches d'études. Par exemple, en marketing, il peut être utilisé pour regrouper différentes données démographiques de personnes en groupes simples qui facilitent le ciblage des spécialistes du marketing. Les astronomes l'utilisent pour passer au crible d'énormes quantités de données astronomiques; comme ils ne peuvent pas analyser chaque objet un par un, ils ont besoin d'un moyen de trouver statistiquement des points d'intérêt pour l'observation et l'enquête.

L'algorithme:

  1. Les points K sont placés dans l'espace de données d'objet représentant le groupe initial de centres de gravité.
  2. Chaque objet ou point de données est affecté au k le plus proche.
  3. Une fois tous les objets attribués, les positions des k centres de gravité sont recalculées.
  4. Les étapes 2 et 3 sont répétées jusqu'à ce que les positions des centres de gravité ne bougent plus.