Définitions

Classification

La classification statistique réside dans l’identification de la catégories à laquelle un nouveau élément appartient, sur la base d'un data set d’entraînement de données contenant des observations (ou instances) dont la catégorie est connue.

Par exemple, attribuer un courrier électronique donné à la classe "spam" ou "non spam" et attribuer un diagnostic à un patient donné en fonction des caractéristiques observées du patient (sexe, tension artérielle, présence ou absence de certains symptômes, etc.). La classification est un exemple de reconnaissance de forme.

Dans la terminologie de l’apprentissage automatique , la classification est considérée comme un exemple d’apprentissage supervisé, c’est-à-dire un apprentissage dans lequel un data set d’entraînement d’observations correctement identifiées est disponible. Le correspondant non supervisé la procédure est connue comme groupe ING, et comprend le regroupement de données en catégories fondées sur une mesure de similarité intrinsèque ou la distance.

Souvent, les observations individuelles sont analysées dans une série de propriétés quantifiables, connues sous différentes appellations de variables ou caractéristiques explicatives. Ces propriétés peuvent diversement être catégorique (par exemple « A », « B », « AB » ou « O » pour le type de sang), ordinal (par exemple, « grand », « moyen » ou « faible »), à valeurs entières (par exemple, le nombre d'occurrences d'un mot particulier dans un e - mail) ou à valeurs réelles (par exemple, une mesure de sang presse ure). D'autres classificateurs comparent les observations aux observations précédentes au moyen d'une fonction de similarité ou de distance.

Un algorithme qui implémente la classification, en particulier dans une mise en œuvre concrète, est connu comme un classificateur. Le terme "classificateur" désigne parfois aussi la fonction mathématique, mise en œuvre par un algorithme de classification, qui mappe les données d'entrée à une catégorie.

La terminologie à travers les domaines est assez variée. En statistique, où la classification est souvent effectuée avec une régression logistique ou une procédure similaire, les propriétés des observations sont appelées variables explicatives (ou variables indépendantes, régresseurs, etc.), et les catégories à prédire sont appelées résultats. sont considérés comme des valeurs possibles de la varia dépendante ble. En apprentissage automatique, les observations sont souvent appelées instances, les variables explicatives sont appelées caractéristiques (regroupées dans un vecteur de caractéristiques) et les catégories possibles à prédire sont des classes. D'autres domaines peuvent utiliser une terminologie différente: par exemple, en écologie de communauté, le terme " classification" désigne normalement une analyse en grappes, c'est-à-dire un type d’apprentissage non supervisé, plutôt que l'apprentissage supervisé décrit dans cet article.

Organisme de formation

CPF, Pole Emploi, Plan de formation   OF N°11755165975 - 17 rue etex, Paris

Recevez des exclus !

Abonnez-vous et recevez des infos en exclu

24pm academy
17 rue etex 75018 Paris
O6 62 55 OO 1O

Search