Définition - Que signifie statistique?
La moyenne statistique est un certain type de moyenne mathématique très utile en informatique, et en apprentissage automatique en particulier.
Pour parler simplement, la moyenne statistique est un processus de moyenne arithmétique, en ce sens qu'elle additionne tous les nombres d'un ensemble de données, puis divise le total par le nombre de points de données.
C'est simple et direct, et donc la moyenne arithmétique ou la moyenne statistique a été largement utilisée tout au long de l'ère moderne et à l'ère de la programmation informatique.
Ici, nous pouvons différencier la moyenne statistique de deux autres types de moyens qui composent un groupe de trois méthodes statistiques appelées les moyennes de Pythagore. Les deux autres moyens sont appelés moyens harmoniques et géométriques.
Ces trois éléments peuvent être utiles dans l'apprentissage automatique et de nouveaux types d'ingénierie d'algorithmes d'intelligence artificielle.
Definir Tech explique la moyenne statistique
En général, la moyenne statistique est utile dans toutes sortes de tâches de classification et d'aide à la décision par apprentissage automatique.
Pensez-y de cette façon: le programme trace tous les points de données, puis utilise la moyenne statistique pour arriver à une moyenne, qu'il utilise pour aider l'ordinateur à apprendre grâce à ses processus d'apprentissage automatique.
La moyenne harmonique et la moyenne géométrique un peu plus complexes peuvent également être utilisées dans l'apprentissage automatique pour des choses spécifiques.
Par exemple, la moyenne harmonique est souvent utilisée pour dériver un «score F» qui aide à évaluer la récupération de données dans un système particulier.
Pour en revenir à la moyenne statistique, supposons que vous ayez cinq points de données et que le total soit 25. Votre moyenne statistique serait de cinq, mais vous ne savez pas exactement ce que chacun de ces cinq nombres est. Vous pourriez en avoir trois, un deux et un vingt - ou vous pourriez avoir un cinq cinq parfaitement symétriques.
Vous avez un ensemble de données comme le premier exemple mentionné ci-dessus, où la moyenne statistique est un peu biaisée. Vous pouvez avoir un ensemble de données avec les cinq nombres suivants - deux, trois, six, sept et 38.
Le total est de 56, mais un seul de ces chiffres est au-dessus de la moyenne statistique, ce qui est un peu trompeur.
C'est là que les ingénieurs en apprentissage automatique parlent de biais et de la manière dont différents types de moyens et de moyennes peuvent montrer des biais dans un programme d'apprentissage automatique.
Sans devenir trop complexes, les ingénieurs peuvent prévoir ce type de biais en rendant les algorithmes encore plus élaborés et en remettant en question ou en vérifiant ou en réévaluant les données de classification.
Le modèle de forêt aléatoire est une de ces techniques où, au lieu d'un seul ensemble de données, différents systèmes appelés «arbres» individuels capturent une gamme d'ensembles de données et tabulent les résultats collectivement.
L'essentiel est que la moyenne statistique, en tant que type de base de moyenne arithmétique, est très largement utile pour fournir les simplifications sur lesquelles les algorithmes d'apprentissage automatique fonctionnent.
Si vous avez un diagramme dispersé de données et que vous souhaitez le filtrer en un aperçu facilement compréhensible, comme le font de nombreux tableaux de bord d'entreprise, la moyenne statistique est un excellent moyen de faciliter cela.
Une grande partie des détails supplémentaires sur les moyennes statistiques et autres moyennes sont souvent étudiées par des mathématiciens professionnels et des ingénieurs en algorithmes.
Une moyenne arithmétique est calculée à l'aide de l'équation suivante: