Validation croisée

Définition - Que signifie la validation croisée?

La validation croisée est une technique utilisée pour évaluer la manière dont les résultats de l'analyse statistique se généralisent à un ensemble de données indépendant. La validation croisée est largement utilisée dans les contextes où la cible est la prédiction et où il est nécessaire d'estimer la précision des performances d'un modèle prédictif. La principale raison de l'utilisation de la validation croisée plutôt que de la validation conventionnelle est qu'il n'y a pas suffisamment de données disponibles pour les partitionner en ensembles de formation et de test séparés (comme dans la validation conventionnelle). Cela entraîne une perte de capacité de test et de modélisation.

La validation croisée est également appelée estimation de rotation.

Definir Tech explique la validation croisée

Pour un problème de prédiction, un modèle est généralement fourni avec un ensemble de données connues, appelé ensemble de données d'apprentissage, et un ensemble de données inconnues par rapport auquel le modèle est testé, appelé ensemble de données de test. L'objectif est de disposer d'un ensemble de données pour tester le modèle lors de la phase d'apprentissage, puis de fournir des informations sur la manière dont le modèle spécifique s'adapte à un ensemble de données indépendant. Un cycle de validation croisée comprend le partitionnement des données en sous-ensembles complémentaires, puis l'exécution d'une analyse sur un sous-ensemble. Après cela, l'analyse est validée sur d'autres sous-ensembles (ensembles de test). Pour réduire la variabilité, de nombreux cycles de validation croisée sont effectués en utilisant de nombreuses partitions différentes, puis une moyenne des résultats est prise. La validation croisée est une technique puissante dans l'estimation de la technique de performance du modèle.