Régression multiple

Définition - Que signifie la régression multiple?

La régression multiple est un outil statistique utilisé pour dériver la valeur d'un critère à partir de plusieurs autres variables indépendantes ou prédictives. C'est la combinaison simultanée de plusieurs facteurs pour évaluer comment et dans quelle mesure ils affectent un certain résultat.

Cette technique s'effondre lorsque la nature des facteurs eux-mêmes est de nature non mesurable ou purement aléatoire.

Definir Tech explique la régression multiple

Les instances de régression multiple abondent dans la vraie vie. Par exemple, un planificateur zonal veut savoir comment la valeur des maisons est affectée par des facteurs comme le revenu moyen du ménage dans la région, la superficie en pieds carrés de la maison, la superficie du terrain de la maison et l'année de sa construction. Après avoir tracé tout cela dans un système capable d'effectuer une régression multiple, il découvre que les facteurs qui affectent le plus le prix de vente d'une maison sont la superficie en pieds carrés et le revenu moyen de la région. La régression multiple peut même aller plus loin et lui montrer que les maisons à prix élevé sont beaucoup plus affectées par les deux mêmes facteurs que les maisons à prix bas et moyen.

Un autre exemple est une entreprise de recrutement qui essaie de déterminer une rémunération appropriée. Il constate que les variables prédictives du salaire sont le salaire actuel, le nombre de personnes qu'un employé a supervisé et le montant de la responsabilité qui lui est confiée. L'entreprise peut utiliser la régression multiple pour découvrir que le salaire actuel d'un employé potentiel est le déterminant le plus important du salaire que la personne sera prête à accepter dans un nouvel emploi.

La régression multiple, cependant, n'est pas fiable dans les cas où il y a de fortes chances que les résultats soient affectés par des facteurs non mesurables ou par pur hasard. Par exemple, nous ne pouvons pas utiliser la régression avec précision pour calculer dans quelle mesure divers facteurs (état de l'économie, inflation, revenu disponible moyen, prévisions de revenus des entreprises, etc.) influenceront l'indice boursier dans exactement 20 ans. Il y a tout simplement trop d'inconnues dans la mécanique de ces facteurs externes.