Quel est le R-carré ajusté?

Le R-carré ajusté est une version modifiée du R-carré qui tient compte des prédicteurs qui ne sont pas significatifs dans un modèle de régression. En d'autres termes, le R-carré ajusté montre si l'ajout de prédicteurs supplémentaires améliore ou non un modèle de régression. Pour comprendre le R-carré ajusté, une compréhension du R-carré est nécessaire.

Résumé:

  • Le R-carré ajusté est une version modifiée du R-carré qui ajuste les prédicteurs qui ne sont pas significatifs dans un modèle de régression.
  • Par rapport à un modèle avec des variables d'entrée supplémentaires, un R-carré ajusté inférieur indique que les variables d'entrée supplémentaires n'ajoutent pas de valeur au modèle.
  • Par rapport à un modèle avec des variables d'entrée supplémentaires, un R-carré ajusté plus élevé indique que les variables d'entrée supplémentaires ajoutent de la valeur au modèle.

Qu'est-ce que le R au carré?

Le R-carré, également appelé coefficient de détermination Coefficient de détermination Un coefficient de détermination (R² ou r-carré) est une mesure statistique dans un modèle de régression qui détermine la proportion de variance dans la personne dépendante, est utilisé pour expliquer le degré de quelles variables d'entrée (variables prédictives) expliquent la variation des variables de sortie (variables prédites). Il va de 0 à 1. Par exemple, si le R au carré est de 0,9, cela indique que 90% de la variation des variables de sortie sont expliquées par les variables d'entrée. De manière générale, un R-carré plus élevé indique un meilleur ajustement pour le modèle. Considérez le diagramme suivant:

R-carré ajusté

La ligne bleue fait référence à la ligne de meilleur ajustement et montre la relation entre les variables. La droite est calculée par analyse de régression Analyse de régression L'analyse de régression est un ensemble de méthodes statistiques utilisées pour estimer les relations entre une variable dépendante et une ou plusieurs variables indépendantes. Il peut être utilisé pour évaluer la force de la relation entre les variables et pour modéliser la relation future entre elles. et est tracé là où les distances verticales (lignes pointillées bleues) des points jaunes à la ligne de meilleur ajustement sont minimisées.

Les points jaunes font référence au tracé des variables d'entrée et de sortie. La variable d'entrée est représentée sur l'axe des x tandis que la variable de sortie est représentée sur l'axe des y. Par exemple, le graphique ci-dessus se compose de l'ensemble de données suivant:

R-carré ajusté - Données graphiques

Les lignes pointillées bleues font référence à la distance entre le tracé des variables d'entrée et de sortie et la ligne de meilleur ajustement. Le R au carré est dérivé de la distance de tous les points jaunes de la ligne de meilleur ajustement (la ligne bleue). Par exemple, le diagramme suivant illustre un R-carré de 1:

R au carré 1

Problèmes avec le R-carré

Le R-carré vient avec un problème inhérent - des variables d'entrée supplémentaires feront que le R-carré restera le même ou augmentera (cela est dû à la façon dont le R-carré est calculé mathématiquement). Par conséquent, même si les variables d'entrée supplémentaires ne présentent aucune relation avec les variables de sortie, le R-carré augmentera. Un exemple expliquant une telle occurrence est fourni ci-dessous.

Comprendre le R-carré ajusté

Essentiellement, le R-carré ajusté examine si des variables d'entrée supplémentaires contribuent au modèle. Prenons un exemple utilisant des données collectées par un propriétaire de pizza, comme indiqué ci-dessous:

Exemple de données

Supposons que le propriétaire de la pizza exécute deux régressions:

Régression 1: Prix de la pâte (variable d'entrée), Prix de la pizza (variable de sortie)

La régression 1 donne un R-carré de 0,9557 et un R-carré ajusté de 0,9493.

Régression 2: température (variable d'entrée 1), prix de la pâte (variable d'entrée 2), prix de la pizza (variable de sortie)

La régression 2 donne un R-carré de 0,9573 et un R-carré ajusté de 0,9431.

Même si la température ne doit exercer aucun pouvoir prédictif sur le prix d'une pizza, le R-carré est passé de 0,9557 (régression 1) à 0,9573 (régression 2). Une personne peut croire que la régression 2 a un pouvoir prédictif plus élevé puisque le R-carré est plus élevé. Même si la variable d'entrée de la température est inutile pour prédire le prix d'une pizza, elle a augmenté le R-carré. Ici, le R-carré ajusté entre en jeu.

Le R carré ajusté vérifie si des variables d'entrée supplémentaires contribuent au modèle. Le R carré ajusté dans la régression 1 était de 0,9493 par rapport au R carré ajusté dans la régression 2 de 0,9493. Par conséquent, le R-carré ajusté est capable d'identifier que la variable d'entrée de la température n'est pas utile pour expliquer la variable de sortie (le prix d'une pizza). Dans un tel cas, le R-carré ajusté indiquerait au créateur du modèle d'utiliser la régression 1 plutôt que la régression 2.

Exemple du R-carré ajusté

Considérez deux modèles:

  • Le modèle 1 utilise les variables d'entrée X1, X2 et X3 pour prédire Y1.
  • Le modèle 2 utilise les variables d'entrée X1 et X2 pour prédire Y1.

Quel modèle faut-il utiliser? Les informations concernant les deux modèles sont fournies ci-dessous:

Exemple

En comparant le R-carré entre le modèle 1 et le modèle 2, le R-carré prédit que le modèle 1 est un meilleur modèle car il a un plus grand pouvoir explicatif (0,5923 dans le modèle 1 contre 0,5612 dans le modèle 2).

En comparant le R-carré entre le modèle 1 et le modèle 2, le R-carré ajusté prédit que la variable d'entrée X3 contribue à expliquer la variable de sortie Y1 (0,4231 dans le modèle 1 contre 0,3512 dans le modèle 2).

En tant que tel, le modèle 1 doit être utilisé, car la variable d'entrée X3 supplémentaire contribue à expliquer la variable de sortie Y1.

Ressources supplémentaires

Finance propose la certification FMVA® Financial Modeling & Valuation Analyst (FMVA) ™. Rejoignez plus de 350 600 étudiants qui travaillent pour des entreprises comme Amazon, JP Morgan et le programme de certification Ferrari pour ceux qui cherchent à faire progresser leur carrière. Pour continuer à apprendre et faire progresser votre carrière, les ressources financières suivantes vous seront utiles:

  • Concepts statistiques de base pour la finance Concepts statistiques de base pour la finance Une solide compréhension des statistiques est d'une importance cruciale pour nous aider à mieux comprendre la finance. De plus, les concepts de statistiques peuvent aider les investisseurs à surveiller
  • Méthode High-Low vs. Analyse de régression Méthode High Low vs. Analyse de régression La méthode High Low et l'analyse de régression sont les deux principales méthodes d'estimation des coûts utilisées pour estimer les montants des coûts fixes et variables. Habituellement, les gestionnaires doivent diviser les coûts mixtes en leurs composantes fixes et variables pour prévoir et planifier l'avenir.
  • Variable indépendante Variable indépendante Une variable indépendante est une entrée, une hypothèse ou un facteur qui est modifié afin d'évaluer son impact sur une variable dépendante (le résultat).
  • Types d'analyse financière Types d'analyse financière L'analyse financière consiste à utiliser des données financières pour évaluer la performance d'une entreprise et faire des recommandations sur la façon dont elle peut s'améliorer à l'avenir. Les analystes financiers effectuent principalement leur travail dans Excel, en utilisant une feuille de calcul pour analyser les données historiques et faire des projections Types d'analyse financière

Recommandé

Qu'est-ce qu'un swap de matières premières?
Qu'est-ce qu'une débenture?
Qu'est-ce que la fonction ROUND?