Quel est le coefficient de détermination?

Le coefficient de détermination (R² ou r-carré) est une mesure statistique dans un modèle de régression qui détermine la proportion de variance dans la variable dépendante qui peut être expliquée par la variable indépendante Variable indépendante Une variable indépendante est une entrée, une hypothèse ou un inducteur qui est modifiée afin d'évaluer son impact sur une variable dépendante (le résultat). . En d'autres termes, le coefficient de détermination indique dans quelle mesure les données correspondent au modèle (la qualité de l'ajustement).

Coefficient de détermination

Bien que le coefficient de détermination fournisse des informations utiles sur le modèle de régression, il ne faut pas se fier uniquement à la mesure dans l'évaluation d'un modèle statistique. Il ne divulgue pas d'informations sur la relation de causalité entre les variables indépendantes et dépendantes Variable dépendante Une variable dépendante est une variable qui changera en fonction de la valeur d'une autre variable, appelée variable indépendante. et il n'indique pas l'exactitude du modèle de régression. Par conséquent, l'utilisateur doit toujours tirer des conclusions sur le modèle en analysant le coefficient de détermination avec d'autres variables dans un modèle statistique.

Le coefficient de détermination peut prendre n'importe quelle valeur entre 0 et 1. De plus, la métrique statistique est fréquemment exprimée en pourcentages.

Interprétation du coefficient de détermination (R²)

L'interprétation la plus courante du coefficient de détermination est l'adéquation du modèle de régression aux données observées. Par exemple, un coefficient de détermination de 60% montre que 60% des données correspondent au modèle de régression. En général, un coefficient plus élevé indique un meilleur ajustement pour le modèle.

Cependant, il n'est pas toujours vrai qu'un r-carré élevé soit bon pour le modèle de régression. La qualité du coefficient dépend de plusieurs facteurs, dont les unités de mesure des variables, la nature des variables utilisées dans le modèle et la transformation des données appliquée. Ainsi, parfois, un coefficient élevé peut indiquer des problèmes avec le modèle de régression.

Aucune règle universelle ne régit la manière d'incorporer le coefficient de détermination dans l'évaluation d'un modèle. Le contexte dans lequel la prévision ou l'expérience est basée est extrêmement important et, dans différents scénarios, les informations issues de la métrique statistique peuvent varier.

Calcul du coefficient

Mathématiquement, le coefficient de détermination peut être trouvé en utilisant la formule suivante:

Formule

Où:

  • Régression SS - la somme des carrés due à la régression (somme expliquée des carrés)
  • Total SS - la somme totale des carrés

Bien que les termes «somme totale des carrés» et «somme des carrés due à la régression» semblent confus, la signification des variables est simple.

La somme totale des carrés mesure la variation des données observées (données utilisées dans la modélisation de régression). La somme des carrés due à la régression mesure dans quelle mesure le modèle de régression représente les données utilisées pour la modélisation.

Plus de ressources

Finance est le fournisseur officiel du programme de certification FMVA® Global Financial Modeling & Valuation Analyst (FMVA) ™. . Pour continuer à apprendre et faire progresser votre carrière, les ressources financières supplémentaires ci-dessous vous seront utiles:

  • Concepts statistiques de base en finance Concepts statistiques de base en finance Une solide compréhension des statistiques est essentielle pour nous aider à mieux comprendre la finance. De plus, les concepts de statistiques peuvent aider les investisseurs à surveiller
  • Distribution binomiale Distribution binomiale La distribution binomiale est une distribution de probabilité commune qui modélise la probabilité d'obtenir l'un des deux résultats sous un nombre donné de paramètres
  • Théorème de la limite centrale Théorème de la limite centrale Le théorème de la limite centrale stipule que la moyenne de l'échantillon d'une variable aléatoire supposera une distribution presque normale ou normale si la taille de l'échantillon est grande
  • Analyse de régression Analyse de régression L'analyse de régression est un ensemble de méthodes statistiques utilisées pour estimer les relations entre une variable dépendante et une ou plusieurs variables indépendantes. Il peut être utilisé pour évaluer la force de la relation entre les variables et pour modéliser la relation future entre elles.

Recommandé

Qu'est-ce qu'une obligation remboursable?
Qu'est-ce que la fonction SOUS-TOTAL dans Excel?
Émetteurs d'obligations