Qu'est-ce que les statistiques non paramétriques?

Les statistiques non paramétriques sont une méthode qui fait des inférences statistiques sans tenir compte de toute distribution sous-jacente. La méthode correspond à une distribution normale sans hypothèses. Habituellement, l'approche utilise des données qui sont souvent des données ordinales. Dans les statistiques, les données ordinales sont le type de données dans lesquelles les valeurs suivent un ordre naturel. L'une des caractéristiques les plus notables des données ordinales est que parce qu'elles reposent sur des classements plutôt que sur des nombres.

Statistiques non paramétriques

Les statistiques non paramétriques peuvent être comparées aux statistiques paramétriques. Cette dernière approche fait des hypothèses explicites sur la distribution des données observées et estime les paramètres de la distribution en utilisant les mêmes données.

Résumé

  • Les statistiques non paramétriques sont une méthode qui ne tient pas compte de toute distribution sous-jacente lors de l'inférence statistique.
  • Les méthodes statistiques non paramétriques visent à découvrir la distribution sous-jacente inconnue des données observées, ainsi qu'à faire une inférence statistique en l'absence de la distribution sous-jacente.
  • Il est conseillé aux chercheurs de prendre en compte les faiblesses, les forces et les pièges potentiels des statistiques non paramétriques.

Comprendre les statistiques non paramétriques

Considérons les données avec des paramètres inconnus µ (moyenne) et σ2 (variance). Alors que les statistiques paramétriques supposent que les données ont été tirées d'une distribution normale Distribution normale La distribution normale est également appelée distribution gaussienne ou de Gauss. Ce type de distribution est largement utilisé en sciences naturelles et sociales. Le, une statistique non paramétrique ne suppose pas que les données sont normalement distribuées ou quantitatives. À cet égard, les statistiques non paramétriques estimeraient la forme de la distribution elle-même, au lieu d'estimer les individus µ et σ2.

D'autre part, les statistiques paramétriques utiliseraient la moyenne de l'échantillon et l'écart-type de l'échantillon pour estimer les valeurs de µ et σ2, respectivement. La structure du modèle des statistiques non paramétriques est déduite des données observées, par opposition à un a priori spécifié . Le terme non paramétrique lui-même implique que le nombre et la nature des paramètres sont flexibles et non qu'ils manquent entièrement de paramètres.

Types de statistiques non paramétriques

Il existe deux principaux types de méthodes statistiques non paramétriques. La première méthode cherche à découvrir la distribution sous-jacente inconnue des données observées, tandis que la seconde méthode tente de faire une inférence statistique sans tenir compte de la distribution sous-jacente.

Méthodes du noyau et histogrammes Histogramme Un histogramme est utilisé pour résumer des données discrètes ou continues. En d'autres termes, un histogramme fournit une interprétation visuelle des données numériques en montrant le nombre de points de données qui se situent dans une plage de valeurs spécifiée (appelée «bacs»). Un histogramme est similaire à un graphique à barres verticales. Cependant, un histogramme, est couramment utilisé pour estimer les valeurs des paramètres dans la première approche. En revanche, cette dernière méthode consiste à tester des hypothèses sans les valeurs réelles des données, mais plutôt en fonction de l'ordre de classement des données.

Les tests de statistiques non paramétriques ont tendance à être plus faciles à appliquer que les statistiques paramétriques, étant donné le manque d'hypothèses sur les paramètres de population. Les procédures mathématiques standard pour le test d'hypothèses ne font aucune hypothèse sur les distributions de probabilité - y compris les tests t de distribution, les tests de signe et les inférences sur une seule population.

Par exemple, lors du test de l'hypothèse selon laquelle «il y a une différence dans les médianes», les deux variables aléatoires, X et Y, définissent deux distributions continues entre l'endroit où l'hypothèse est effectuée et les échantillons appariés sont tirés. En plus d'avoir une applicabilité générale, le test n'a pas non plus la puissance statistique d'autres tests, étant donné qu'il fonctionne sous quelques hypothèses.

Exemples de statistiques non paramétriques

Supposons qu'un chercheur s'intéresse à estimer le nombre de bébés nés avec la jaunisse dans l'état de Californie. Une analyse de l'ensemble de données peut être effectuée en prélevant un échantillon de 5 000 bébés. Une estimation de l'ensemble de la population de bébés atteints de jaunisse nés l'année suivante est la mesure dérivée.

Pour un deuxième cas, considérons deux groupes de chercheurs différents. Ils souhaitent savoir si le marketing général ou le marketing commercial est associé à la rapidité avec laquelle une entreprise gagne en position de marque. En supposant que la taille de l'échantillon est choisie au hasard, sa distribution en fonction de la rapidité avec laquelle une entreprise réalise un positionnement de marque Positionnement sur le marché Le positionnement sur le marché fait référence à la capacité d'influencer la perception des consommateurs concernant une marque ou un produit par rapport à ses concurrents. On peut supposer que l’objectif du marché est normal. Néanmoins, une expérience qui mesure les objectifs stratégiques de l'entreprise pour aborder la dynamique du marché (qui détermine également le positionnement de la marque) ne peut pas être supposée adopter une distribution normale.

L'idée principale derrière le phénomène est que des données sélectionnées au hasard peuvent contenir des facteurs tels que la dynamique du marché. À l'autre extrême, si des facteurs tels que le segment de marché et la concurrence entrent en jeu, les objectifs stratégiques de l'entreprise ne sont pas susceptibles d'avoir un impact sur la taille de l'échantillon. Une telle approche est efficace lorsque les données ne disposent pas d'une interprétation numérique claire.

Par exemple, les tests visant à déterminer si les clients préfèrent un produit particulier en raison de sa valeur nutritionnelle peuvent inclure un classement de ses paramètres comme fortement d'accord, d'accord, indifférent, en désaccord et fortement en désaccord. Dans un tel scénario, une méthode non paramétrique est utile.

Points clés à retenir

L'utilisation d'approches statistiques non paramétriques dans la recherche nécessite une diligence raisonnable sur ses faiblesses, ses forces et ses pièges potentiels. Il est vrai que pour la distribution de données ayant un excès de kurtosis ou d'asymétrie; Les tests non paramétriques basés sur les rangs se révèlent plus puissants que les tests paramétriques.

Même ainsi, ce ne sont pas tous les cas où, si les hypothèses paramétriques ne sont pas satisfaites, nous n'adoptons pas des statistiques non paramétriques comme méthodes de substitution en raison du degré de confiance relativement faible obtenu à partir des statistiques antérieures.

Les statistiques non paramétriques sont appréciées car elles peuvent être appliquées facilement. Les données deviennent plus applicables à divers tests puisque les paramètres ne sont pas obligatoires. Plus important encore, les statistiques peuvent être utilisées en l'absence d'informations vitales, telles que la moyenne, l'écart type ou la taille de l'échantillon. Les fonctionnalités font que les statistiques non paramétriques ont un champ d'application plus large que les statistiques paramétriques.

Ressources supplémentaires

Finance est le fournisseur officiel de la certification mondiale Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ L'accréditation Certified Banking & Credit Analyst (CBCA) ™ est une norme mondiale pour les analystes de crédit qui couvre la finance, la comptabilité, l'analyse de crédit et l'analyse des flux de trésorerie , modélisation d'alliances, remboursements de prêts, etc. programme de certification, conçu pour aider quiconque à devenir un analyste financier de classe mondiale. Pour continuer à faire avancer votre carrière, les ressources financières supplémentaires ci-dessous vous seront utiles:

  • Concepts statistiques de base en finance Concepts statistiques de base en finance Une solide compréhension des statistiques est essentielle pour nous aider à mieux comprendre la finance. De plus, les concepts de statistiques peuvent aider les investisseurs à surveiller
  • Test d'hypothèse Test d'hypothèse Le test d'hypothèse est une méthode d'inférence statistique. Il est utilisé pour tester si une déclaration concernant un paramètre de population est correcte. Tests d'hypothèses
  • Données nominales Données nominales Dans les statistiques, les données nominales (également appelées échelle nominale) sont un type de données utilisé pour étiqueter des variables sans fournir de valeur quantitative
  • Tests non paramétriques Tests non paramétriques En statistique, les tests non paramétriques sont des méthodes d'analyse statistique qui ne nécessitent pas de distribution pour répondre aux hypothèses requises à analyser

Recommandé

Qu'est-ce qu'une courbe en J?
Qu'est-ce qu'une obligation à coupon?
Quel est le coût sans levier du capital?