Qu'est-ce que les statistiques?

Statistiques est un terme dérivé du mot latin «statut», qui signifie un groupe de chiffres utilisés pour représenter des informations sur un intérêt humain. Il fait référence à la technique développée dans le but de collecter, d'examiner, d'analyser et de tirer des conclusions à partir de données quantifiées. Les données obtenues sont ensuite utilisées dans le processus décisionnel.

Analystes financiers Les analystes financiers - Que font-ils utilisent des méthodes statistiques pour analyser, évaluer et résumer de grands volumes de données sous une forme mathématique utile. Les statistiques sont appliquées dans de nombreuses disciplines telles que les affaires, les sciences sociales, la fabrication, la psychologie, etc.

Statistiques - Image de graphiques et de graphiques

Types de statistiques

L'étude des statistiques est regroupée en deux grandes catégories. Ils comprennent des statistiques descriptives et inférentielles.

1. Statistiques descriptives

Les statistiques descriptives décrivent les caractéristiques de base d'une population et la manière dont les données sont organisées. Cela permet aux analystes de voir les caractéristiques des données et de donner un sens à ces données. Par exemple, supposons qu'un magasin d'informatique vend des appareils électroniques et que sur les 1 000 appareils électroniques vendus, 300 sont des ordinateurs portables. Avec ces données, une description des données serait 30% de l'échantillon représente les ordinateurs portables.

Il existe deux principaux types de statistiques descriptives que les scientifiques utilisent, et ils comprennent:

Mesures de tendance centrale

Tendance centrale Tendance centrale La tendance centrale est un résumé descriptif d'un ensemble de données à travers une valeur unique qui reflète le centre de la distribution des données. Avec les mesures de variabilité comprennent la moyenne, la médiane et le mode. Ils sont utilisés pour montrer les tendances générales avec les données. La moyenne est utilisée pour montrer la moyenne de toutes les composantes d'un ensemble de données, tandis que la médiane représente le milieu des données, comme l'âge moyen des étudiants qui fréquentent l'université. Le mode est utilisé pour afficher les données les plus courantes dans une population, comme l'âge le plus courant des étudiants en première année d'université.

Mesures de propagation

Les mesures de propagation montrent à quel point un ensemble de valeurs est similaire ou différent et comment elles sont liées les unes aux autres. Certaines des statistiques utilisées pour décrire la répartition des données comprennent la plage, les quartiles, les variances, l'écart absolu, la distribution de fréquence et l'écart type Écart type D'un point de vue statistique, l'écart type d'un ensemble de données est une mesure de l'ampleur des écarts entre les valeurs des observations contenues.

Par exemple, dans une classe de 20 élèves, le score moyen d'un article de mathématiques peut être de 70 sur 100 points. Bien que la moyenne soit de 70 points, cela ne signifie pas que tous les élèves obtiendront 70 points. Cela signifie plutôt que les notes seront réparties, à la fois au-dessous et au-dessus de la note moyenne. Dans ce cas, les mesures de dispersion sont utilisées pour montrer comment les scores sont répartis.

2. Statistiques inférentielles

Les statistiques inférentielles utilisent des calculs mathématiques complexes pour déduire des tendances concernant une grande population. Lors de l'analyse d'une population importante, il est difficile d'analyser chaque membre de cette population un par un. Les scientifiques utilisent plutôt des statistiques inférentielles pour déterminer les relations entre les variables dans un échantillon de population, puis utilisent les informations pour faire des prédictions sur la façon dont les variables se rapportent à la population générale.

Par exemple, si les scientifiques analysent le nombre d'hommes mariés dans une population d'un million d'hommes, ils collecteront un échantillon de la population d'un million d'hommes, puis feront des généralisations sur l'ensemble de la population sur la base des informations obtenues à partir de l'échantillon.

Les deux principales classifications des statistiques inférentielles sont les suivantes:

Intervalle de confiance

L'intervalle de confiance Intervalle de confiance Un intervalle de confiance est une estimation d'un intervalle dans les statistiques qui peut contenir un paramètre de population. Le paramètre de population inconnu est trouvé grâce à un paramètre d'échantillon calculé à partir des données échantillonnées. Par exemple, la moyenne de la population μ est trouvée en utilisant la moyenne de l'échantillon x̅. est calculé à partir des statistiques des données observées qui peuvent contenir la valeur réelle d'un paramètre de population inconnu.

Tests d'hypothèses

Test d'hypothèse Test d'hypothèse Le test d'hypothèse est une méthode d'inférence statistique. Il est utilisé pour tester si une déclaration concernant un paramètre de population est correcte. Le test d'hypothèse se produit lorsque les scientifiques analysent un échantillon d'une population et utilisent ensuite ces informations pour faire une déclaration sur la grande population à laquelle appartient l'échantillon.

Propriétés des statistiques

Certaines des caractéristiques potentielles qu'une statistique devrait inclure:

1. Complétude

L'exhaustivité fait référence à une indication de la disponibilité ou non des données nécessaires pour répondre à la demande d'informations dans la ressource de données. L'exhaustivité des données est nécessaire pour garantir l'exactitude des données observées.

2. Cohérence

La cohérence est considérée en termes d'uniformité ou de stabilité des données. Certaines des statistiques utilisées pour mesurer la cohérence comprennent l'écart type, la plage et la variance. Lors de la mesure de la cohérence des données d'un échantillon représentatif d'une grande population, l'erreur standard de la moyenne est généralement examinée.

En outre, lors de l'utilisation d'instruments pour collecter des données, la cohérence peut être mesurée en estimant la fiabilité des scores obtenus.

3. Suffisance

Une statistique est considérée comme suffisante si aucune autre statistique ne peut être calculée à partir de l'échantillon. Le concept de suffisance est courant dans les statistiques descriptives en raison de sa forte dépendance à l'hypothèse de la forme de distribution des données.

4. Impartialité

Le biais des statistiques est déterminé par la différence entre la valeur réelle du paramètre mesuré et la valeur attendue de l'estimateur. Si la moyenne de la distribution d'échantillonnage et la valeur attendue du paramètre sont égales, la statistique est considérée comme non biaisée.

Lectures connexes

Finance est le fournisseur officiel du programme de certification FMVA® Global Financial Modeling & Valuation Analyst (FMVA) ™. . Pour continuer à apprendre et faire progresser votre carrière, les ressources financières supplémentaires ci-dessous vous seront utiles:

  • Théorème de Bayes Théorème de Bayes En statistique et en théorie des probabilités, le théorème de Bayes (également connu sous le nom de règle de Bayes) est une formule mathématique utilisée pour déterminer le conditionnel
  • Matrice de corrélation Matrice de corrélation Une matrice de corrélation est simplement un tableau qui affiche les coefficients de corrélation pour différentes variables. La matrice représente la corrélation entre toutes les paires de valeurs possibles dans un tableau. C'est un outil puissant pour résumer un grand ensemble de données et pour identifier et visualiser des modèles dans les données données.
  • Loi des grands nombres Loi des grands nombres En statistique et en théorie des probabilités, la loi des grands nombres est un théorème qui décrit le résultat de la répétition de la même expérience un grand nombre de
  • Règle de probabilité totale Règle de probabilité totale La règle de probabilité totale (également appelée loi de probabilité totale) est une règle fondamentale dans les statistiques relatives aux conditions conditionnelles et marginales.

Recommandé

Crackstreams a-t-il été fermé ?
2022
Le centre de commande MC est-il sûr ?
2022
Taliesin quitte-t-il un rôle critique?
2022