logo

Variance

Variance est une valeur de mesure utilisée pour déterminer comment les données sont réparties concernant la moyenne ou la valeur moyenne de l'ensemble de données. Il est utilisé pour savoir comment les données de distribution sont réparties concernant la moyenne ou la valeur moyenne. Le symbole utilisé pour définir la variance est σ2. C'est le carré de l'écart type.

Il existe deux types de variance utilisés en statistique,



  • Écart de l'échantillon
  • Variation démographique

La variance de la population est utilisée pour déterminer comment chaque point de données dans une population particulière fluctue ou s'étale, tandis que la variance de l'échantillon est utilisée pour trouver la moyenne des écarts carrés par rapport à la moyenne.

Dans cet article, nous découvrirons Variance (échantillon, population), leurs formules, propriétés et autres en détail.

Table des matières



Qu’est-ce que l’écart ?

Nous mesurons les différentes valeurs des données et ces valeurs sont utilisées à diverses fins. Les données peuvent être fournies sous deux types de données groupées ou de données non groupées (discrètes). Si les données sont fournies sous forme d'intervalles de classe, elles sont appelées données groupées, tandis que si les données sont fournies sous la forme d'un seul point de données, elles sont appelées points de données discrets ou non groupés. La variance est la mesure de la dispersion des données concernant la valeur moyenne des données. Il nous indique comment les données sont dispersées dans la valeur de données donnée. Nous pouvons facilement calculer la variance de l'échantillon et la variance de la population pour les données groupées et non groupées.

Définition de l'écart

Variance est une mesure statistique qui quantifie la propagation ou la dispersion d'un ensemble de points de données. Il indique dans quelle mesure les points de données individuels d'un ensemble de données diffèrent de la moyenne (moyenne) de l'ensemble de données.

Types d'écart

Nous pouvons définir la variance des données données en deux types,



  • Variation démographique
  • Écart de l'échantillon

Découvrons-les maintenant en détail.

Variation démographique

La variance de la population est utilisée pour trouver la répartition de la population donnée. La population est définie comme un groupe de personnes et toutes les personnes appartenant à ce groupe font partie de la population. Cela nous renseigne sur la façon dont la population d'un groupe varie par rapport à la population moyenne.

Tous les membres d’un groupe sont appelés la population. Lorsque nous voulons déterminer comment chaque point de données dans une population donnée varie ou est réparti, nous utilisons la variance de la population. Il est utilisé pour donner la distance au carré de chaque point de données par rapport à la moyenne de la population.

Écart de l'échantillon

Si les données démographiques sont très volumineuses, il devient difficile de calculer la variance démographique de l’ensemble de données. Dans ce cas, nous prenons un échantillon de données de l'ensemble de données donné et trouvons la variance de cet ensemble de données, appelée variance d'échantillon. Lors du calcul de la moyenne de l'échantillon, nous veillons à calculer la moyenne de l'échantillon, c'est-à-dire la moyenne de l'ensemble de données de l'échantillon et non la moyenne de la population. Nous pouvons définir la variance de l'échantillon comme la moyenne du carré de la différence entre le point de données de l'échantillon et la moyenne de l'échantillon.

Symbole d'écart

Le symbole de la variance est généralement représenté par la lettre grecque sigma au carré (σ²) lorsqu'on fait référence à la variance de la population. Pour la variance de l’échantillon, elle est souvent désignée par s².

Exemple d'écart

Nous pouvons comprendre le concept de variance à l’aide de l’exemple discuté ci-dessous.

Trouvez la variance de population des données {4,6,8,10}

Solution:

Moyenne = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
dix (10-7)2 9

Écart = (9+1+1+9)/4 = 20/4 = 5

Ainsi, la variance des données est de 5

Formule d'écart

La variance d'un ensemble de données est désignée par le symbole σ2. Pour les données démographiques, sa formule est égale à la somme des carrés des différences entre les entrées de données et la moyenne divisée par le nombre d'entrées. Alors que pour les exemples de données, nous divisons la valeur du numérateur par la différence entre le nombre d'entrées et l'unité.

Exemple de formule de variance

Si l'ensemble de données est un échantillon, la formule de variance est donnée par,

p 2 = ∑ (x je - X) 2 /(n – 1)

où,

  • X est la moyenne de l'ensemble de données de l'échantillon
  • n est le nombre total d'observations

Formule de variance démographique

Si nous avons un ensemble de données démographiques, la formule s'écrit comme suit :

p 2 = ∑ (x je - X) 2 /n

où,

  • X est la moyenne de l'ensemble de données sur la population
  • n est le nombre total d'observations

Nous pouvons également calculer la variance pour des ensembles de données groupés et non groupés. Diverses formules pour la variance sont,

force de cache propre npm

Formule de variance pour les données groupées

Pour les données groupées, la formule de variance est discutée ci-dessous,

Exemple de formule de variance pour les données groupées (σ 2 ) = ∑f(m je - X) 2 /(n-1)

Formule de variance de population pour les données groupées (p 2 ) = ∑f(m je - X) 2 /n

où,

  • F est la fréquence de chaque intervalle
  • m je est le milieu du ièmeintervalle
  • X est la moyenne des données groupées

Pour les données groupées, la moyenne est calculée comme suit :

Moyenne = ∑ (f je X je ) / ∑f je

Formule de variance pour les données non groupées

Pour les données non groupées, la formule de variance est discutée ci-dessous,

  • Exemple de formule de variance pour les données non groupées (p 2 ) = ∑ (x je - X) 2 /(n-1)
  • Formule de variance de population pour les données non groupées (p 2 ) = ∑ (x je - X) 2 /n

X est la moyenne des données groupées

Formule pour calculer la variance

La formule utilisée pour calculer la variance est expliquée dans l'image ci-dessous,

Formule d'écart

Comment calculer la variance ?

En général, la variance signifie la variance standard de la population. Les étapes pour calculer la variance d'un ensemble de valeurs donné sont les suivantes :

Étape 1: Calculez la moyenne de l'observation à l'aide de la formule (Moyenne = Somme des observations/Nombre d'observations)

Étape 2: Calculez les différences au carré des valeurs des données par rapport à la moyenne. (Valeur des données – Moyenne)2

Étape 3: Calculez la moyenne des carrés des différences des valeurs données, appelées variance de l'ensemble de données.

(Variance = Somme des différences au carré / Nombre d'observations)

Variance et écart type

Écart et Écart-type les deux sont des mesures de la tendance centrale qui sont utilisées pour nous indiquer dans quelle mesure les valeurs de l'ensemble de données s'écartent par rapport à la valeur centrale ou moyenne de l'ensemble de données.

Il existe une relation définie entre la variance et l'écart type pour tout ensemble de données donné.

Variance = (écart type) 2

La variance est définie comme le carré de l'écart type, c'est-à-dire que prendre le carré de l'écart type pour n'importe quel groupe de données nous donne la variance de cet ensemble de données. la variance est définie à l'aide du symbole p 2 alors que p est utilisé pour définir l’écart type de l’ensemble de données. La variance de l'ensemble de données est exprimée en unités carrées tandis que l'écart type de l'ensemble de données est exprimé dans une unité similaire à la moyenne de l'ensemble de données.

Apprendre encore plus: Variance et écart type

Variance de la distribution binomiale

Distribution binomiale est la distribution de probabilité discrète qui nous indique le nombre de résultats positifs dans une expérience binomiale effectuée n fois. Le résultat de l’expérience binomiale est 0 ou 1, c’est-à-dire positif ou négatif.

Dans l’expérience binomiale de n essais et où la probabilité de chaque essai est donnée p , alors la variance de la distribution binomiale est donnée en utilisant,

p 2 = np (1 – p)

'par exemple' est défini comme la moyenne des valeurs de la distribution binomiale.

Variance de la distribution de Poisson

Répartition des poisons est défini comme une distribution de probabilité discrète utilisée pour définir la probabilité qu'un nombre « n » d'événements se produisent au cours de la période « x ». La moyenne de la distribution de Poisson est définie par le symbole l.

Dans la distribution de Poisson, la moyenne et la variance de l'ensemble de données donné sont égales. La variance de la distribution de Poisson est donnée à l'aide de la formule,

p 2 = λ

Variation de distribution uniforme

Dans une distribution uniforme, les données de distribution de probabilité sont continues. Le résultat de ces expériences se situe dans la plage entre une limite supérieure spécifique et une limite inférieure spécifique et ces distributions sont donc également appelées distributions rectangulaires. Si la limite supérieure ou la limite maximale est b et la limite inférieure ou la limite minimale est a alors la variance de la distribution uniforme est calculée à l'aide de la formule,

p 2 = (1/12)(b – une) 2

La moyenne de la distribution uniforme est donnée à l'aide de la formule,

Moyenne = (b + a) / 2

où,

  • b est la limite supérieure de la distribution uniforme
  • un est la limite inférieure de la distribution uniforme

Variance et covariance

La variance de l'ensemble de données définit la volatilité de toutes les valeurs de l'ensemble de données par rapport à la valeur moyenne de l'ensemble de données. La covariance nous indique comment les variables aléatoires sont liées les unes aux autres et comment le changement d'une variable affecte le changement des autres variables.

La covariance peut être positive ou négative, la covariance positive signifie que les deux variables se déplacent dans la même direction par rapport à la valeur moyenne tandis que la covariance négative signifie que les deux variables se déplacent dans des directions opposées par rapport à la valeur moyenne.

Pour deux variables aléatoires x et y où x est la variable dépendante et y est la variable indépendante, la covariance est calculée à l'aide de la formule mentionnée dans l'image ci-jointe.

Formule de covariance

Propriétés des écarts

La variance est largement utilisée en mathématiques, en statistiques et dans d’autres branches scientifiques à diverses fins. La variance possède diverses propriétés largement utilisées pour résoudre divers problèmes. Certaines des propriétés fondamentales de la variance sont,

  • La variance de l'ensemble de données est la quantité non négative et la valeur nulle de la variance signifie que toutes les valeurs de l'ensemble de données sont égales.
  • Une valeur de variance plus élevée nous indique que toutes les valeurs de données de l'ensemble de données sont largement dispersées, c'est-à-dire qu'elles sont éloignées de la valeur moyenne de l'ensemble de données.
  • Une valeur inférieure de la variance nous indique que toutes les valeurs de données de l'ensemble de données sont proches les unes des autres, c'est-à-dire qu'elles sont très proches de la valeur moyenne de l'ensemble de données.

Pour toute constante 'c'

carte java de l'itérateur
  • Var(x + c) = Var(x)

X est une variable aléatoire

  • Var(cx) = c2

X est une variable aléatoire

Également si un et b sont la valeur constante et X est alors une variable aléatoire,

  • Var(hache + b) = une2

Pour les variables indépendantes x1, X2, X3…,Xnnous savons que,

  • Où(x1+x2+……+xn) = Var(x1) + Où(x2) +……..+Où(xn)

Les gens lisent également :

  • Signifier
  • Mode
  • Différence entre la variance et l'écart type

Exemples de formule de variance

Exemple 1 : Calculez la variance des données de l'échantillon : 7, 11, 15, 19, 24.

Solution:

Nous avons les données, 7, 11, 15, 19, 24

Trouvez la moyenne des données.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

En utilisant la formule de variance que nous obtenons,

p2= ∑ (xje- X)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Exemple 2 : Calculez le nombre d'observations si la variance des données est de 12 et la somme des carrés des différences entre les données et la moyenne est de 156.

Solution:

Nous avons,

(Xje- X)2= 156

p2= 12

En utilisant la formule de variance que nous obtenons,

p2= ∑ (xje- X)2/n

12 = 156/n

n = 156/12

n = 13

Exemple 3 : Calculer la variance pour les données données

Xje

Fje

dix 1
4 3
6 5
8 1

Solution:

Moyenne (x̄) = ∑(fjeXje)/∑(fje)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fje) = 1+3+5+1 = 10

Xje

Fje

FjeXje

(Xje- X)

(Xje- X)2

Fje(Xje- X)2

dix 1 dix 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Maintenant,

p 2 = (∑ je n F je (X je - X) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Variance(σ2) = 3,6

Exemple 4 : Trouver la variance du tableau de données suivant

Classe

Fréquence

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Solution:

Classe

XI

Fje

f×Xi

Xi – μ

(Xi – µ)2

f×(Xi – μ)2

0-10

5

3

quinze

-quinze

225

675

10-20

quinze

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

quinze

225

450

40-50

Quatre cinq

1

Quatre cinq

25

625

625

Total

16

320

2000

Moyenne (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

p 2 = (∑ je n F je (X je – m) 2 /n)

= [(2000)/(16)]
= (125)

La variance de l'ensemble de données donné est de 125.

Sommaire – Écart

La variance est une mesure statistique qui montre dans quelle mesure les valeurs d'un ensemble de données diffèrent de la moyenne. Cela nous aide à comprendre la propagation ou la dispersion des points de données. Il existe deux principaux types de variance : la variance de la population, qui mesure la répartition des points de données dans une population entière, et la variance de l'échantillon, qui mesure la répartition des points de données dans un échantillon. La variance est notée σ² et est le carré de l'écart type. Pour calculer la variance, vous trouvez la moyenne des données, soustrayez la moyenne de chaque point de données, mettez les différences au carré, puis faites la moyenne de ces différences au carré. La variance est importante car elle nous aide à comprendre la variabilité au sein d'un ensemble de données. Une variance élevée indique que les points de données sont largement répartis, tandis qu'une faible variance indique qu'ils sont proches de la moyenne. La variance est toujours non négative puisqu’elle implique la quadrature des différences.

FAQ sur la variance

Qu’est-ce que la variance dans les statistiques ?

La variance est définie comme l'étalement des valeurs de l'ensemble de données par rapport à la valeur moyenne de l'ensemble de données. La variance de l'ensemble de données indique dans quelle mesure les valeurs d'un ensemble de données particulier s'écartent de la valeur moyenne.

Quel est le symbole de la variance ?

On utilise les symboles σ2, s2 et Var(x) pour désigner la variance de l'ensemble de données.

Quelle est la formule de variance ?

La variance de l'ensemble de données est calculée à l'aide de la formule,

p 2 = E[( X – m ) 2 ]

Que dit Variance ?

La variance est utilisée pour déterminer l'étendue de la répartition des données, c'est-à-dire qu'elle nous indique comment les valeurs d'un ensemble de données sont réparties par rapport à la valeur moyenne. Pour la plus grande valeur de variance, les valeurs sont largement réparties par rapport à la valeur moyenne tandis que pour la plus petite valeur de variance, les valeurs sont étroitement réparties par rapport à la valeur moyenne.

Quelle est la relation entre la variance et l’écart type ?

Pour l'ensemble de données donné, la variance de l'ensemble de données est le carré de l'écart type de cet ensemble de données. Cette relation s'exprime comme suit:

Variance = (écart type) 2

Comment calculer l’écart ?

Pour calculer la variance, vous trouvez d’abord la moyenne (moyenne) de l’ensemble de données. Ensuite, soustrayez la moyenne de chaque point de données et mettez le résultat au carré. Enfin, faites la moyenne de ces carrés des différences.

machine à états finis

Pourquoi la variance est-elle importante ?

La variance est cruciale pour comprendre la distribution des données au sein d'un ensemble de données. Cela aide à déterminer l'écart entre les points de données et la valeur moyenne, indiquant la variabilité ou la cohérence des données.

Quelle est la différence entre la variance et l’écart type ?

Alors que la variance et l'écart type mesurent la dispersion des données, l'écart type est la racine carrée de la variance. L'écart type est exprimé dans les mêmes unités que les données, ce qui le rend plus interprétable pour indiquer l'écart.

La variance peut-elle être négative ?

Non, la variance ne peut pas être négative. Puisqu’elle est calculée comme la moyenne des carrés des différences par rapport à la moyenne, la valeur résultante est toujours non négative.