La corrélation signifie essentiellement une connexion mutuelle entre deux ou plusieurs ensembles de données. En statistiques, des données bivariées ou deux variables aléatoires sont utilisées pour trouver la corrélation entre elles. Le Coefficient de corrélation est généralement la mesure de la corrélation entre les données bivariées qui indique essentiellement dans quelle mesure deux variables aléatoires sont corrélées entre elles.
Si le coefficient de corrélation est 0, les données bivariées ne sont pas corrélées entre elles.
Si le coefficient de corrélation est -1 ou +1, les données bivariées sont fortement corrélées entre elles.
r=-1 dénote une forte relation négative et r=1 dénote une forte relation positive.
De manière générale, si le coefficient de corrélation est proche de -1 ou +1 alors on peut dire que les données bivariées sont fortement corrélées entre elles.
Le coefficient de corrélation est calculé à l'aide de Coefficient de corrélation de Pearson qui est donné par :

Coefficient de corrélation
Où,
- r : Coefficient de corrélation.
: Valeurs de la variable x. y_i : Valeurs de la variable y.n : Nombre d'échantillons prélevés dans l'ensemble de données.Numérateur : Covariance de x et y.Dénominateur : Produit de l'écart type de x et de l'écart type de y.
Dans cet article, nous allons voir comment trouver des coefficients de corrélation dans Excel.
Sharwanand
Exemple: Considérons l'ensemble de données suivant :

Trouver le coefficient de corrélation dans Excel :
1. Utilisation de la fonction CORREL
Dans Excel pour trouver le coefficient de corrélation utilisez la formule :
=CORREL(array1,array2) array1 : tableau de variable x array2 : tableau de variable y Pour insérer array1 et array2, sélectionnez simplement la plage de cellules pour les deux.
1. Trouvons le coefficient de corrélation pour les variables et X et Y1.

Coefficient de corrélation de x et y1
array1 : Ensemble de valeurs de X. La plage de cellules va de A2 à A6.
array2 : Ensemble de valeurs de Y1. La plage de cellules va de B2 à B6.
De même, vous pouvez trouver les coefficients de corrélation pour (X , Y2) et (X , Y3) à l'aide de la formule Excel. Finalement, les coefficients de corrélation sont les suivants :
tableau de chaînes du programme c
Du tableau ci-dessus nous pouvons déduire que :
X et Y1 ont un coefficient de corrélation négatif.
X et Y2 ont un coefficient de corrélation positif.
X et Y3 ne sont pas corrélés car le coefficient de corrélation est quasiment nul.
Exemple: Passons maintenant aux deux autres méthodes en utilisant un nouvel ensemble de données. Considérons l'ensemble de données suivant :

Utiliser l'analyse des données
Nous pouvons également analyser l'ensemble de données donné et calculer le coefficient de corrélation : Pour ce faire, suivez les étapes ci-dessous :
remplacer la chaîne dans la chaîne java
Étape 1: Vous devez d'abord activer L'analyse des données ToolPak dans Excel. Autoriser :
- Aller à Déposer dans le coin supérieur gauche de la fenêtre Excel et choisissez Possibilités .
- Le Options Excel La boîte de dialogue s'ouvre. Allez maintenant au Compléments option et dans le Gérer sélectionnez Compléments Excel dans la liste déroulante.
- Cliquer sur Aller bouton.
- La boîte de dialogue Compléments s'ouvre. Dans cette case, cochez l'option Pack d'outils d'analyse .
- Cliquez sur D'ACCORD !

Onglet Analyse des données ajouté
Étape 2: Cliquez maintenant sur Données suivi de L'analyse des données . Une boîte de dialogue apparaîtra.
Étape 3: Dans la boîte de dialogue, sélectionnez Corrélation dans la liste des options. Cliquez sur D'ACCORD !
Étape 4: Le menu Corrélation apparaîtra.
Étape 5 : Dans ce menu, fournissez d'abord le Plage d'entrée . La plage d'entrée est la plage de cellules des colonnes X et Y1, comme indiqué dans l'image ci-dessous.
Étape 6 : Fournissez également le Plage de sortie comme numéro de cellule où vous souhaitez afficher le résultat. Par défaut, la sortie apparaîtra dans la nouvelle feuille Excel au cas où vous ne fournissez aucune plage de sortie.
Étape 7 : Vérifier la Étiquettes dans première rangée option si vous avez des étiquettes dans l'ensemble de données. Dans notre cas, la colonne 1 a l’étiquette X et la colonne 2 a l’étiquette Y1.
Étape 8 : Cliquez sur OK.
Étape 9 : Le tableau d'analyse des données est maintenant prêt. Ici, vous pouvez voir le coefficient de corrélation entre X et Y1 dans le tableau d'analyse.
De même, vous pouvez trouver les coefficients de corrélation de XY2 et celui de XY3. Finalement, tous les coefficients de corrélation sont :

Utilisation de la fonction PEARSON
Elle est exactement similaire à la fonction CORREL dont nous avons discuté dans la section ci-dessus. La syntaxe de la fonction PEARSON est :
=PEARSON(array1,array2) array1 : tableau de variable x array2 : tableau de variable y Pour insérer array1 et array2, sélectionnez simplement la plage de cellules pour les deux.
Trouvons le coefficient de corrélation pour X et Y1 dans l'ensemble de données de l'exemple 2 à l'aide de la fonction PEARSON.
La formule renverra le coefficient de corrélation de X et Y1. De même, vous pouvez le faire pour les autres.
Les coefficients de corrélation finaux sont :
chaîne de tableau en c