logo

Test du chi carré dans R

Le test du chi carré d'indépendance évalue s'il existe une association entre les catégories des deux variables. Il existe essentiellement deux types de variables aléatoires et elles génèrent deux types de données : numériques et catégorielles. Dans Langage de programmation R Les statistiques du chi carré sont utilisées pour déterminer si les distributions de variables catégorielles diffèrent les unes des autres. Le test du chi carré est également utile pour comparer les décomptes ou le nombre de réponses catégorielles entre deux (ou plus) groupes indépendants.

Dans le langage de programmation R, la fonction utilisée pour effectuer un test du chi carré est chisq.test()> .



Syntaxe:

chisq.test (données)

javascript le plus proche

Paramètres:



données : data est un tableau contenant les valeurs de comptage des variables du tableau.

Nous prendrons les données de l'enquête dans le MASS> bibliothèque qui représente les données d’une enquête menée auprès des étudiants.

R.






# load the MASS package> library>(MASS)> print>(>str>(survey))>

>

>

paire java

Sortir:

'data.frame': 237 obs. of 12 variables:  $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ...  $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ...  $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ...  $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ...  $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ...  $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ...  $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ...  $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ...  $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ...  $ Height: num 173 178 NA 160 165 ...  $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ...  $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>

Le résultat ci-dessus montre que l'ensemble de données contient de nombreuses variables factorielles qui peuvent être considérées comme des variables catégorielles. Pour notre modèle, nous considérerons les variables Exercer et Fumée .La colonne Fumée enregistre les habitudes de tabagisme des étudiants tandis que la colonne Exer enregistre leur niveau d'exercice. Notre objectif est de tester l'hypothèse selon laquelle l'habitude de fumer des étudiants est indépendante de leur niveau d'exercice au niveau de signification de 0,05.

R.




# Create a data frame from the main data set.> stu_data =>data.frame>(survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data =>table>(survey$Smoke,survey$Exer)> > print>(stu_data)>

>

>

Sortir:

 Freq None Some  Heavy 7 1 3  Never 87 18 84  Occas 12 3 4  Regul 9 1 7>

Et enfin nous appliquons le chisq.test()> fonction au tableau de contingence stu_data.

R.




10 puissance de 6
# applying chisq.test() function> print>(>chisq.test>(stu_data))>

>

>

Sortir:

 Pearson's Chi-squared test  data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>

Comme la valeur p de 0,4828 est supérieure à 0,05, nous concluons que l'habitude de fumer est indépendante du niveau d'exercice de l'élève et qu'il existe donc une corrélation faible ou inexistante entre les deux variables. Le code R complet est donné ci-dessous.

Donc, en résumé, on peut dire qu’il est très facile d’effectuer un test du Chi carré en utilisant R. On peut effectuer cette tâche en utilisant chisq.test()> fonction dans R.

Visualisez les données du test du chi carré

R.


char tostring java



# Load required library> library>(MASS)> # Print structure of the survey dataset> print>(>str>(survey))> # Create a data frame for smoking and exercise columns> stu_data <->data.frame>(survey$Smoke, survey$Exer)> stu_data <->table>(survey$Smoke, survey$Exer)> # Print the table> print>(stu_data)> # Perform the Chi-Square Test> chi_result <->chisq.test>(stu_data)> print>(chi_result)> # Visualize the data with a bar plot> barplot>(stu_data, beside =>TRUE>, col =>c>(>'lightblue'>,>'lightgreen'>),> >main =>'Smoking Habits vs Exercise Levels'>,> >xlab =>'Exercise Level'>, ylab =>'Number of Students'>)> # Add legend separately> legend>(>'center'>, legend =>rownames>(stu_data), fill =>c>(>'lightblue'>,>'lightgreen'>))>

>

>

Sortir:

gh

Test du chi carré dans R

Dans ce code, nous utilisons leMASS>bibliothèque pour effectuer un test du chi carré sur l'ensemble de données « d'enquête », en se concentrant sur la relation entre les habitudes tabagiques et les niveaux d'exercice.

Il crée un tableau de contingence, effectue le test statistique et visualise les données à l'aide d'un graphique à barres. La légende est ajoutée séparément dans le coin supérieur gauche, distinguant les différentes habitudes de tabagisme avec des couleurs distinctes.

Le code vise à explorer et à communiquer les associations entre le comportement tabagique et les pratiques d'exercice au sein de l'ensemble de données.