Dans cet article, nous apprendrons comment utiliser la fonction lm() pour ajuster des modèles linéaires dans le langage de programmation R.
Un modèle linéaire est utilisé pour prédire la valeur d'une variable inconnue sur la base de variables indépendantes. Il est principalement utilisé pour découvrir la relation entre les variables et les prévisions. La fonction lm() est utilisée pour ajuster des modèles linéaires aux trames de données dans le langage R. Il peut être utilisé pour effectuer une régression, une analyse de variance à strate unique et une analyse de covariance afin de prédire la valeur correspondant aux données qui ne figurent pas dans la base de données. Ceux-ci sont très utiles pour prévoir le prix de l’immobilier, les prévisions météorologiques, etc.
Pour ajuster un modèle linéaire dans le langage R en utilisant le lm() fonction, nous utilisons d'abord la fonction data.frame() pour créer un exemple de bloc de données contenant des valeurs qui doivent être ajustées sur un modèle linéaire à l'aide de la fonction de régression. Ensuite, nous utilisons la fonction lm() pour adapter une certaine fonction à un bloc de données donné.
Syntaxe:
lm( fit_formula, dataframe )
Paramètre:
Fitting_formula : détermine la formule du modèle linéaire. dataframe : détermine le nom du bloc de données qui contient les données.
Ensuite, nous pouvons utiliser la fonction summary() pour afficher le résumé du modèle linéaire. La fonction summary() interprète les valeurs statistiques les plus importantes pour l'analyse du modèle linéaire.
Terminal Linux Kali
Syntaxe:
résumé (modèle_linéaire)
Le résumé contient les informations clés suivantes :
- Erreur type résiduelle : détermine l'écart type de l'erreur où la racine carrée de la variance soustrait n moins 1 + # de variables impliquées au lieu de diviser par n-1. R-carré multiple : détermine dans quelle mesure votre modèle s'adapte aux données. R-carré ajusté : normalise plusieurs R-carré en tenant compte du nombre d'échantillons dont vous disposez et du nombre de variables que vous utilisez. F-Statistic : est un test global qui vérifie si au moins un de vos coefficients est non nul.
Exemple: Exemple pour montrer l'utilisation de la fonction lm().
R.
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
Sortir:
Appel:
lm(formule = y ~ x^2, données = df)
Résidus :
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
Coefficients :
Estimation standard. Valeur t d'erreur Pr(>|t|)
(Interception) -7,0000 3,0876 -2,267 0,10821
x 6,0000 0,9309 6,445 0,00757 **
—
Significatif. codes : 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ' ' 1
Erreur type résiduelle : 2,944 sur 3 degrés de liberté
R-carré multiple : 0,9326, R-carré ajusté : 0,9102
Statistique F : 41,54 sur 1 et 3 DF, valeur p : 0,007575
Tracés de diagnostic
Les tracés de diagnostic nous aident à visualiser la relation entre les différentes valeurs statistiques du modèle. Cela nous aide à analyser l’étendue des valeurs aberrantes et l’efficacité du modèle ajusté. Pour afficher les tracés de diagnostic d'un modèle linéaire, nous utilisons la fonction plot() dans le langage R.
Syntaxe:
tracé (modèle_linéaire)
Exemple: Tracés de diagnostic pour le modèle linéaire ajusté ci-dessus.
R.
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
Sortir:

Traçage d'un modèle linéaire
Nous pouvons tracer le modèle linéaire ajusté ci-dessus pour bien le visualiser en utilisant la méthode abline(). Nous traçons d'abord un nuage de points de points de données, puis nous le superposons avec un tracé abline du modèle linéaire en utilisant la fonction abline().
Syntaxe:
tracé( df$x, df$y)
python rstripabline(Modèle_linéaire)
Exemple: Traçage d'un modèle linéaire
R.
chaîne en entier
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
Sortir:

Prédire les valeurs pour les points de données inconnus à l'aide du modèle ajusté
Pour prédire les valeurs de nouvelles entrées à l'aide du modèle linéaire ajusté ci-dessus, nous utilisons la fonction prédire (). La fonction prédire() prend le modèle et la trame de données avec des points de données inconnus et prédit la valeur de chaque point de données selon le modèle ajusté.
Syntaxe:
prédire (modèle, données)
Paramètre:
model : détermine le modèle linéaire. data : détermine la trame de données avec des points de données inconnus.
Exemple: Prédire de nouvelles entrées
R.
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
Sortir:
1 2 3 83 89 95>