Langage de programmation R est un langage de programmation open source largement utilisé comme logiciel statistique et outil d’analyse de données. Trames de données en langage R sont des objets de données génériques de R utilisés pour stocker des données tabulaires.
Les trames de données peuvent également être interprétées comme des matrices dans lesquelles chaque colonne d'un matrice peut être de différents types de données. R DataFrame est composé de trois composants principaux : les données, les lignes et les colonnes.
Structure des trames de données R
Comme vous pouvez le voir dans l'image ci-dessous, c'est ainsi qu'une trame de données est structurée.
Les données sont présentées sous forme de tableau, ce qui facilite leur exploitation et leur compréhension.

R – Trames de données
Créer une trame de données dans le langage de programmation R
Pour créer une trame de données R, utilisez trame de données() fonction, puis transmettez chacun des vecteurs que vous avez créés comme arguments à la fonction.
R.
# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)> |
>
>
Sortir:
friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>
Obtenez la structure de la trame de données R
On peut obtenir la structure de la trame de données R en utilisant str() fonction dans R.
Il peut même afficher la structure interne de grandes listes imbriquées. Il fournit une sortie monoligne pour les objets R de base, permettant à l'utilisateur de connaître l'objet et ses constituants.
R.
systèmes experts
# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))> |
>
>
Sortir:
'data.frame': 5 obs. of 2 variables: $ friend_id : int 1 2 3 4 5 $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>
Résumé des données dans la trame de données R
Dans la trame de données R, le résumé statistique et la nature des données peuvent être obtenus en appliquant résumé() fonction.
Il s'agit d'une fonction générique utilisée pour produire des résumés des résultats de diverses fonctions d'ajustement de modèle. La fonction invoque des méthodes particulières qui dépendent de la classe du premier argument.
R.
# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))> |
>
>
Sortir:
friend_id friend_name Min. :1 Length:5 1st Qu.:2 Class :character Median :3 Mode :character Mean :3 3rd Qu.:4 Max. :5>
Extraire les données du bloc de données dans R
Extraire des données d'une trame de données R signifie accéder à ses lignes ou colonnes. On peut extraire une colonne spécifique d'un bloc de données R en utilisant son nom de colonne.
R.
# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)> |
>
>
Sortir:
friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>
Développer le bloc de données en langage R
Un bloc de données dans R peut être étendu en ajoutant de nouvelles colonnes et lignes au bloc de données R déjà existant.
R.
# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)> |
>
>
Sortir:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
Dans R, on peut effectuer différents types d'opérations sur une trame de données comme accéder aux lignes et aux colonnes, sélectionner le sous-ensemble du bloc de données, modifier les blocs de données, supprimer les lignes et les colonnes dans un bloc de données , etc.
Prière de se référer à Opérations DataFrame dans R pour connaître tous les types d’opérations pouvant être effectuées sur une trame de données.
Accéder aux éléments dans le bloc de données R
Nous pouvons sélectionner et accéder à n'importe quel élément du bloc de données en utilisant un seul$>,supports[ ] or>doubles supports[[]]>pour accéder aux colonnes d’un bloc de données.
R.
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id> |
>
>
Sortir:
friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni' Access Items using $ [1] 1 2 3 4 5>
Nombre de lignes et de colonnes
Nous pouvons découvrir combien de lignes et de colonnes parsent dans notre dataframe en utilisant la fonction dim.
R.
python // opérateur
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)> |
>
>
Sortir:
[1] 5 2>
Ajouter des lignes et des colonnes dans le bloc de données R
Vous pouvez facilement ajouter des lignes et des colonnes dans un R DataFrame. L'insertion permet d'étendre le DataFrame déjà existant, sans avoir besoin d'un nouveau.
Voyons comment ajouter des lignes et des colonnes dans un DataFrame ? avec un exemple :
Ajouter des lignes dans le bloc de données R
Pour ajouter des lignes dans un Data Frame, vous pouvez utiliser une fonction intégrée rbind().
L'exemple suivant démontre le fonctionnement de rbind() dans R Data Frame.
R.
# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>'
Updated dataframe after adding a new product:
'>)> print>(Products)> |
>
>
Sortir:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new product: Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>
Ajouter des colonnes dans le bloc de données R
Pour ajouter des colonnes dans un Data Frame, vous pouvez utiliser une fonction intégrée cbind().
L'exemple suivant démontre le fonctionnement de cbind() dans R Data Frame .
R.
Le plus beau des sourires
# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>'
Updated dataframe after adding a new column 'Discount':
'>)> print>(Products)> |
>
>
Sortir:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new column 'Discount': Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>
Supprimer des lignes et des colonnes
Un bloc de données dans R supprime les colonnes et les lignes du bloc de données R déjà existant.
Supprimer la ligne dans R DataFrame
R.
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data> |
>
>
Sortir:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai # Remove a row with friend_id = 3 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
Dans le code ci-dessus, nous avons d'abord créé un bloc de données appelé données avec trois colonnes : ami_id , nom_ami , et emplacement . Pour supprimer une ligne avec ami_id égal à 3, nous avons utilisé le sous-ensemble() fonction et spécifié la condition ami_id != 3 . Cela a supprimé la ligne avec ami_id égal à 3.
Supprimer la colonne dans R DataFrame
R.
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data> |
>
>
Sortir:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Supprimez la colonne « emplacement » ami_id ami_nom 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>
Pour supprimer le emplacement colonne, nous avons utilisé la sélectionner() fonction et spécifié -emplacement . Le – le signe indique que nous voulons supprimer le emplacement colonne. La trame de données résultante données n'aura que deux colonnes : ami_id et nom_ami .
Combinaison de trames de données dans R
Il existe 2 façons de combiner des blocs de données dans R. Vous pouvez les combiner verticalement ou horizontalement.
Regardons les deux cas avec un exemple :
Combiner la trame de données R verticalement
Si vous souhaitez combiner 2 trames de données verticalement, vous pouvez utiliser Fonction rbind(). Cette fonction fonctionne pour la combinaison de deux trames de données ou plus.
R.
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
>
Sortir:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Name Age Score 1 Charlie 28 90 2 David 35 85 Combined Dataframe: Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>
Combinez le bloc de données R horizontalement :
Si vous souhaitez combiner 2 trames de données horizontalement, vous pouvez utiliser Fonction cbind(). Cette fonction fonctionne pour la combinaison de deux trames de données ou plus.
R.
tableau d'octets pour chaîne java
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
>
Sortir:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Height Weight 1 160 55 2 175 70 Combined Dataframe: Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>
Lire aussi :
- R – Objets
- Structures de données dans la programmation R
Dans cet article, nous avons couvert Trames de données R, et toutes les opérations de base telles que la création, l'accès, le résumé, l'ajout et la suppression. Cet article a pour but de vous familiariser avec les trames de données dans R afin que vous puissiez les utiliser dans vos projets.
J'espère que cela vous aidera à comprendre le concept de trames de données dans R et que vous pourrez facilement implémenter la trame de données R dans vos projets.