logo

Ajout d'une nouvelle colonne au DataFrame existant dans Pandas

L'ajout de nouvelles colonnes à un DataFrame existant est une tâche fondamentale dans l'analyse des données à l'aide de Pandas . Il vous permet d’enrichir vos données avec des informations supplémentaires et de faciliter des analyses et manipulations plus approfondies. Cet article explorera diverses méthodes pour ajouter de nouvelles colonnes, notamment l'affectation simple, lainsert()>méthode, leassign()>méthode. Discutons de l'ajout de nouvelles colonnes au DataFrame existant de Pandas.

Qu'est-ce que Pandas DataFrame ?

UN Cadre de données Pandas est une structure de données tabulaire bidimensionnelle, à taille variable et potentiellement hétérogène, avec des axes étiquetés (lignes et colonnes). Il s’agit d’une structure de données fondamentale dans l’écosystème de science des données Python et constitue un moyen puissant de travailler avec des données tabulaires.



Voici quelques fonctionnalités clés d'un Pandas DataFrame :

  • Représentation des données : Stocke les données sous forme de tableau avec des lignes et des colonnes.
  • Types de données hétérogènes : Peut contenir différents types de données dans différentes colonnes (par exemple, des entiers, des flottants, des chaînes, des booléens).
  • Étiquetage : Chaque ligne et colonne a une étiquette (noms d'index et de colonne).
  • Mutable: Permet la manipulation et la modification des données.
  • Opérations puissantes : Fournit diverses fonctions et méthodes pour l’analyse, la manipulation et l’exploration des données.
  • Extensible: Peut être personnalisé et étendu avec des fonctionnalités supplémentaires via des bibliothèques et des fonctions définies par l'utilisateur.

Il existe plusieurs façons d'ajouter une nouvelle colonne à un DataFrame existant dans Pandas dans Python :

  • Création d'un exemple de trame de données
  • En utilisant Dataframe.insert() méthode
  • En utilisant Dataframe.assign() méthode
  • Utiliser le dictionnaire
  • Utiliser la liste
  • En utilisant .lieu()
  • Ajout de plusieurs colonnes dans un dataframe existant

Création d'un exemple de trame de données

Ici, nous créons un exemple de dataframe :



Python3






import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)>

>

>

Sortir:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc>

Notez que la longueur de votre liste doit correspondre à la longueur de la colonne d'index, sinon une erreur s'affichera.

Ajouter une nouvelle colonne à un Datframe existant à l'aide de DataFrame.insert()

Cela donne la liberté d’ajouter une colonne à n’importe quelle position et pas seulement à la fin. Il propose également différentes options pour insérer les valeurs de colonne.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)>

>

>

Sortir:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc>

Ajout de colonnes à Pandas DataFrame à l'aide de Dataframe.assign()

Cette méthode créera un nouveau dataframe avec une nouvelle colonne ajoutée à l'ancien dataframe.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)>

conversion d'une chaîne en objet json

>

>

Sortir:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Pandas ajoute une colonne à DataFrame à l'aide d'un dictionnaire

Nous pouvons utiliser un Dictionnaire Python pour ajouter une nouvelle colonne dans pandas DataFrame. Utilisez une colonne existante comme valeurs clés et leurs valeurs respectives seront les valeurs d'une nouvelle colonne.

Python3




# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)>

>

>

Sortir:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Ajout d'une nouvelle colonne à un DataFrame Pandas à l'aide d'une liste

Dans cet exemple, Les pandas ajoutent de nouvelles colonnes à la liste Adressez-vous à un Pandas DataFrame existant à l’aide d’un dictionnaire et d’une liste.

Python3




# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)>

>

>

Sortir:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Ajouter une nouvelle colonne à un DataFrame Pandas existant à l'aide de Dataframe.loc()

Dans cet exemple, il crée un Pandas DataFrame nommédf>avec les colonnes Nom, Hauteur et Qualification et ajoute une nouvelle colonne Adresse en utilisant leloc>attribut.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)>

>

>

Sortir:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna>

Ajout de plusieurs colonnes dans un dataframe existant

Dans cet exemple, il étend un Pandas DataFrame existantdf>avec deux nouvelles colonnes, Age et State, utilisant leurs listes de données respectives.

dérivés partiels en latex

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)>

>

>

Sortir:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar>

Conclusion

Comprendre comment ajouter de nouvelles colonnes aux DataFrames est essentiel pour l'exploration et la manipulation des données dans Pandas. Le choix de la méthode appropriée dépend du contexte spécifique et du résultat souhaité. En maîtrisant ces techniques, vous pouvez manipuler, analyser et obtenir efficacement des informations précieuses à partir de vos données.