logo

Différentes façons de créer Pandas Dataframe

Cadre de données Pandas est une structure de données étiquetée en 2 dimensions comme un tableau avec des lignes et des colonnes. La taille et les valeurs du DataFrame sont mutables, c'est-à-dire peuvent être modifiées.

DataFrame est principalement utilisé dans l'analyse et la manipulation de données. Il vous permet de stocker des données sous forme de tableau comme une base de données SQL, MS Excel ou Google Sheets, ce qui facilite l'exécution d'opérations arithmétiques sur les données.



C'est l'objet Pandas le plus couramment utilisé. Le Fonction DataFrame() est utilisé pour créer un DataFrame dans Pandas. Vous pouvez également créer Pandas DataFrame de plusieurs manières.

Syntaxe Pandas Dataframe()

pandas.DataFrame (données, index, colonnes)

factorielle en c

Paramètres:

  • données : Il s'agit d'un ensemble de données à partir duquel un DataFrame doit être créé. Il peut s'agir d'une liste, d'un dictionnaire, d'une valeur scalaire, d'une série et de tableaux, etc.
  • indice : C'est facultatif, par défaut l'index du DataFrame commence à 0 et se termine à la dernière valeur de données (n-1). Il définit explicitement l’étiquette de la ligne.
  • Colonnes : Ce paramètre est utilisé pour fournir des noms de colonnes dans le DataFrame. Si le nom de la colonne n'est pas défini par défaut, il prendra une valeur comprise entre 0 et n-1.

Retour:

  • Objet DataFrame

Maintenant que nous avons discuté de la fonction DataFrame(), examinons différentes manières de créer un DataFrame :



Différentes façons de créer un Dataframe en Python

Il existe plusieurs façons de créer un Cadre de données Pandas dans Python . Vous pouvez créer un DataFrame avec les méthodes suivantes :

  • Créer Pandas DataFrame à l'aide de la fonction DataFrame()
  • Créer Pandas DataFrame à partir de la liste des listes
  • Créer Pandas DataFrame à partir du dictionnaire de ndarray/list
  • Créer Pandas DataFrame à partir de la liste des dictionnaires
  • Créer Pandas DataFrame à partir d'un dictionnaire de séries
  • Création de DataFrame à l'aide de la fonction zip()
  • Créer un DataFrame en prouvant explicitement l'étiquette d'index

Créer un DataFrame vide à l'aide de la méthode DataFrame()

DataFrame en Python peut être créé par la fonction DataFrame() du Bibliothèque des Pandas . Appelez simplement la fonction avec le constructeur DataFrame pour créer un DataFrame.

Exemple : Création d'un DataFrame vide à l'aide de la fonction DataFrame() en Python



Python3




# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df>=> pd.DataFrame()> # Printing Empty DataFrame> print>(df)>

>

>

Sortir:

Empty DataFrame Columns: [] Index: []>

Créer un DataFrame à partir de listes de listes

Pour créer un Pandas DataFrame à partir d'un liste de listes, vous pouvez utiliser la fonction pd.DataFrame(). Cette fonction prend une liste de listes en entrée et crée un DataFrame avec le même nombre de lignes et de colonnes que la liste d'entrée.

Exemple : Création de DataFrame à partir de listes de listes à l'aide de la méthode DataFrame()

Python3




# Import pandas library> import> pandas as pd> # initialize list of lists> data>=> [[>'tom'>,>10>], [>'nick'>,>15>], [>'juli'>,>14>]]> # Create the pandas DataFrame> df>=> pd.DataFrame(data, columns>=>[>'Name'>,>'Age'>])> # print dataframe.> print>(df)>

>

>

Sortir:

 Name Age 0 tom 10 1 nick 15 2 juli 14>

Créer un DataFrame à partir du dictionnaire de ndArray/Lists

Pour créer un DataFrame à partir d'un dictionnaire de ndarrays /lists, tous les tableaux doivent être de la même longueur. Si un index est passé, l'index de longueur doit être égal à la longueur des tableaux.

Si aucun index n'est transmis, alors par défaut, l'index sera range(n) où n est la longueur du tableau.

Exemple : Création de DataFrame à partir d'un dictionnaire de ndarray/lists

Python3




# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'nick'>,>'krish'>,>'jack'>],> >'Age'>: [>20>,>21>,>19>,>18>]}> # Create DataFrame> df>=> pd.DataFrame(data)> # Print the output.> print>(df)>

>

trimestres de l'année

>

Sortir:

 Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>

Note: Lors de la création d'un DataFrame à l'aide d'un dictionnaire, les clés du dictionnaire seront par défaut des noms de colonnes. Nous pouvons également fournir explicitement des noms de colonnes en utilisant le paramètre column.

Créer un DataFrame à partir d'une liste de dictionnaires

Pandas DataFrame peut être créé en passant listes de dictionnaires comme données d’entrée. Par défaut, les clés du dictionnaire seront considérées comme des colonnes.

Python3




# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data>=> [{>'a'>:>1>,>'b'>:>2>,>'c'>:>3>},> >{>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates DataFrame.> df>=> pd.DataFrame(data)> # Print the data> print>(df)>

>

année mois

>

Sortir:

a b c 0 1 2 3 1 10 20 30>

Un autre exemple consiste à créer un Pandas DataFrame en transmettant des listes de dictionnaires et index de lignes .

Python3




# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data>=> [{>'b'>:>2>,>'c'>:>3>}, {>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df>=> pd.DataFrame(data, index>=>[>'first'>,>'second'>])> # Print the data> print>(df)>

>

>

Sortir:

b c a first 2 3 NaN second 20 30 10.0>

Créer un DataFrame à partir d'un dictionnaire de séries

Pour créer un DataFrame à partir d'un dictionnaire de série , un dictionnaire peut être transmis pour former un DataFrame. L'indice résultant est l'union de toutes les séries d'indexés passées.

Exemple: Création d'un DataFrame à partir d'un dictionnaire de séries.

Python3


Oops



# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d>=> {>'one'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>]),> >'two'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>])}> # creates Dataframe.> df>=> pd.DataFrame(d)> # print the data.> print>(df)>

>

>

Sortir:

 one two a 10 10 b 20 20 c 30 30 d 40 40>

Créez un DataFrame à l'aide de la fonction zip()

Deux listes peuvent être fusionnées en utilisant le fonction zip() . Maintenant, créez le Pandas DataFrame en appelant la fonction pd.DataFrame().

Exemple: Création de DataFrame à l'aide de la fonction zip().

Python3




# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name>=> [>'tom'>,>'krish'>,>'nick'>,>'juli'>]> # List2> Age>=> [>25>,>30>,>26>,>22>]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples>=> list>(>zip>(Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df>=> pd.DataFrame(list_of_tuples,> >columns>=>[>'Name'>,>'Age'>])> # Print data.> print>(df)>

>

>

Sortir:

 Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>

Créez un DataFrame en prouvant explicitement l'étiquette d'index

Pour créer un DataFrame en fournissant explicitement l'étiquette d'index, vous pouvez utiliser le paramètre index du constructeur pd.DataFrame(). Le paramètre index prend une liste d'étiquettes d'index en entrée, et le DataFrame utilisera ces étiquettes pour les lignes du DataFrame.

Exemple: Créer un DataFrame en prouvant explicitement l'étiquette d'index

structure de contrôle python

Python3




# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'Jack'>,>'nick'>,>'juli'>],> >'marks'>: [>99>,>98>,>95>,>90>]}> # Creates pandas DataFrame.> df>=> pd.DataFrame(data, index>=>[>'rank1'>,> >'rank2'>,> >'rank3'>,> >'rank4'>])> # print the data> print>(df)>

>

>

Sortir:

 Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>

Conclusion

Python Pandas DataFrame est similaire à un tableau avec des lignes et des colonnes. Il s'agit d'une structure de données bidimensionnelle très utile pour l'analyse et la manipulation des données.

Dans ce didacticiel, nous avons abordé plusieurs façons de créer un Pandas DataFrame. Avec ce didacticiel, vous serez en mesure de gérer toute exigence complexe de création de DataFrame.