Python est un excellent langage pour l'analyse de données, principalement en raison du fantastique écosystème de packages Python centrés sur les données. Pandas est l'un de ces packages, qui facilite grandement l'importation et l'analyse des données. Créer un Cadre de données Pandas peut être réalisé de plusieurs manières. Voyons comment nous pouvons créer un Pandas DataFrame à partir de listes.
algorithme rr
Création de DataFrames Pandas à partir de listes
La conversion de listes en DataFrames est cruciale dans l'analyse des données, vous permettant d'effectuer facilement des manipulations et des analyses de données sophistiquées.
Ici, nous discuterons de différentes manières de créer un Pandas Dataframe à partir des listes :
- Créer une trame de données à partir d'une liste à l'aide du constructeur
- Créer un DataFrame à partir d'une liste à l'aide du dictionnaire
- Créer un DataFrame à partir d'une liste en utilisant zip()
- Créer un DataFrame à partir de la liste en changeant le type de données
- Créer un DataFrame à partir d'une liste à l'aide d'une liste multidimensionnelle
- Créer un DataFrame à partir d'une liste avec les noms d'index et de colonnes
Créer une trame de données à partir d'une liste à l'aide du constructeur
Pour convertir une liste en Pandas DataFrame, vous pouvez utiliser lepd.DataFrame()>constructeur. Cette fonction prend une liste en entrée et crée un DataFrame avec le même nombre de lignes et de colonnes que la liste d'entrée.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list df = pd.DataFrame(lst) print(df)>
Sortir:
0 0 Geeks 1 For 2 Geeks 3 is 4 portal 5 for 6 Geeks>
Créer un DataFrame à partir d'une liste à l'aide du dictionnaire
Pour utiliser des listes dans un dictionnaire pour créer un Pandas DataFrame, nous créons un dictionnaire de listes puis passons le dictionnaire aupd.DataFrame()>constructeur. En option, nous pouvons spécifier les noms de colonnes du DataFrame en passant une liste de chaînes aucolumns>paramètre dupd.DataFrame()>constructeur.
# importing pandas as pd import pandas as pd # list of name, degree, score nme = ['aparna', 'pankaj', 'sudhir', 'Geeku'] deg = ['MBA', 'BCA', 'M.Tech', 'MBA'] scr = [90, 40, 80, 98] # dictionary of lists dict = {'name': nme, 'degree': deg, 'score': scr} df = pd.DataFrame(dict) print(df)> Sortir:
name degree score 0 aparna MBA 90 1 pankaj BCA 40 2 sudhir M.Tech 80 3 Geeku MBA 98>
Créer un DataFrame à partir d'une liste en utilisant zip()
Pour créer un Pandas DataFrame à partir de listes en utilisant fermeture éclair(). Nous pouvons également utiliser lezip()>fonction pour compresser plusieurs listes pour créer un DataFrame avec plus de colonnes.
Python
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # list of int lst2 = [11, 22, 33, 44, 55, 66, 77] # Calling DataFrame constructor after zipping # both lists, with columns specified df = pd.DataFrame(list(zip(lst, lst2)), columns =['Name', 'val']) print(df)>
Sortir:
Name val 0 Geeks 11 1 For 22 2 Geeks 33 3 is 44 4 portal 55 5 for 66 6 Geeks 77>
Créer un DataFrame à partir d'une liste en changeant le type de données
Pour créer un Pandas DataFrame à l'aide d'une liste multidimensionnelle avec les noms de colonnes et les types spécifiés. En spécifiant des types, nous pouvons garantir que le DataFrame est créé avec les types de données corrects.
Python import pandas as pd # List1 lst = [['tom', 'reacher', 25], ['krish', 'pete', 30], ['nick', 'wilson', 26], ['juli', 'williams', 22]] # Create DataFrame df = pd.DataFrame(lst, columns=['FName', 'LName', 'Age']) # Convert 'Age' column to float df['Age'] = df['Age'].astype(float) print(df)>
Sortir:
FName LName Age 0 tom reacher 25.0 1 krish pete 30.0 2 nick wilson 26.0 3 juli williams 22.0>
Créer un DataFrame à partir d'une liste à l'aide d'une liste multidimensionnelle
Pour créer un DataFrame à l'aide d'une liste multidimensionnelle, vous pouvez utiliser lepd.DataFrame()>constructeur. Lepd.DataFrame()>Le constructeur prend une liste de listes en entrée et crée un DataFrame avec le même nombre de lignes et de colonnes que la liste d'entrée.
# import pandas as pd import pandas as pd # List1 lst = [['tom', 25], ['krish', 30], ['nick', 26], ['juli', 22]] df = pd.DataFrame(lst, columns =['Name', 'Age']) print(df)>
Sortir:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Créer un DataFrame à partir d'une liste avec les noms d'index et de colonnes
Pour créer un DataFrame à l'aide d'une liste avec des noms d'index et de colonnes, vous pouvez utiliser lepd.DataFrame()>constructeur avec leindex>etcolumns>paramètres.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list # with indices and columns specified df = pd.DataFrame(lst, index =['a', 'b', 'c', 'd', 'e', 'f', 'g'], columns =['Names']) print(df)>
Sortir:
Names a Geeks b For c Geeks d is e portal f for g Geeks>