logo

Concaténation des pandas

Pandas est capable de combiner des objets Series, DataFrame et Panel via différents types de logique d'ensemble pour les index et la fonctionnalité d'algèbre relationnelle.

Le concaténer() La fonction est chargée d’effectuer une opération de concaténation le long d’un axe dans le DataFrame.

Syntaxe:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Paramètres:

    objets :Il s'agit d'une séquence ou d'un mappage de séries ou d'objets DataFrame.
    Si nous passons un dict dans le DataFrame, alors les clés triées seront utilisées comme arguments clés, et les valeurs seront sélectionnées dans ce cas. Si des non-objets sont présents, ils seront supprimés à moins qu'ils n'en soient tous aucun, et dans ce cas, un ValeurErreur sera relevé.axe:C’est un axe le long duquel il faut concaténer.rejoindre:Responsable de la gestion des index sur un autre axe.join_axes :Une liste d'objets d'index. Au lieu d'exécuter la logique d'ensemble interne ou externe, des index spécifiques sont utilisés pour l'autre axe (n-1).ignore_index :bool, valeur par défaut False
    Il n'utilise pas les valeurs d'index sur l'axe de concaténation, si c'est vrai. L'axe résultant sera étiqueté 0, ..., n - 1.

Retour

Une série est renvoyée lorsque nous concaténons toutes les séries le long de l'axe (axe = 0). Au cas où obj contient au moins un DataFrame, il renvoie un DataFrame.

Exemple 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Sortir

instruction de commutation java
 0 p 1 q 0 r 1 s dtype: object 

Exemple 2 : Dans l'exemple ci-dessus, nous pouvons réinitialiser l'index existant en utilisant le ignorer_index paramètre. Le code ci-dessous démontre le fonctionnement de ignorer_index .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Sortir

essayez le bloc catch java
 0 p 1 q 2 r 3 s dtype: object 

Exemple 3 : Nous pouvons ajouter un index hiérarchique au niveau le plus externe des données en utilisant le clés paramètre.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Sortir

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Exemple 4 : Nous pouvons étiqueter les clés d'index en utilisant le des noms paramètre. Le code ci-dessous montre le fonctionnement du paramètre de noms.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Sortir

bash concaténer des chaînes
 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Concaténation à l'aide d'append

La méthode append est définie comme un raccourci utile pour concaténer la série et le DataFrame.

Exemple:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Sortir

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88