Pandas est capable de combiner des objets Series, DataFrame et Panel via différents types de logique d'ensemble pour les index et la fonctionnalité d'algèbre relationnelle.
Le concaténer() La fonction est chargée d’effectuer une opération de concaténation le long d’un axe dans le DataFrame.
Syntaxe:
pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False)
Paramètres:
Si nous passons un dict dans le DataFrame, alors les clés triées seront utilisées comme arguments clés, et les valeurs seront sélectionnées dans ce cas. Si des non-objets sont présents, ils seront supprimés à moins qu'ils n'en soient tous aucun, et dans ce cas, un ValeurErreur sera relevé.
Il n'utilise pas les valeurs d'index sur l'axe de concaténation, si c'est vrai. L'axe résultant sera étiqueté 0, ..., n - 1.
Retour
Une série est renvoyée lorsque nous concaténons toutes les séries le long de l'axe (axe = 0). Au cas où obj contient au moins un DataFrame, il renvoie un DataFrame.
Exemple 1:
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data])
Sortir
instruction de commutation java
0 p 1 q 0 r 1 s dtype: object
Exemple 2 : Dans l'exemple ci-dessus, nous pouvons réinitialiser l'index existant en utilisant le ignorer_index paramètre. Le code ci-dessous démontre le fonctionnement de ignorer_index .
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True)
Sortir
essayez le bloc catch java
0 p 1 q 2 r 3 s dtype: object
Exemple 3 : Nous pouvons ajouter un index hiérarchique au niveau le plus externe des données en utilisant le clés paramètre.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'])
Sortir
a_data 0 p 1 q b_data 0 r 1 s dtype: object
Exemple 4 : Nous pouvons étiqueter les clés d'index en utilisant le des noms paramètre. Le code ci-dessous montre le fonctionnement du paramètre de noms.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID'])
Sortir
bash concaténer des chaînes
Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object
Concaténation à l'aide d'append
La méthode append est définie comme un raccourci utile pour concaténer la série et le DataFrame.
Exemple:
import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two))
Sortir
Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88