logo

Comment supprimer une ou plusieurs colonnes dans Pandas Dataframe

Voyons comment supprimer une ou plusieurs colonnes dans Pandas Dataframe. Pour supprimer une colonne d'un Cadre de données Pandas ou Supprimer une ou plusieurs colonnes dans un Pandas Dataframe peut être réalisé de plusieurs manières.

Supprimez une ou plusieurs colonnes dans Pandas Dataframe

Il existe différentes méthodes pour supprimer une ou plusieurs colonnes dans Pandas Dataframe, nous discutons de certaines méthodes généralement utilisées pour supprimer une ou plusieurs colonnes dans Pandas Dataframe qui sont les suivantes :



  • Utilisation de la méthode df.drop()
  • En utilisant iloc[] Méthode
  • En utilisant df.ix() méthode
  • En utilisant df.loc[] Méthode
  • Utiliser la méthode itérative
  • En utilisant Dataframe.pop() Méthode

Créer un DataFrame

Nous créons d’abord un Dataframe simple avec un dictionnaire de listes, disons que les noms de colonnes sont A, B, C, D, E . Dans cet article, nous aborderons 6 méthodes différentes pour supprimer certaines colonnes de Pandas DataFrame.

algorithme de tri par insertion
Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df>

Sortir :

 A B C D E   0   A1 B1 C1 D1 E1   1   A2 B2 C2 D2 E2   2   A3 B3 C3 D3 E3   3   A4 B4 C4 D4 E4   4   A5 B5 C5 D5 E5>



Colonne de suppression de dataframe dans Pandas à l'aide de la méthode df.drop()

Exemple 1: Dans cet exemple, nous supprimons des colonnes uniques spécifiques comme le code ci-dessous l'utilise Pandas pour créer un DataFrame à partir d'un dictionnaire, puis supprime la colonne « A » à l'aide dudrop>méthode avecaxis=1>. Cependant, il est important de noter que le DataFrame d'origine (« df ») reste inchangé à moins que leinplace=True>Le paramètre est utilisé ou le résultat est réaffecté à « df ».

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)>

Sortir :

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

Exemple 2 : Dans cet exemple, supprimez plusieurs colonnes spécifiques car le code ci-dessous utilise Pandas pour créer un DataFrame à partir d'un dictionnaire, puis supprime les colonnes « C » et « D » à l'aide dudrop>méthode avecaxis=1>. Cependant, notez que le DataFrame d'origine (« df ») reste inchangé à moins que le résultat ne soit réaffecté ouinplace=True>est utilisé. Alternativement, la même opération peut être effectuée en utilisantdf.drop(columns=['C', 'D'])>.



Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])>

Sortir :

   A B E  0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>

Exemple 3 : Dans cet exemple, supprimez les colonnes en fonction de l'index de colonne car le code ci-dessous crée un Pandas DataFrame à partir d'un dictionnaire et supprime trois colonnes ('A', 'E', 'C') en fonction de leurs positions d'index en utilisant la méthode `drop` avec ` axe = 1`. Le DataFrame modifié est affiché et les modifications sont apportées sur place (`inplace=True`).

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df>

Sortir :

   B D  0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>

Colonnes de suppression de dataframe dans Pandas à l'aide de la méthode df.iloc[]

Dans cet exemple Supprimez les colonnes entre les colonnes de début et de fin spécifiques car le code ci-dessous utilise Pandas pour créer un DataFrame à partir d'un dictionnaire, puis supprime toutes les colonnes entre les indices de colonne 1 à 3 à l'aide dudrop>méthode avecaxis=1>. Les modifications sont apportées sur place (inplace=True>), et le DataFrame modifié s'affiche.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df>

Sortir:

 A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>

Pandas supprime les colonnes de Dataframe à l'aide de la méthode df.ix()

Dans cet exemple Supprimez les colonnes entre des noms de colonnes spécifiques car le code ci-dessous, à l'aide de Pandas, crée un DataFrame à partir d'un dictionnaire et supprime toutes les colonnes entre les noms de colonnes « B » à « D » à l'aide dudrop>méthode avecaxis=1>. Cependant, le DataFrame d'origine (« df ») reste inchangé à moins que le résultat ne soit réaffecté ouinplace=True>est utilisé.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)>

Sortir :

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Pandas supprime les colonnes de Dataframe à l'aide de la méthode df.loc[]

Dans cet exemple, supprimez les colonnes entre des noms de colonnes spécifiques comme le code ci-dessous utilise Pandas pour créer un DataFrame à partir d'un dictionnaire, puis supprime toutes les colonnes entre les noms de colonnes « B » et « D » à l'aide dudrop>méthode avecaxis=1>. Le DataFrame modifié n’est réaffecté à aucune variable et le DataFrame d’origine reste inchangé.

symbole de dérivée partielle latex
Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)>

Sortir :

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Note: Différents loc() et iloc() sont iloc() qui excluent l'élément de plage de la dernière colonne.

Pandas supprime les colonnes de Datafram à l'aide de la méthode itérative

Dans cet exemple, supprimez les colonnes entre des noms de colonnes spécifiques car le code ci-dessous crée un Pandas DataFrame à partir d'un dictionnaire et parcourt ses colonnes. Pour chaque colonne, si la lettre « A » est présente dans le nom de la colonne, cette colonne est supprimée du DataFrame. Le DataFrame modifié résultant est affiché.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df>

Sortir :

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

Colonne de suppression de Dataframe dans Pandas à l'aide de la méthode Dataframe.pop()

Dans cet exemple, suppression d'une colonne spécifique d'un DataFrame, car le code montre comment supprimer une colonne spécifique (« B ») d'un Pandas DataFrame créé à partir d'un dictionnaire. Il utilise le pop> méthode et le DataFrame modifié résultant est affiché.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df>

Sortir:

A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>