logo

Façons de filtrer Pandas DataFrame par valeurs de colonne

Le filtrage d'un Pandas DataFrame au moyen de valeurs de colonne est une opération courante lors de l'exécution avec des informations en Python. Vous pouvez utiliser diverses méthodes et techniques pour y parvenir. Voici de nombreuses façons de filtrer un Pandas DataFrame via les valeurs de colonne.

Dans cet article, nous verrons différentes manières de filtrer Pandas Dataframe par valeurs de colonne. Tout d’abord, créons un Dataframe :



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Sortir:

Trame de données

Sélection de lignes de Pandas Dataframe en fonction d'une valeur de colonne particulière à l'aide de l'opérateur '>', '=', '=', '<=', '!='.

Exemple 1: Sélection de toutes les lignes du Dataframe donné dans lesquelles le « Pourcentage » est supérieur à 75 en utilisant [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Sortir:

trame de données de sortie

Exemple 2 : Sélection de toutes les lignes du Dataframe donné dans lesquelles le « Pourcentage » est supérieur à 70 en utilisant lieu [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortir:

trame de données de sortie-1

Sélection des lignes de Pandas Dataframe dont la valeur de colonne est présente dans la liste à l'aide toi() méthode du dataframe.

Exemple 1: Sélection de toutes les lignes de la trame de données donnée dans lesquelles « Stream » est présent dans la liste d'options à l'aide [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortir:

trame de données de sortie-2

Exemple 2 : Sélection de toutes les lignes de la trame de données donnée dans lesquelles « Stream » est présent dans la liste d'options en utilisant lieu [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortir:

trame de données de sortie-3

Sélection de lignes de Pandas Dataframe en fonction de plusieurs conditions de colonnes à l'aide de l'opérateur « & ».

Exemple 1: Sélection de toutes les lignes du Dataframe donné dans lesquelles « Age » est égal à 22 et « Stream » est présent dans la liste d'options en utilisant [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortir:

trame de données de sortie-4

Exemple 2 : Sélection de toutes les lignes du Dataframe donné dans lesquelles « Age » est égal à 22 et « Stream » est présent dans la liste d'options en utilisant lieu [ ] .

Python3




Arp de commande Windows

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Sortir:

trame de données de sortie-5