logo

Différence entre loc() et iloc() dans Pandas DataFrame

La bibliothèque Pandas de Python est très utile pour la manipulation de données mathématiques et est largement utilisée dans le domaine de l'apprentissage automatique. Il comprend de nombreuses méthodes pour son bon fonctionnement. lieu() et iloc() sont une de ces méthodes. Ceux-ci sont utilisés pour découper les données du Cadre de données Pandas . Ils facilitent la sélection pratique des données du DataFrame dans Python . Ils sont utilisés pour filtrer les données selon certaines conditions.

Différence entre loc() et iloc() dans Pandas DataFrame

Ici, nous verrons la différence entre les fonctions loc() et iloc() dans Pandas DataFrame. Pour voir et comparer la différence entre ces deux, nous allons créer un exemple de Dataframe que nous utiliserons dans tout le paragraphe. Le fonctionnement de ces deux méthodes est expliqué dans l’échantillon de données de voitures.



python3




exécuter des scripts sous Linux





# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)>

>

>

Sortir

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Fonction Python loc()

Le fonction loc() est une méthode de sélection de données basée sur des étiquettes, ce qui signifie que nous devons transmettre le nom de la ligne ou de la colonne que nous voulons sélectionner. Cette méthode inclut le dernier élément de la plage qui y est transmise, contrairement à iloc(). loc() peut accepter les données booléennes contrairement à iloc(). De nombreuses opérations peuvent être effectuées à l'aide de la méthode loc() comme

Exemple 1: Sélection de données selon certaines conditions

Dans cet exemple, le code utilise leloc>fonction pour sélectionner et afficher les lignes du DataFrame où la marque est « Maruti » et le kilométrage est supérieur à 25, affichant des informations pertinentes sur les voitures Maruti avec un kilométrage élevé.

python3




# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])>

convertir de char en int java

>

>

Sortir

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>

Exemple 2 : Sélection d'une plage de lignes dans le DataFrame

Dans cet exemple, le code utilise leloc>fonction pour extraire et afficher des lignes avec des indices allant de 2 à 5 (inclus) du DataFrame, fournissant des informations sur une gamme spécifique de voitures dans l'ensemble de données.

python3


tous les 3 mois



# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])>

>

>

Sortir

 Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>

Exemple 3 : Mise à jour de la valeur de n'importe quelle colonne

Dans cet exemple, le code utilise leloc>fonction pour mettre à jour les valeurs « Kilométrage » à 22 pour les voitures du DataFrame dont l'année de fabrication est antérieure à 2015. Le DataFrame modifié est ensuite affiché, reflétant les modifications apportées à la colonne Kilométrage.

python3




# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)>

>

>

Sortir

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Fonction Python iloc()

Le Fonction iloc() est une méthode de sélection basée sur un index, ce qui signifie que nous devons transmettre un index entier dans la méthode pour sélectionner une ligne/colonne spécifique. Cette méthode n'inclut pas le dernier élément de la plage qui y est transmise contrairement à loc(). iloc() n'accepte pas les données booléennes contrairement à loc(). Les opérations effectuées à l'aide de iloc() sont :

Exemple 1: Sélection de lignes à l'aide d'indices entiers

Dans cet exemple, le code utilise leiloc>fonction pour extraire et afficher des lignes spécifiques avec les indices 0, 2, 4 et 7 du DataFrame, présentant des informations sur les voitures sélectionnées dans l'ensemble de données.

python3




types de référence Java

# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])>

>

>

comment concaténer des chaînes en java

Sortir

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>

Exemple 2 : Sélection simultanée d'une plage de colonnes et de lignes

Dans cet exemple, le code utilise leiloc>fonction pour extraire et afficher un sous-ensemble du DataFrame, y compris les lignes 1 à 4 et les colonnes 2 à 4. Cela fournit des informations sur une gamme spécifique de voitures et leurs attributs pertinents dans l'ensemble de données.

python3




# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])>

>

>

Sortir

 Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>