PANDAS LIT CSV EN PYTHON

Les fichiers CSV sont des fichiers séparés par des virgules. Pour accéder aux données du fichier CSV, nous avons besoin d'une fonction read_csv() de Pandas qui récupère les données sous la forme d'une trame de données.

Syntaxe de read_csv()

Voici la Les pandas lisent CSV syntaxe avec ses paramètres.

Syntaxe : pd.read_csv (filepath_or_buffer, sep=' ,' , header='infer', index_col=None, usecols=None, engine=None, skiprows=None, nrows=None)

Paramètres:

chemin_fichier_ou_buffer : Emplacement du fichier csv. Il accepte n’importe quel chemin de chaîne ou URL du fichier.

sep : Cela signifie séparateur, la valeur par défaut est ', '.

entête : Il accepte les int, une liste d'int, les numéros de ligne à utiliser comme noms de colonnes et le début des données. Si aucun nom n'est transmis, c'est-à-dire header=None, alors la première colonne sera affichée avec 0, la seconde avec 1, et ainsi de suite.

utiliser les cols : Récupère uniquement les colonnes sélectionnées du fichier CSV.

nrows : Nombre de lignes à afficher à partir de l'ensemble de données.

index_col : Si Aucun, aucun numéro d'index n'est affiché avec les enregistrements.

skiprows : ignore les lignes transmises dans le nouveau bloc de données.

Lire le fichier CSV à l'aide de Pandas read_csv

Avant d'utiliser cette fonction, nous devons importer le Pandas bibliothèque, nous chargerons le fichier CSV en utilisant Pandas.

PYTHON3

: en java

# Import pandas> import> pandas as pd> # reading csv file> df>=> pd.read_csv(>'people.csv'>)> print>(df.head())>

Sortir:

 First Name Last Name Sex Email Date of birth Job Title  0 Shelby Terrell Male [email protected] 1945-10-26 Games developer  1 Phillip Summers Female [email protected] 1910-03-24 Phytotherapist  2 Kristine Travis Male [email protected] 1992-07-02 Homeopath  3 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 4 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon>

En utilisant sep dans read_csv()

Dans cet exemple, nous prendrons un fichier CSV puis ajouterons quelques caractères spéciaux pour voir comment le sep Le paramètre fonctionne.

Python3

# sample = 'totalbill_tip, sex:smoker, day_time, size> # 16.99, 1.01:Female|No, Sun, Dinner, 2> # 10.34, 1.66, Male, No|Sun:Dinner, 3> # 21.01:3.5_Male, No:Sun, Dinner, 3> #23.68, 3.31, Male|No, Sun_Dinner, 2> # 24.59:3.61, Female_No, Sun, Dinner, 4> # 25.29, 4.71|Male, No:Sun, Dinner, 4'> # Importing pandas library> import> pandas as pd> # Load the data of csv> df>=> pd.read_csv(>'sample.csv'>,> >sep>=>'[:, |_]'>,> >engine>=>'python'>)> # Print the Dataframe> print>(df)>

Sortir:

 totalbill tip Unnamed: 2 sex smoker Unnamed: 5 day time Unnamed: 8 size  16.99 NaN 1.01 Female No NaN Sun NaN Dinner NaN 2 10.34 NaN 1.66 NaN Male NaN No Sun Dinner NaN 3 21.01 3.50 Male NaN No Sun NaN Dinner NaN 3.0 None 23.68 NaN 3.31 NaN Male No NaN Sun Dinner NaN 2 24.59 3.61 NaN Female No NaN Sun NaN Dinner NaN 2 25.29 NaN 4.71 Male NaN No Sun NaN Dinner NaN 4>

Utiliser usecols dans read_csv()

Ici, nous spécifions seulement 3 colonnes, c'est-à-dire [Prénom, Sexe, Email] à charger et nous utilisons l'en-tête 0 comme en-tête par défaut.

Python3

df>=> pd.read_csv(>'people.csv'>,> >header>=>0>,> >usecols>=>[>'First Name'>,>'Sex'>,>'Email'>])> # printing dataframe> print>(df.head())>

Sortir:

 First Name Sex Email 0 Shelby Male [email protected] 1 Phillip Female [email protected] 2 Kristine Male [email protected] 3 Yesenia Male [email protected] 4 Lori Male [email protected]>

Utiliser index_col dans read_csv()

Ici, nous utilisons le Sexe indexer d'abord, puis le Titre d'emploi index, on peut simplement réindexer l'en-tête avec index_col paramètre.

Python3

cout

df>=> pd.read_csv(>'people.csv'>,> >header>=>0>,> >index_col>=>[>'Sex'>,>'Job Title'>],> >usecols>=>[>'Sex'>,>'Job Title'>,>'Email'>])> print>(df.head())>

Sortir:

 Email Sex Job Title  Male Games developer [email protected] Female Phytotherapist [email protected] Male Homeopath [email protected]  Market researcher [email protected]  Veterinary surgeon [email protected]>

Utilisation de nrows dans read_csv()

Ici, nous affichons simplement seulement 5 lignes en utilisant paramètre nrows .

Python3

c tableau de chaînes

df>=> pd.read_csv(>'people.csv'>,> >header>=>0>,> >index_col>=>[>'Sex'>,>'Job Title'>],> >usecols>=>[>'Sex'>,>'Job Title'>,>'Email'>],> >nrows>=>3>)> print>(df)>

Sortir:

 Email Sex Job Title  Male Games developer [email protected] Female Phytotherapist [email protected] Male Homeopath [email protected]>

Utiliser des skiprows dans read_csv()

Le skiprows aide à ignorer certaines lignes dans CSV, c'est-à-dire que vous observerez ici que les lignes mentionnées dans les sauts de lignes ont été ignorées de l'ensemble de données d'origine.

Python3

df>=> pd.read_csv(>'people.csv'>)> print>(>'Previous Dataset: '>)> print>(df)> # using skiprows> df>=> pd.read_csv(>'people.csv'>, skiprows>=> [>1>,>5>])> print>(>'Dataset After skipping rows: '>)> print>(df)>

Sortir:

Previous Dataset:  First Name Last Name Sex Email Date of birth Job Title  0 Shelby Terrell Male [email protected] 1945-10-26 Games developer 1 Phillip Summers Female [email protected] 1910-03-24 Phytotherapist  2 Kristine Travis Male [email protected] 1992-07-02 Homeopath  3 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 4 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon  5 Erin Day Male [email protected] 2015-10-28 Management officer  6 Katherine Buck Female [email protected] 1989-01-22 Analyst 7 Ricardo Hinton Male [email protected] 1924-03-26 Hydrogeologist  Dataset After skipping rows:   First Name Last Name Sex Email Date of birth Job Title  0 Shelby Terrell Male [email protected] 1945-10-26 Games developer 1 Kristine Travis Male [email protected] 1992-07-02 Homeopath  2 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 3 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon  4 Katherine Buck Female [email protected] 1989-01-22 Analyst 5 Ricardo Hinton Male [email protected] 1924-03-26 Hydrogeologist>

TechCodeview

Syntaxe de read_csv()

Lire le fichier CSV à l'aide de Pandas read_csv

PYTHON3

En utilisant sep dans read_csv()

Python3

Utiliser usecols dans read_csv()

Python3

Utiliser index_col dans read_csv()

Python3

Utilisation de nrows dans read_csv()

Python3

Utiliser des skiprows dans read_csv()

Python3