logo

Série Python Pandas

La série Pandas peut être définie comme un tableau unidimensionnel capable de stocker différents types de données. Nous pouvons facilement convertir la liste, le tuple et le dictionnaire en séries en utilisant ' série ' méthode. Les étiquettes de ligne d’une série sont appelées index. Une série ne peut pas contenir plusieurs colonnes. Il a le paramètre suivant :

combien d'onces font 10 millilitres
    données:Il peut s'agir de n'importe quelle liste, dictionnaire ou valeur scalaire.indice:La valeur de l'index doit être unique et hachable. Il doit être de la même longueur que les données. Si nous ne transmettons aucun index, par défaut np.arranger(n) sera utilisé.type :Il fait référence au type de données de la série.copie:Il est utilisé pour copier les données.

Créer une série :

Nous pouvons créer une série de deux manières :

  1. Créer une série vide
  2. Créez une série à l'aide d'entrées.

Créez une série vide :

Nous pouvons facilement créer une série vide dans Pandas, ce qui signifie qu'elle n'aura aucune valeur.

La syntaxe utilisée pour créer une série vide :

 = pandas.Series() 

L'exemple ci-dessous crée un objet de type série vide qui n'a aucune valeur et ayant un type de données par défaut, c'est-à-dire flotteur64 .

Exemple

 import pandas as pd x = pd.Series() print (x) 

Sortir

 Series([], dtype: float64) 

Création d'une série à l'aide d'entrées :

Nous pouvons créer des séries en utilisant diverses entrées :

  • Tableau
  • Dicté
  • Valeur scalaire

Création d'une série à partir d'un tableau :

Avant de créer une série, nous devons d'abord importer le numpy module, puis utilisez la fonction array() dans le programme. Si les données sont ndarray, alors l'index transmis doit être de la même longueur.

Si on ne passe pas d'index, alors par défaut l'index de plage(n) est transmis où n définit la longueur d'un tableau, c'est-à-dire [0,1,2,.... plage (lentille (tableau)) -1 ].

Exemple

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Sortir

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Créer une série à partir de dict

Nous pouvons également créer une série à partir de dict. Si l'objet dictionnaire est transmis en entrée et que l'index n'est pas spécifié, alors les clés du dictionnaire sont triées pour construire l'index. .

Si l'index est passé, alors les valeurs correspondant à une étiquette particulière dans l'index seront extraites du dictionnaire .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Sortir

 x 0.0 y 1.0 z 2.0 dtype: float64 

Créez une série à l'aide de Scalar :

Si l'on prend les valeurs scalaires, alors l'index doit être fourni. La valeur scalaire sera répétée pour correspondre à la longueur de l'index.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Sortir

 0 4 1 4 2 4 3 4 dtype: int64 

Accéder aux données des séries avec Position :

Une fois que vous avez créé l'objet de type Series, vous pouvez accéder à ses index, ses données et même ses éléments individuels.

Les données de la série sont accessibles de la même manière que celles du ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Sortir

 1 

Attributs des objets de série

L'attribut Series est défini comme toute information relative à l'objet Series telle que la taille, le type de données. etc. Vous trouverez ci-dessous quelques-uns des attributs que vous pouvez utiliser pour obtenir des informations sur l'objet Series :

Les attributs Description
Série.index Définit l'index de la série.
Série.forme Il renvoie un tuple de forme des données.
Série.dtype Il renvoie le type de données des données.
Série.size Il renvoie la taille des données.
Série.vide Il renvoie True si l'objet Series est vide, sinon renvoie false.
Série.hasnans Il renvoie True s'il y a des valeurs NaN, sinon renvoie false.
Série.nbytes Il renvoie le nombre d'octets dans les données.
Série. Je suis. Il renvoie le nombre de dimensions dans les données.
Série.itemsize Il renvoie la taille du type de données de l'élément.

Récupération du tableau d'index et du tableau de données d'un objet série

Nous pouvons récupérer le tableau d'index et le tableau de données d'un objet Series existant en utilisant les attributs index et valeurs.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Sortir

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Récupération des types (dtype) et de la taille du type (itemsize)

Vous pouvez utiliser l'attribut dtype avec l'objet Series comme dtype pour récupérer le type de données d'un élément individuel d'un objet série, vous pouvez utiliser l'attribut taille de l'article attribut pour afficher le nombre d’octets alloués à chaque élément de données.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Sortir

 int64 8 float64 8 

Récupération de forme

La forme de l'objet Series définit le nombre total d'éléments, y compris les valeurs manquantes ou vides (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Sortir

 (4,) (3,) 

Récupération de la dimension, de la taille et du nombre d'octets :

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Sortir

 1 1 4 3 32 24 

Vérification du vide et de la présence de NaN

Pour vérifier que l'objet Series est vide, vous pouvez utiliser le attribut vide . De même, pour vérifier si un objet série contient ou non des valeurs NaN, vous pouvez utiliser le Hassan attribut.

Exemple

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Sortir

 False False True True False False 4 3 3 3 

Fonctions de la série

Certaines fonctions utilisées dans Series sont les suivantes :

Les fonctions Description
Série Pandas.map() Mappez les valeurs de deux séries qui ont une colonne commune.
Série Pandas.std() Calculez l'écart type de l'ensemble de nombres, du DataFrame, de la colonne et des lignes donné.
Série Pandas.to_frame() Convertissez l'objet série en dataframe.
Série Pandas.value_counts() Renvoie une série contenant un nombre de valeurs uniques.