La série Pandas peut être définie comme un tableau unidimensionnel capable de stocker différents types de données. Nous pouvons facilement convertir la liste, le tuple et le dictionnaire en séries en utilisant ' série ' méthode. Les étiquettes de ligne d’une série sont appelées index. Une série ne peut pas contenir plusieurs colonnes. Il a le paramètre suivant :
combien d'onces font 10 millilitres
Créer une série :
Nous pouvons créer une série de deux manières :
- Créer une série vide
- Créez une série à l'aide d'entrées.
Créez une série vide :
Nous pouvons facilement créer une série vide dans Pandas, ce qui signifie qu'elle n'aura aucune valeur.
La syntaxe utilisée pour créer une série vide :
= pandas.Series()
L'exemple ci-dessous crée un objet de type série vide qui n'a aucune valeur et ayant un type de données par défaut, c'est-à-dire flotteur64 .
Exemple
import pandas as pd x = pd.Series() print (x)
Sortir
Series([], dtype: float64)
Création d'une série à l'aide d'entrées :
Nous pouvons créer des séries en utilisant diverses entrées :
- Tableau
- Dicté
- Valeur scalaire
Création d'une série à partir d'un tableau :
Avant de créer une série, nous devons d'abord importer le numpy module, puis utilisez la fonction array() dans le programme. Si les données sont ndarray, alors l'index transmis doit être de la même longueur.
Si on ne passe pas d'index, alors par défaut l'index de plage(n) est transmis où n définit la longueur d'un tableau, c'est-à-dire [0,1,2,.... plage (lentille (tableau)) -1 ].
Exemple
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Sortir
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Créer une série à partir de dict
Nous pouvons également créer une série à partir de dict. Si l'objet dictionnaire est transmis en entrée et que l'index n'est pas spécifié, alors les clés du dictionnaire sont triées pour construire l'index. .
Si l'index est passé, alors les valeurs correspondant à une étiquette particulière dans l'index seront extraites du dictionnaire .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Sortir
x 0.0 y 1.0 z 2.0 dtype: float64
Créez une série à l'aide de Scalar :
Si l'on prend les valeurs scalaires, alors l'index doit être fourni. La valeur scalaire sera répétée pour correspondre à la longueur de l'index.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Sortir
0 4 1 4 2 4 3 4 dtype: int64
Accéder aux données des séries avec Position :
Une fois que vous avez créé l'objet de type Series, vous pouvez accéder à ses index, ses données et même ses éléments individuels.
Les données de la série sont accessibles de la même manière que celles du ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Sortir
1
Attributs des objets de série
L'attribut Series est défini comme toute information relative à l'objet Series telle que la taille, le type de données. etc. Vous trouverez ci-dessous quelques-uns des attributs que vous pouvez utiliser pour obtenir des informations sur l'objet Series :
Les attributs | Description |
---|---|
Série.index | Définit l'index de la série. |
Série.forme | Il renvoie un tuple de forme des données. |
Série.dtype | Il renvoie le type de données des données. |
Série.size | Il renvoie la taille des données. |
Série.vide | Il renvoie True si l'objet Series est vide, sinon renvoie false. |
Série.hasnans | Il renvoie True s'il y a des valeurs NaN, sinon renvoie false. |
Série.nbytes | Il renvoie le nombre d'octets dans les données. |
Série. Je suis. | Il renvoie le nombre de dimensions dans les données. |
Série.itemsize | Il renvoie la taille du type de données de l'élément. |
Récupération du tableau d'index et du tableau de données d'un objet série
Nous pouvons récupérer le tableau d'index et le tableau de données d'un objet Series existant en utilisant les attributs index et valeurs.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Sortir
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Récupération des types (dtype) et de la taille du type (itemsize)
Vous pouvez utiliser l'attribut dtype avec l'objet Series comme dtype pour récupérer le type de données d'un élément individuel d'un objet série, vous pouvez utiliser l'attribut taille de l'article attribut pour afficher le nombre d’octets alloués à chaque élément de données.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Sortir
int64 8 float64 8
Récupération de forme
La forme de l'objet Series définit le nombre total d'éléments, y compris les valeurs manquantes ou vides (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Sortir
(4,) (3,)
Récupération de la dimension, de la taille et du nombre d'octets :
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Sortir
1 1 4 3 32 24
Vérification du vide et de la présence de NaN
Pour vérifier que l'objet Series est vide, vous pouvez utiliser le attribut vide . De même, pour vérifier si un objet série contient ou non des valeurs NaN, vous pouvez utiliser le Hassan attribut.
Exemple
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Sortir
False False True True False False 4 3 3 3
Fonctions de la série
Certaines fonctions utilisées dans Series sont les suivantes :
Les fonctions | Description |
---|---|
Série Pandas.map() | Mappez les valeurs de deux séries qui ont une colonne commune. |
Série Pandas.std() | Calculez l'écart type de l'ensemble de nombres, du DataFrame, de la colonne et des lignes donné. |
Série Pandas.to_frame() | Convertissez l'objet série en dataframe. |
Série Pandas.value_counts() | Renvoie une série contenant un nombre de valeurs uniques. |