logo

Pandas DataFrame.describe()

La méthode décrire() est utilisée pour calculer certaines données statistiques comme centile, moyenne et norme des valeurs numériques de la Series ou du DataFrame. Il analyse à la fois les séries numériques et d'objets, ainsi que les ensembles de colonnes DataFrame de types de données mixtes.

Syntaxe

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Paramètres

    centile :Il s'agit d'un paramètre facultatif qui est une liste de types de données de nombres qui doivent être compris entre 0 et 1. Sa valeur par défaut est [.25, .5, .75], qui renvoie les 25e, 50e et 75e centiles.inclure:C'est également un paramètre facultatif qui inclut la liste des types de données tout en décrivant le DataFrame. Sa valeur par défaut est Aucune.exclure:C'est également un paramètre facultatif qui exclut la liste des types de données lors de la description du DataFrame. Sa valeur par défaut est Aucune.

Retour

Il renvoie le résumé statistique de la série et du DataFrame.

Exemple 1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Sortir

 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Exemple2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Sortir

 count 4 unique 3 top q freq 2 dtype: object 

Exemple3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Sortir

 categorical count 3 unique 3 top u freq 1 

Exemple4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Sortir

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0