Python fournit l'une des bibliothèques de traçage les plus populaires appelée Matplotlib . Il est open source et multiplateforme pour créer des tracés 2D à partir de données dans un tableau. Il est généralement utilisé pour la visualisation des données et représente à travers les différents graphiques.
Matplotlib a été conçu à l'origine par John D. Hunter en 2003. La version récente de matplotlib est la 2.2.0 publiée en janvier 2018.
Avant de commencer à travailler avec la bibliothèque matplotlib, nous devons l'installer dans notre environnement Python.
Installation de Matplotlib
Tapez la commande suivante dans votre terminal et appuyez sur Entrée.
pip install matplotlib
La commande ci-dessus installera la bibliothèque matplotlib et son package de dépendances sur le système d'exploitation Windows.
Concept de base de Matplotlib
Un graphique contient les parties suivantes. Comprenons ces parties.
Chiffre: C'est une figure entière qui peut contenir un ou plusieurs axes (parcelles). Nous pouvons considérer une figure comme une toile contenant des intrigues.
Haches : Une Figure peut contenir plusieurs Axes. Il se compose de deux ou trois (dans le cas de la 3D) objets Axis. Chaque axe est composé d'un titre, d'une étiquette x et d'une étiquette y.
Axe: Les axes sont le nombre d'objets en forme de ligne et sont responsables de la génération des limites du graphique.
Artiste: Un artiste est tout ce que nous voyons sur le graphique comme les objets Texte, les objets Line2D et les objets de collection. La plupart des artistes sont liés aux haches.
Introduction à pyplot
Matplotlib fournit le package pyplot qui est utilisé pour tracer le graphique des données données. Le matplotlib.pyplot est un ensemble de fonctions de style commande qui font fonctionner matplotlib comme MATLAB. Le package pyplot contient de nombreuses fonctions permettant de créer une figure, de créer une zone de traçage dans une figure, de décorer le tracé avec des étiquettes, de tracer des lignes dans une zone de traçage, etc.
Nous pouvons tracer rapidement un graphique avec pyplot. Jetons un coup d'œil à l'exemple suivant.
Exemple de base de traçage de graphique
Voici l'exemple de base de génération d'un graphique simple ; le programme est le suivant :
from matplotlib import pyplot as plt #ploting our canvas plt.plot([1,2,3],[4,5,1]) #display the graph plt.show()
Sortir:
Tracer différents types de graphiques
Nous pouvons tracer les différents graphiques en utilisant le module pyplot. Comprenons les exemples suivants.
1. Graphique linéaire
Le graphique linéaire est utilisé pour afficher les informations sous forme d’une série de lignes. C’est facile à tracer. Considérez l'exemple suivant.
Exemple -
from matplotlib import pyplot as plt x = [1,2,3] y = [10,11,12] plt.plot(x,y) plt.title('Line graph') plt.ylabel('Y axis') plt.xlabel('X axis') plt.show()
Sortir:
La ligne peut être modifiée à l'aide des différentes fonctions. Cela rend le graphique plus attrayant. Ci-dessous l'exemple.
Exemple -
from matplotlib import pyplot as plt from matplotlib import style style.use('ggplot') x = [10, 12, 13] y = [8, 16, 6] x2 = [8, 15, 11] y2 = [6, 15, 7] plt.plot(x, y, 'b', label='line one', linewidth=5) plt.plot(x2, y2, 'r', label='line two', linewidth=5) plt.title('Epic Info') fig = plt.figure() plt.ylabel('Y axis') plt.xlabel('X axis') plt.show()
2. Graphique à barres
Le graphique à barres est l'un des graphiques les plus courants et il est utilisé pour représenter les données associées aux variables catégorielles. Le bar() La fonction accepte trois arguments : les variables catégorielles, les valeurs et la couleur.
Exemple -
from matplotlib import pyplot as plt Names = ['Arun','James','Ricky','Patrick'] Marks = [51,87,45,67] plt.bar(Names,Marks,color = 'blue') plt.title('Result') plt.xlabel('Names') plt.ylabel('Marks') plt.show()
3. Graphique circulaire
Un graphique est un graphique circulaire divisé en sous-parties ou segments. Il est utilisé pour représenter le pourcentage ou les données proportionnelles où chaque tranche du gâteau représente une catégorie particulière. Comprenons l'exemple ci-dessous.
fonction statique en Java
Exemple -
from matplotlib import pyplot as plt # Pie chart, where the slices will be ordered and plotted counter-clockwise: Aus_Players = 'Smith', 'Finch', 'Warner', 'Lumberchane' Runs = [42, 32, 18, 24] explode = (0.1, 0, 0, 0) # it 'explode' the 1st slice fig1, ax1 = plt.subplots() ax1.pie(Runs, explode=explode, labels=Aus_Players, autopct='%1.1f%%', shadow=True, startangle=90) ax1.axis('equal') # Equal aspect ratio ensures that pie is drawn as a circle. plt.show()
Sortir:
4. Histogramme
L'histogramme et le graphique à barres sont assez similaires mais il existe une différence mineure. Un histogramme est utilisé pour représenter la distribution et un graphique à barres est utilisé pour comparer les différentes entités. Un histogramme est généralement utilisé pour tracer la fréquence d'un certain nombre de valeurs par rapport à un ensemble de plages de valeurs.
Dans l'exemple suivant, nous avons pris les données des différents pourcentages de score de l'élève et tracé l'histogramme par rapport au nombre d'élèves. Comprenons l'exemple suivant.
Exemple -
from matplotlib import pyplot as plt from matplotlib import pyplot as plt percentage = [97,54,45,10, 20, 10, 30,97,50,71,40,49,40,74,95,80,65,82,70,65,55,70,75,60,52,44,43,42,45] number_of_student = [0,10,20,30,40,50,60,70,80,90,100] plt.hist(percentage, number_of_student, histtype='bar', rwidth=0.8) plt.xlabel('percentage') plt.ylabel('Number of people') plt.title('Histogram') plt.show()
Sortir:
Comprenons un autre exemple.
Exemple - 2 :
from matplotlib import pyplot as plt # Importing Numpy Library import numpy as np plt.style.use('fivethirtyeight') mu = 50 sigma = 7 x = np.random.normal(mu, sigma, size=200) fig, ax = plt.subplots() ax.hist(x, 20) ax.set_title('Historgram') ax.set_xlabel('bin range') ax.set_ylabel('frequency') fig.tight_layout() plt.show()
Sortir:
5. Nuage de points
Le nuage de points est utilisé pour comparer la variable par rapport aux autres variables. Il est défini comme la manière dont une variable affecte l’autre variable. Les données sont représentées comme une collection de points. Comprenons l'exemple suivant.
Exemple -
from matplotlib import pyplot as plt from matplotlib import style style.use('ggplot') x = [4,8,12] y = [19,11,7] x2 = [7,10,12] y2 = [8,18,24] plt.scatter(x, y) plt.scatter(x2, y2, color='g') plt.title('Epic Info') plt.ylabel('Y axis') plt.xlabel('X axis') plt.show()
Sortir:
Exemple - 2 :
import matplotlib.pyplot as plt a = [2, 2.5, 3, 3.5, 4.5, 4.7, 5.0] b = [7.5, 8, 8.5, 9, 9.5, 10, 10.5] a1 = [9, 8.5, 9, 9.5, 10, 10.5, 12] b1 = [3, 3.5, 4.7, 4, 4.5, 5, 5.2] plt.scatter(a, b, label='high income low saving', color='b') plt.scatter(a1, b1, label='low income high savings', color='g') plt.xlabel('saving*100') plt.ylabel('income*1000') plt.title('Scatter Plot') plt.legend() plt.show()
Sortir:
Dans ce didacticiel, nous avons abordé tous les types de graphiques de base utilisés dans la visualisation de données. Pour en savoir plus sur le graphique, visitez notre didacticiel matplotlib.