L'apprentissage supervisé est le type d'apprentissage automatique dans lequel les machines sont entraînées à l'aide de données d'entraînement bien « étiquetées » et, sur la base de ces données, les machines prédisent le résultat. Les données étiquetées signifient que certaines données d'entrée sont déjà étiquetées avec la sortie correcte.
Dans l'apprentissage supervisé, les données de formation fournies aux machines fonctionnent comme un superviseur qui apprend aux machines à prédire correctement le résultat. Il applique le même concept qu’un étudiant apprend sous la supervision de l’enseignant.
L'apprentissage supervisé est un processus consistant à fournir des données d'entrée ainsi que des données de sortie correctes au modèle d'apprentissage automatique. Le but d’un algorithme d’apprentissage supervisé est de trouver une fonction de mappage pour mapper la variable d'entrée (x) avec la variable de sortie (y) .
Dans le monde réel, l’apprentissage supervisé peut être utilisé pour Évaluation des risques, classification des images, détection de fraude, filtrage du spam , etc.
Comment fonctionne l’apprentissage supervisé ?
Dans l'apprentissage supervisé, les modèles sont formés à l'aide d'un ensemble de données étiquetés, dans lequel le modèle apprend chaque type de données. Une fois le processus de formation terminé, le modèle est testé sur la base de données de test (un sous-ensemble de l'ensemble de formation), puis il prédit le résultat.
Le fonctionnement de l'apprentissage supervisé peut être facilement compris par l'exemple et le diagramme ci-dessous :
qu'est-ce que la ROM
Supposons que nous ayons un ensemble de données de différents types de formes comprenant un carré, un rectangle, un triangle et un polygone. La première étape consiste maintenant à entraîner le modèle pour chaque forme.
- Si la forme donnée a quatre côtés et que tous les côtés sont égaux, alors elle sera étiquetée comme un Carré .
- Si la forme donnée a trois côtés, elle sera alors étiquetée comme un Triangle .
- Si la forme donnée a six côtés égaux, elle sera étiquetée comme hexagone .
Maintenant, après la formation, nous testons notre modèle à l'aide de l'ensemble de test, et la tâche du modèle est d'identifier la forme.
La machine est déjà entraînée sur tous les types de formes, et lorsqu'elle trouve une nouvelle forme, elle classe la forme sur la base d'un certain nombre de côtés et prédit le résultat.
Étapes impliquées dans l’apprentissage supervisé :
- Déterminez d’abord le type d’ensemble de données d’entraînement
- Collectez/Rassemblez les données d’entraînement étiquetées.
- Diviser l'ensemble de données d'entraînement en entraînement ensemble de données, ensemble de données de test et ensemble de données de validation .
- Déterminez les caractéristiques d'entrée de l'ensemble de données d'entraînement, qui doivent disposer de suffisamment de connaissances pour que le modèle puisse prédire avec précision la sortie.
- Déterminez l'algorithme approprié pour le modèle, tel qu'une machine à vecteurs de support, un arbre de décision, etc.
- Exécutez l'algorithme sur l'ensemble de données d'entraînement. Parfois, nous avons besoin d'ensembles de validation comme paramètres de contrôle, qui constituent le sous-ensemble des ensembles de données de formation.
- Évaluez la précision du modèle en fournissant l’ensemble de test. Si le modèle prédit le résultat correct, cela signifie que notre modèle est précis.
Types d’algorithmes d’apprentissage automatique supervisés :
L’apprentissage supervisé peut être divisé en deux types de problèmes :
1. Régression
Les algorithmes de régression sont utilisés s'il existe une relation entre la variable d'entrée et la variable de sortie. Il est utilisé pour la prédiction de variables continues, telles que les prévisions météorologiques, les tendances du marché, etc. Vous trouverez ci-dessous quelques algorithmes de régression populaires qui relèvent de l'apprentissage supervisé :
verrouiller une application Android
- Régression linéaire
- Arbres de régression
- Régression non linéaire
- Régression linéaire bayésienne
- Régression polynomiale
2. Classement
Les algorithmes de classification sont utilisés lorsque la variable de sortie est catégorielle, ce qui signifie qu'il existe deux classes telles que Oui-Non, Homme-Femme, Vrai-faux, etc.
Filtrage anti-spam,
- Forêt aléatoire
- Arbres de décision
- Régression logistique
- Machines vectorielles de support
Remarque : Nous discuterons de ces algorithmes en détail dans les chapitres suivants.
Avantages de l’apprentissage supervisé :
- Grâce à l’apprentissage supervisé, le modèle peut prédire le résultat sur la base d’expériences antérieures.
- En apprentissage supervisé, nous pouvons avoir une idée exacte des classes d’objets.
- Le modèle d'apprentissage supervisé nous aide à résoudre divers problèmes du monde réel tels que détection de fraude, filtrage du spam , etc.
Inconvénients de l’apprentissage supervisé :
- Les modèles d’apprentissage supervisé ne sont pas adaptés à la gestion de tâches complexes.
- L'apprentissage supervisé ne peut pas prédire le résultat correct si les données de test sont différentes de l'ensemble de données de formation.
- La formation nécessitait beaucoup de temps de calcul.
- Dans l’apprentissage supervisé, nous avons besoin de suffisamment de connaissances sur les classes d’objets.