L'apprentissage automatique est un sous-ensemble de l'IA, qui permet à la machine d'apprendre automatiquement à partir des données, d'améliorer les performances des expériences passées et de faire des prédictions. . L’apprentissage automatique contient un ensemble d’algorithmes qui fonctionnent sur une énorme quantité de données. Les données sont transmises à ces algorithmes pour les former, et sur la base de la formation, ils construisent le modèle et effectuent une tâche spécifique.
Ces algorithmes ML aident à résoudre différents problèmes commerciaux tels que la régression, la classification, la prévision, le clustering et les associations, etc.
Sur la base des méthodes et des modes d'apprentissage, l'apprentissage automatique est divisé en quatre types principaux, à savoir :
- Apprentissage automatique supervisé
- Apprentissage automatique non supervisé
- Apprentissage automatique semi-supervisé
- Apprentissage par renforcement
Dans cette rubrique, nous fournirons une description détaillée des types de Machine Learning ainsi que de leurs algorithmes respectifs :
1. Apprentissage automatique supervisé
Comme son nom l'indique, Apprentissage automatique supervisé est basée sur la supervision. Cela signifie que dans la technique d'apprentissage supervisé, nous entraînons les machines à l'aide de l'ensemble de données « étiqueté » et, sur la base de l'entraînement, la machine prédit le résultat. Ici, les données étiquetées spécifient que certaines des entrées sont déjà mappées à la sortie. Plus précieusement, pouvons-nous dire : d'abord, nous entraînons la machine avec l'entrée et la sortie correspondante, puis nous demandons à la machine de prédire la sortie à l'aide de l'ensemble de données de test.
Comprenons l'apprentissage supervisé avec un exemple. Supposons que nous disposions d’un ensemble de données d’entrée d’images de chats et de chiens. Donc, dans un premier temps, nous fournirons la formation à la machine pour comprendre les images, comme le forme et taille de la queue du chat et du chien, forme des yeux, couleur, taille (les chiens sont plus grands, les chats sont plus petits), etc. Une fois la formation terminée, nous saisissons l’image d’un chat et demandons à la machine d’identifier l’objet et de prédire le résultat. Maintenant, la machine est bien entraînée, elle va donc vérifier toutes les caractéristiques de l'objet, comme la hauteur, la forme, la couleur, les yeux, les oreilles, la queue, etc., et découvrir qu'il s'agit d'un chat. Donc, cela le mettra dans la catégorie Chat. Il s'agit du processus par lequel la machine identifie les objets dans l'apprentissage supervisé.
L'objectif principal de la technique d'apprentissage supervisé est de mapper la variable d'entrée (x) avec la variable de sortie (y). Certaines applications concrètes de l’apprentissage supervisé sont Évaluation des risques, détection de fraude, filtrage du spam, etc.
string.contient java
Catégories d’apprentissage automatique supervisé
L’apprentissage automatique supervisé peut être classé en deux types de problèmes, indiqués ci-dessous :
a) Classement
Les algorithmes de classification sont utilisés pour résoudre les problèmes de classification dans lesquels la variable de sortie est catégorielle, tels que ' Oui ou non, homme ou femme, rouge ou bleu, etc. . Les algorithmes de classification prédisent les catégories présentes dans l'ensemble de données. Quelques exemples concrets d'algorithmes de classification sont Détection du spam, filtrage des e-mails, etc.
Certains algorithmes de classification populaires sont présentés ci-dessous :
b) Régression
Les algorithmes de régression sont utilisés pour résoudre des problèmes de régression dans lesquels il existe une relation linéaire entre les variables d'entrée et de sortie. Ceux-ci sont utilisés pour prédire des variables de production continues, telles que les tendances du marché, les prévisions météorologiques, etc.
erreur sémantique
Certains algorithmes de régression populaires sont présentés ci-dessous :
Avantages et inconvénients de l'apprentissage supervisé
Avantages :
- Depuis l'apprentissage supervisé, nous travaillons avec l'ensemble de données étiqueté afin que nous puissions avoir une idée exacte des classes d'objets.
- Ces algorithmes sont utiles pour prédire le résultat sur la base d’une expérience antérieure.
Désavantages:
- Ces algorithmes ne sont pas capables de résoudre des tâches complexes.
- Il peut prédire un résultat erroné si les données de test sont différentes des données d'entraînement.
- Cela nécessite beaucoup de temps de calcul pour entraîner l’algorithme.
Applications de l’apprentissage supervisé
Certaines applications courantes de l’apprentissage supervisé sont présentées ci-dessous :
Les algorithmes d’apprentissage supervisé sont utilisés dans la segmentation d’images. Dans ce processus, la classification des images est effectuée sur différentes données d'image avec des étiquettes prédéfinies.
Les algorithmes supervisés sont également utilisés dans le domaine médical à des fins de diagnostic. Cela se fait en utilisant des images médicales et des données antérieures étiquetées avec des étiquettes pour les maladies. Avec un tel processus, la machine peut identifier une maladie pour les nouveaux patients.
2. Apprentissage automatique non supervisé
Apprentissage non supervisé g est différent de la technique d'apprentissage supervisé ; comme son nom l’indique, aucune supervision n’est nécessaire. Cela signifie que dans l’apprentissage automatique non supervisé, la machine est entraînée à l’aide de l’ensemble de données non étiqueté et la machine prédit le résultat sans aucune supervision.
Dans l'apprentissage non supervisé, les modèles sont entraînés avec des données qui ne sont ni classées ni étiquetées, et le modèle agit sur ces données sans aucune supervision.
L'objectif principal de l'algorithme d'apprentissage non supervisé est de regrouper ou de catégoriser l'ensemble de données non triées en fonction des similitudes, des modèles et des différences. Les machines sont chargées de trouver les modèles cachés dans l’ensemble de données d’entrée.
Prenons un exemple pour le comprendre plus précieusement ; supposons qu'il y ait un panier d'images de fruits et que nous l'entrions dans le modèle d'apprentissage automatique. Les images sont totalement inconnues du modèle, et la tâche de la machine est de retrouver les motifs et les catégories des objets.
Ainsi, la machine découvrira désormais ses modèles et ses différences, telles que la différence de couleur, la différence de forme, et prédira le résultat lorsqu'elle sera testée avec l'ensemble de données de test.
série dans Postgres
Catégories d’apprentissage automatique non supervisé
L’apprentissage non supervisé peut être classé en deux types, indiqués ci-dessous :
1) Regroupement
La technique de clustering est utilisée lorsque l'on souhaite retrouver les groupes inhérents aux données. C'est une façon de regrouper les objets dans un cluster de telle sorte que les objets présentant le plus de similitudes restent dans un groupe et aient moins ou pas de similitudes avec les objets des autres groupes. Un exemple d'algorithme de clustering consiste à regrouper les clients en fonction de leur comportement d'achat.
Certains des algorithmes de clustering les plus populaires sont présentés ci-dessous :
2) Association
L'apprentissage des règles d'association est une technique d'apprentissage non supervisée, qui permet de trouver des relations intéressantes entre les variables au sein d'un grand ensemble de données. L'objectif principal de cet algorithme d'apprentissage est de trouver la dépendance d'un élément de données sur un autre élément de données et de cartographier ces variables en conséquence afin qu'il puisse générer un profit maximum. Cet algorithme est principalement appliqué dans Analyse du panier de marché, exploration de l'utilisation du Web, production continue , etc.
Certains algorithmes populaires d'apprentissage des règles d'association sont Algorithme Apriori, Eclat, algorithme de croissance FP.
Avantages et inconvénients de l'algorithme d'apprentissage non supervisé
Avantages :
- Ces algorithmes peuvent être utilisés pour des tâches compliquées par rapport aux tâches supervisées car ces algorithmes fonctionnent sur un ensemble de données non étiqueté.
- Les algorithmes non supervisés sont préférables pour diverses tâches, car il est plus facile d’obtenir l’ensemble de données non étiqueté que l’ensemble de données étiqueté.
Désavantages:
- Le résultat d’un algorithme non supervisé peut être moins précis car l’ensemble de données n’est pas étiqueté et les algorithmes ne sont pas entraînés avec le résultat exact au préalable.
- Travailler avec l'apprentissage non supervisé est plus difficile car il fonctionne avec un ensemble de données non étiqueté qui ne correspond pas à la sortie.
Applications de l'apprentissage non supervisé
3. Apprentissage semi-supervisé
L'apprentissage semi-supervisé est un type d'algorithme d'apprentissage automatique qui se situe entre l'apprentissage automatique supervisé et non supervisé. . Il représente le terrain intermédiaire entre les algorithmes d'apprentissage supervisé (avec données de formation étiquetées) et non supervisé (sans données de formation étiquetées) et utilise la combinaison d'ensembles de données étiquetés et non étiquetés pendant la période de formation.
UN Bien que l'apprentissage semi-supervisé soit un intermédiaire entre l'apprentissage supervisé et non supervisé et qu'il fonctionne sur des données constituées de quelques étiquettes, il se compose principalement de données non étiquetées. Comme les étiquettes sont coûteuses, mais à des fins professionnelles, elles peuvent comporter peu d'étiquettes. C’est complètement différent de l’apprentissage supervisé et non supervisé car ils sont basés sur la présence et l’absence d’étiquettes.
Pour surmonter les inconvénients des algorithmes d’apprentissage supervisé et non supervisé, le concept d’apprentissage semi-supervisé est introduit. . L’objectif principal de l’apprentissage semi-supervisé est d’utiliser efficacement toutes les données disponibles, plutôt que seulement les données étiquetées comme dans l’apprentissage supervisé. Initialement, des données similaires sont regroupées avec un algorithme d'apprentissage non supervisé, et en outre, cela permet d'étiqueter les données non étiquetées en données étiquetées. En effet, les données étiquetées sont une acquisition comparativement plus coûteuse que les données non étiquetées.
Nous pouvons imaginer ces algorithmes avec un exemple. L'apprentissage supervisé consiste à ce qu'un étudiant soit sous la supervision d'un instructeur à la maison et au collège. De plus, si cet étudiant analyse lui-même le même concept sans aucune aide de l’instructeur, il s’agit d’un apprentissage non supervisé. En apprentissage semi-supervisé, l'étudiant doit se réviser après avoir analysé le même concept sous la direction d'un instructeur du collège.
qu'est-ce que c'est
Avantages et inconvénients de l'apprentissage semi-supervisé
Avantages :
- Il est simple et facile de comprendre l'algorithme.
- C’est très efficace.
- Il est utilisé pour résoudre les inconvénients des algorithmes d’apprentissage supervisé et non supervisé.
Désavantages:
- Les résultats des itérations peuvent ne pas être stables.
- Nous ne pouvons pas appliquer ces algorithmes aux données au niveau du réseau.
- La précision est faible.
4. Apprentissage par renforcement
L'apprentissage par renforcement fonctionne sur un processus basé sur la rétroaction, dans lequel un agent d'IA (un composant logiciel) explore automatiquement son environnement en frappant et en suivant, en agissant, en apprenant de ses expériences et en améliorant ses performances. L'agent est récompensé pour chaque bonne action et puni pour chaque mauvaise action ; par conséquent, l’objectif de l’agent d’apprentissage par renforcement est de maximiser les récompenses.
Dans l’apprentissage par renforcement, il n’y a pas de données étiquetées comme l’apprentissage supervisé, et les agents apprennent uniquement de leurs expériences.
Le processus d’apprentissage par renforcement est similaire à celui d’un être humain ; par exemple, un enfant apprend diverses choses grâce aux expériences de sa vie quotidienne. Un exemple d'apprentissage par renforcement consiste à jouer à un jeu dans lequel le jeu est l'environnement, les mouvements d'un agent à chaque étape définissent des états et le but de l'agent est d'obtenir un score élevé. L'agent reçoit des commentaires en termes de punition et de récompenses.
De par sa manière de fonctionner, l’apprentissage par renforcement est utilisé dans différents domaines tels que Théorie des jeux, Recherche opérationnelle, Théorie de l'information, Systèmes multi-agents.
Un problème d’apprentissage par renforcement peut être formalisé en utilisant Processus de décision de Markov (MDP). Dans MDP, l'agent interagit constamment avec l'environnement et effectue des actions ; à chaque action, l'environnement répond et génère un nouvel état.
Catégories d’apprentissage par renforcement
L'apprentissage par renforcement est principalement classé en deux types de méthodes/algorithmes :
tableau d'octets en chaîne
Cas d'utilisation réels de l'apprentissage par renforcement
Les algorithmes RL sont très populaires dans les applications de jeux. Il est utilisé pour acquérir des performances surhumaines. Certains jeux populaires qui utilisent les algorithmes RL sont AlphaGO et AlphaGO Zéro .
L'article « Gestion des ressources avec apprentissage par renforcement profond » a montré comment utiliser RL dans un ordinateur pour apprendre et planifier automatiquement les ressources afin qu'elles attendent différentes tâches afin de minimiser le ralentissement moyen des tâches.
RL est largement utilisé dans les applications robotiques. Les robots sont utilisés dans le domaine industriel et manufacturier, et ces robots sont rendus plus puissants grâce à l'apprentissage par renforcement. Il existe différentes industries qui ont pour vision de construire des robots intelligents en utilisant l’IA et la technologie d’apprentissage automatique.
Le text-mining, l'une des grandes applications de la PNL, est désormais mis en œuvre avec l'aide du Reinforcement Learning de la société Salesforce.
Avantages et inconvénients de l'apprentissage par renforcement
Avantages
- Cela aide à résoudre des problèmes complexes du monde réel difficiles à résoudre par des techniques générales.
- Le modèle d’apprentissage de RL est similaire à l’apprentissage des êtres humains ; c'est pourquoi les résultats les plus précis peuvent être trouvés.
- Aide à obtenir des résultats à long terme.
Désavantage
- Les algorithmes RL ne sont pas préférés pour les problèmes simples.
- Les algorithmes RL nécessitent d’énormes données et calculs.
- Trop d’apprentissage par renforcement peut conduire à une surcharge d’états qui peut affaiblir les résultats.
La malédiction de la dimensionnalité limite l'apprentissage par renforcement pour les systèmes physiques réels.