logo

Types d'apprentissage automatique

L'apprentissage automatique est un sous-ensemble de l'IA, qui permet à la machine d'apprendre automatiquement à partir des données, d'améliorer les performances des expériences passées et de faire des prédictions. . L’apprentissage automatique contient un ensemble d’algorithmes qui fonctionnent sur une énorme quantité de données. Les données sont transmises à ces algorithmes pour les former, et sur la base de la formation, ils construisent le modèle et effectuent une tâche spécifique.

Types d'apprentissage automatique

Ces algorithmes ML aident à résoudre différents problèmes commerciaux tels que la régression, la classification, la prévision, le clustering et les associations, etc.

Sur la base des méthodes et des modes d'apprentissage, l'apprentissage automatique est divisé en quatre types principaux, à savoir :

  1. Apprentissage automatique supervisé
  2. Apprentissage automatique non supervisé
  3. Apprentissage automatique semi-supervisé
  4. Apprentissage par renforcement
Types d'apprentissage automatique

Dans cette rubrique, nous fournirons une description détaillée des types de Machine Learning ainsi que de leurs algorithmes respectifs :

1. Apprentissage automatique supervisé

Comme son nom l'indique, Apprentissage automatique supervisé est basée sur la supervision. Cela signifie que dans la technique d'apprentissage supervisé, nous entraînons les machines à l'aide de l'ensemble de données « étiqueté » et, sur la base de l'entraînement, la machine prédit le résultat. Ici, les données étiquetées spécifient que certaines des entrées sont déjà mappées à la sortie. Plus précieusement, pouvons-nous dire : d'abord, nous entraînons la machine avec l'entrée et la sortie correspondante, puis nous demandons à la machine de prédire la sortie à l'aide de l'ensemble de données de test.

Comprenons l'apprentissage supervisé avec un exemple. Supposons que nous disposions d’un ensemble de données d’entrée d’images de chats et de chiens. Donc, dans un premier temps, nous fournirons la formation à la machine pour comprendre les images, comme le forme et taille de la queue du chat et du chien, forme des yeux, couleur, taille (les chiens sont plus grands, les chats sont plus petits), etc. Une fois la formation terminée, nous saisissons l’image d’un chat et demandons à la machine d’identifier l’objet et de prédire le résultat. Maintenant, la machine est bien entraînée, elle va donc vérifier toutes les caractéristiques de l'objet, comme la hauteur, la forme, la couleur, les yeux, les oreilles, la queue, etc., et découvrir qu'il s'agit d'un chat. Donc, cela le mettra dans la catégorie Chat. Il s'agit du processus par lequel la machine identifie les objets dans l'apprentissage supervisé.

L'objectif principal de la technique d'apprentissage supervisé est de mapper la variable d'entrée (x) avec la variable de sortie (y). Certaines applications concrètes de l’apprentissage supervisé sont Évaluation des risques, détection de fraude, filtrage du spam, etc.

string.contient java

Catégories d’apprentissage automatique supervisé

L’apprentissage automatique supervisé peut être classé en deux types de problèmes, indiqués ci-dessous :

    Classification Régression

a) Classement

Les algorithmes de classification sont utilisés pour résoudre les problèmes de classification dans lesquels la variable de sortie est catégorielle, tels que ' Oui ou non, homme ou femme, rouge ou bleu, etc. . Les algorithmes de classification prédisent les catégories présentes dans l'ensemble de données. Quelques exemples concrets d'algorithmes de classification sont Détection du spam, filtrage des e-mails, etc.

Certains algorithmes de classification populaires sont présentés ci-dessous :

    Algorithme de forêt aléatoire Algorithme d’arbre de décision Algorithme de régression logistique Algorithme de machine à vecteurs de support

b) Régression

Les algorithmes de régression sont utilisés pour résoudre des problèmes de régression dans lesquels il existe une relation linéaire entre les variables d'entrée et de sortie. Ceux-ci sont utilisés pour prédire des variables de production continues, telles que les tendances du marché, les prévisions météorologiques, etc.

erreur sémantique

Certains algorithmes de régression populaires sont présentés ci-dessous :

    Algorithme de régression linéaire simple Algorithme de régression multivariée Algorithme d’arbre de décision Régression au lasso

Avantages et inconvénients de l'apprentissage supervisé

Avantages :

  • Depuis l'apprentissage supervisé, nous travaillons avec l'ensemble de données étiqueté afin que nous puissions avoir une idée exacte des classes d'objets.
  • Ces algorithmes sont utiles pour prédire le résultat sur la base d’une expérience antérieure.

Désavantages:

  • Ces algorithmes ne sont pas capables de résoudre des tâches complexes.
  • Il peut prédire un résultat erroné si les données de test sont différentes des données d'entraînement.
  • Cela nécessite beaucoup de temps de calcul pour entraîner l’algorithme.

Applications de l’apprentissage supervisé

Certaines applications courantes de l’apprentissage supervisé sont présentées ci-dessous :

    Segmentation des images :
    Les algorithmes d’apprentissage supervisé sont utilisés dans la segmentation d’images. Dans ce processus, la classification des images est effectuée sur différentes données d'image avec des étiquettes prédéfinies.Diagnostic médical:
    Les algorithmes supervisés sont également utilisés dans le domaine médical à des fins de diagnostic. Cela se fait en utilisant des images médicales et des données antérieures étiquetées avec des étiquettes pour les maladies. Avec un tel processus, la machine peut identifier une maladie pour les nouveaux patients.Détection de fraude -Les algorithmes de classification d'apprentissage supervisé sont utilisés pour identifier les transactions frauduleuses, les clients frauduleux, etc. Cela se fait en utilisant des données historiques pour identifier les modèles qui peuvent conduire à une éventuelle fraude.Détection du spam -Dans la détection et le filtrage du spam, des algorithmes de classification sont utilisés. Ces algorithmes classent un email comme spam ou non spam. Les courriers indésirables sont envoyés dans le dossier spam.Reconnaissance de la parole -Les algorithmes d’apprentissage supervisé sont également utilisés en reconnaissance vocale. L'algorithme est entraîné avec des données vocales et diverses identifications peuvent être effectuées à l'aide de celui-ci, telles que des mots de passe à commande vocale, des commandes vocales, etc.

2. Apprentissage automatique non supervisé

Apprentissage non supervisé g est différent de la technique d'apprentissage supervisé ; comme son nom l’indique, aucune supervision n’est nécessaire. Cela signifie que dans l’apprentissage automatique non supervisé, la machine est entraînée à l’aide de l’ensemble de données non étiqueté et la machine prédit le résultat sans aucune supervision.

Dans l'apprentissage non supervisé, les modèles sont entraînés avec des données qui ne sont ni classées ni étiquetées, et le modèle agit sur ces données sans aucune supervision.

L'objectif principal de l'algorithme d'apprentissage non supervisé est de regrouper ou de catégoriser l'ensemble de données non triées en fonction des similitudes, des modèles et des différences. Les machines sont chargées de trouver les modèles cachés dans l’ensemble de données d’entrée.

Prenons un exemple pour le comprendre plus précieusement ; supposons qu'il y ait un panier d'images de fruits et que nous l'entrions dans le modèle d'apprentissage automatique. Les images sont totalement inconnues du modèle, et la tâche de la machine est de retrouver les motifs et les catégories des objets.

Ainsi, la machine découvrira désormais ses modèles et ses différences, telles que la différence de couleur, la différence de forme, et prédira le résultat lorsqu'elle sera testée avec l'ensemble de données de test.

série dans Postgres

Catégories d’apprentissage automatique non supervisé

L’apprentissage non supervisé peut être classé en deux types, indiqués ci-dessous :

    Regroupement Association

1) Regroupement

La technique de clustering est utilisée lorsque l'on souhaite retrouver les groupes inhérents aux données. C'est une façon de regrouper les objets dans un cluster de telle sorte que les objets présentant le plus de similitudes restent dans un groupe et aient moins ou pas de similitudes avec les objets des autres groupes. Un exemple d'algorithme de clustering consiste à regrouper les clients en fonction de leur comportement d'achat.

Certains des algorithmes de clustering les plus populaires sont présentés ci-dessous :

    Algorithme de clustering K-Means Algorithme de décalage moyen Algorithme DBSCAN Analyse des composants principaux Analyse indépendante des composants

2) Association

L'apprentissage des règles d'association est une technique d'apprentissage non supervisée, qui permet de trouver des relations intéressantes entre les variables au sein d'un grand ensemble de données. L'objectif principal de cet algorithme d'apprentissage est de trouver la dépendance d'un élément de données sur un autre élément de données et de cartographier ces variables en conséquence afin qu'il puisse générer un profit maximum. Cet algorithme est principalement appliqué dans Analyse du panier de marché, exploration de l'utilisation du Web, production continue , etc.

Certains algorithmes populaires d'apprentissage des règles d'association sont Algorithme Apriori, Eclat, algorithme de croissance FP.

Avantages et inconvénients de l'algorithme d'apprentissage non supervisé

Avantages :

  • Ces algorithmes peuvent être utilisés pour des tâches compliquées par rapport aux tâches supervisées car ces algorithmes fonctionnent sur un ensemble de données non étiqueté.
  • Les algorithmes non supervisés sont préférables pour diverses tâches, car il est plus facile d’obtenir l’ensemble de données non étiqueté que l’ensemble de données étiqueté.

Désavantages:

  • Le résultat d’un algorithme non supervisé peut être moins précis car l’ensemble de données n’est pas étiqueté et les algorithmes ne sont pas entraînés avec le résultat exact au préalable.
  • Travailler avec l'apprentissage non supervisé est plus difficile car il fonctionne avec un ensemble de données non étiqueté qui ne correspond pas à la sortie.

Applications de l'apprentissage non supervisé

    Analyse de réseau:L'apprentissage non supervisé est utilisé pour identifier le plagiat et le droit d'auteur dans l'analyse du réseau de documents de données textuelles pour des articles scientifiques.Systèmes de recommandation :Les systèmes de recommandation utilisent largement des techniques d'apprentissage non supervisées pour créer des applications de recommandation pour différentes applications Web et sites Web de commerce électronique.Détection d'une anomalie:La détection d'anomalies est une application populaire d'apprentissage non supervisé, qui peut identifier des points de données inhabituels dans l'ensemble de données. Il est utilisé pour découvrir des transactions frauduleuses.Décomposition en valeurs singulières :La décomposition en valeurs singulières ou SVD est utilisée pour extraire des informations particulières de la base de données. Par exemple, extraire des informations sur chaque utilisateur situé à un emplacement particulier.

3. Apprentissage semi-supervisé

L'apprentissage semi-supervisé est un type d'algorithme d'apprentissage automatique qui se situe entre l'apprentissage automatique supervisé et non supervisé. . Il représente le terrain intermédiaire entre les algorithmes d'apprentissage supervisé (avec données de formation étiquetées) et non supervisé (sans données de formation étiquetées) et utilise la combinaison d'ensembles de données étiquetés et non étiquetés pendant la période de formation.

UN Bien que l'apprentissage semi-supervisé soit un intermédiaire entre l'apprentissage supervisé et non supervisé et qu'il fonctionne sur des données constituées de quelques étiquettes, il se compose principalement de données non étiquetées. Comme les étiquettes sont coûteuses, mais à des fins professionnelles, elles peuvent comporter peu d'étiquettes. C’est complètement différent de l’apprentissage supervisé et non supervisé car ils sont basés sur la présence et l’absence d’étiquettes.

Pour surmonter les inconvénients des algorithmes d’apprentissage supervisé et non supervisé, le concept d’apprentissage semi-supervisé est introduit. . L’objectif principal de l’apprentissage semi-supervisé est d’utiliser efficacement toutes les données disponibles, plutôt que seulement les données étiquetées comme dans l’apprentissage supervisé. Initialement, des données similaires sont regroupées avec un algorithme d'apprentissage non supervisé, et en outre, cela permet d'étiqueter les données non étiquetées en données étiquetées. En effet, les données étiquetées sont une acquisition comparativement plus coûteuse que les données non étiquetées.

Nous pouvons imaginer ces algorithmes avec un exemple. L'apprentissage supervisé consiste à ce qu'un étudiant soit sous la supervision d'un instructeur à la maison et au collège. De plus, si cet étudiant analyse lui-même le même concept sans aucune aide de l’instructeur, il s’agit d’un apprentissage non supervisé. En apprentissage semi-supervisé, l'étudiant doit se réviser après avoir analysé le même concept sous la direction d'un instructeur du collège.

qu'est-ce que c'est

Avantages et inconvénients de l'apprentissage semi-supervisé

Avantages :

  • Il est simple et facile de comprendre l'algorithme.
  • C’est très efficace.
  • Il est utilisé pour résoudre les inconvénients des algorithmes d’apprentissage supervisé et non supervisé.

Désavantages:

  • Les résultats des itérations peuvent ne pas être stables.
  • Nous ne pouvons pas appliquer ces algorithmes aux données au niveau du réseau.
  • La précision est faible.

4. Apprentissage par renforcement

L'apprentissage par renforcement fonctionne sur un processus basé sur la rétroaction, dans lequel un agent d'IA (un composant logiciel) explore automatiquement son environnement en frappant et en suivant, en agissant, en apprenant de ses expériences et en améliorant ses performances. L'agent est récompensé pour chaque bonne action et puni pour chaque mauvaise action ; par conséquent, l’objectif de l’agent d’apprentissage par renforcement est de maximiser les récompenses.

Dans l’apprentissage par renforcement, il n’y a pas de données étiquetées comme l’apprentissage supervisé, et les agents apprennent uniquement de leurs expériences.

Le processus d’apprentissage par renforcement est similaire à celui d’un être humain ; par exemple, un enfant apprend diverses choses grâce aux expériences de sa vie quotidienne. Un exemple d'apprentissage par renforcement consiste à jouer à un jeu dans lequel le jeu est l'environnement, les mouvements d'un agent à chaque étape définissent des états et le but de l'agent est d'obtenir un score élevé. L'agent reçoit des commentaires en termes de punition et de récompenses.

De par sa manière de fonctionner, l’apprentissage par renforcement est utilisé dans différents domaines tels que Théorie des jeux, Recherche opérationnelle, Théorie de l'information, Systèmes multi-agents.

Un problème d’apprentissage par renforcement peut être formalisé en utilisant Processus de décision de Markov (MDP). Dans MDP, l'agent interagit constamment avec l'environnement et effectue des actions ; à chaque action, l'environnement répond et génère un nouvel état.

Catégories d’apprentissage par renforcement

L'apprentissage par renforcement est principalement classé en deux types de méthodes/algorithmes :

tableau d'octets en chaîne
    Apprentissage par renforcement positif :L'apprentissage par renforcement positif consiste à augmenter la tendance à ce que le comportement requis se reproduise en ajoutant quelque chose. Cela renforce la force du comportement de l’agent et l’impacte positivement.Apprentissage par renforcement négatif :L’apprentissage par renforcement négatif fonctionne exactement à l’opposé du RL positif. Cela augmente la tendance à ce que le comportement spécifique se reproduise en évitant la condition négative.

Cas d'utilisation réels de l'apprentissage par renforcement

    Jeux vidéo:
    Les algorithmes RL sont très populaires dans les applications de jeux. Il est utilisé pour acquérir des performances surhumaines. Certains jeux populaires qui utilisent les algorithmes RL sont AlphaGO et AlphaGO Zéro .La gestion des ressources:
    L'article « Gestion des ressources avec apprentissage par renforcement profond » a montré comment utiliser RL dans un ordinateur pour apprendre et planifier automatiquement les ressources afin qu'elles attendent différentes tâches afin de minimiser le ralentissement moyen des tâches.Robotique :
    RL est largement utilisé dans les applications robotiques. Les robots sont utilisés dans le domaine industriel et manufacturier, et ces robots sont rendus plus puissants grâce à l'apprentissage par renforcement. Il existe différentes industries qui ont pour vision de construire des robots intelligents en utilisant l’IA et la technologie d’apprentissage automatique.Exploration de texte
    Le text-mining, l'une des grandes applications de la PNL, est désormais mis en œuvre avec l'aide du Reinforcement Learning de la société Salesforce.

Avantages et inconvénients de l'apprentissage par renforcement

Avantages

  • Cela aide à résoudre des problèmes complexes du monde réel difficiles à résoudre par des techniques générales.
  • Le modèle d’apprentissage de RL est similaire à l’apprentissage des êtres humains ; c'est pourquoi les résultats les plus précis peuvent être trouvés.
  • Aide à obtenir des résultats à long terme.

Désavantage

  • Les algorithmes RL ne sont pas préférés pour les problèmes simples.
  • Les algorithmes RL nécessitent d’énormes données et calculs.
  • Trop d’apprentissage par renforcement peut conduire à une surcharge d’états qui peut affaiblir les résultats.

La malédiction de la dimensionnalité limite l'apprentissage par renforcement pour les systèmes physiques réels.