logo

Modèles d'apprentissage automatique

Un modèle d'apprentissage automatique est défini comme une représentation mathématique du résultat du processus de formation. L'apprentissage automatique est l'étude de différents algorithmes qui peuvent s'améliorer automatiquement grâce à l'expérience et aux anciennes données et construire le modèle. Un modèle d'apprentissage automatique est similaire à un logiciel informatique conçu pour reconnaître des modèles ou des comportements basés sur une expérience ou des données antérieures. L'algorithme d'apprentissage découvre des modèles dans les données d'entraînement et génère un modèle ML qui capture ces modèles et fait des prédictions sur de nouvelles données.

Modèles d'apprentissage automatique

Comprenons un exemple du modèle ML dans lequel nous créons une application pour reconnaître les émotions de l'utilisateur en fonction des expressions faciales. Ainsi, la création d'une telle application est possible grâce à des modèles d'apprentissage automatique dans lesquels nous formerons un modèle en alimentant des images de visages avec diverses émotions étiquetées dessus. Chaque fois que cette application est utilisée pour déterminer l'humeur de l'utilisateur, elle lit toutes les données fournies, puis détermine l'humeur de tout utilisateur.

Ainsi, en termes simples, nous pouvons dire qu'un Le modèle d'apprentissage automatique est une représentation simplifiée de quelque chose ou d'un processus. Dans ce sujet, nous discuterons de différents modèles d'apprentissage automatique ainsi que de leurs techniques et algorithmes. .

Qu’est-ce que le modèle d’apprentissage automatique ?

Les modèles d'apprentissage automatique peuvent être compris comme un programme qui a été formé pour trouver des modèles dans de nouvelles données et faire des prédictions. Ces modèles sont représentés comme une fonction mathématique qui prend des requêtes sous la forme de données d'entrée, fait des prédictions sur les données d'entrée, puis fournit une sortie en réponse. Tout d’abord, ces modèles sont entraînés sur un ensemble de données, puis ils reçoivent un algorithme pour raisonner sur les données, extraire le modèle des données du flux et apprendre de ces données. Une fois ces modèles formés, ils peuvent être utilisés pour prédire l’ensemble de données invisibles.

Il existe différents types de modèles d'apprentissage automatique disponibles en fonction de différents objectifs commerciaux et ensembles de données.

Classification des modèles d'apprentissage automatique :

Basés sur différents objectifs commerciaux et ensembles de données, il existe trois modèles d'apprentissage pour les algorithmes. Chaque algorithme de machine learning s'installe dans l'un des trois modèles :

  • Enseignement supervisé
  • Apprentissage non supervisé
  • Apprentissage par renforcement
Modèles d'apprentissage automatique

L’apprentissage supervisé est divisé en deux catégories :

  • Classification
  • Régression

L'apprentissage non supervisé est également divisé dans les catégories ci-dessous :

  • Regroupement
  • Règle d'association
  • Réduction de dimensionnalité

1. Modèles d'apprentissage automatique supervisés

L'apprentissage supervisé est le modèle d'apprentissage automatique le plus simple pour comprendre dans lequel les données d'entrée sont appelées données d'entraînement et ont une étiquette ou un résultat connu comme sortie. Cela fonctionne donc sur le principe des paires entrée-sortie. Cela nécessite la création d'une fonction qui peut être entraînée à l'aide d'un ensemble de données d'entraînement, puis elle est appliquée à des données inconnues et réalise des performances prédictives. L'apprentissage supervisé est basé sur des tâches et testé sur des ensembles de données étiquetés.

Nous pouvons mettre en œuvre un modèle d’apprentissage supervisé sur des problèmes simples de la vie réelle. Par exemple, nous avons un ensemble de données composé de l’âge et de la taille ; nous pouvons ensuite construire un modèle d'apprentissage supervisé pour prédire la taille de la personne en fonction de son âge.

Les modèles d’apprentissage supervisé sont en outre classés en deux catégories :

Régression

Dans les problèmes de régression, le résultat est une variable continue. Certains modèles de régression couramment utilisés sont les suivants :

a) Régression linéaire

La régression linéaire est le modèle d'apprentissage automatique le plus simple dans lequel nous essayons de prédire une variable de sortie à l'aide d'une ou plusieurs variables d'entrée. La représentation de la régression linéaire est une équation linéaire qui combine un ensemble de valeurs d'entrée (x) et une sortie prédite (y) pour l'ensemble de ces valeurs d'entrée. Il est représenté sous la forme d'un trait :

Y = bx + c.

Modèles d'apprentissage automatique

L'objectif principal du modèle de régression linéaire est de trouver la ligne la mieux ajustée qui correspond le mieux aux points de données.

La régression linéaire est étendue à la régression linéaire multiple (trouver le plan le mieux ajusté) et à la régression polynomiale (trouver la courbe la mieux ajustée).

b) Arbre de décision

convertir une chaîne en json en java

Les arbres de décision sont des modèles d'apprentissage automatique populaires qui peuvent être utilisés à la fois pour les problèmes de régression et de classification.

Un arbre de décision utilise une structure arborescente de décisions ainsi que leurs conséquences et résultats possibles. En cela, chaque nœud interne est utilisé pour représenter un test sur un attribut ; chaque branche est utilisée pour représenter le résultat du test. Plus un arbre de décision comporte de nœuds, plus le résultat sera précis.

L’avantage des arbres de décision est qu’ils sont intuitifs et faciles à mettre en œuvre, mais ils manquent de précision.

Les arbres de décision sont largement utilisés dans recherche opérationnelle, en particulier en analyse décisionnelle, planification stratégique , et principalement en apprentissage automatique.

c) Forêt aléatoire

Random Forest est la méthode d’apprentissage d’ensemble, qui consiste en un grand nombre d’arbres de décision. Chaque arbre de décision dans une forêt aléatoire prédit un résultat, et la prédiction avec la majorité des voix est considérée comme le résultat.

Un modèle de forêt aléatoire peut être utilisé à la fois pour les problèmes de régression et de classification.

Pour la tâche de classification, le résultat de la forêt aléatoire est tiré de la majorité des voix. Alors que dans la tâche de régression, le résultat est tiré de la moyenne des prédictions générées par chaque arbre.

d) Réseaux de neurones

Les réseaux de neurones constituent un sous-ensemble de l’apprentissage automatique et sont également appelés réseaux de neurones artificiels. Les réseaux de neurones sont constitués de neurones artificiels et conçus d’une manière qui ressemble à la structure et au fonctionnement du cerveau humain. Chaque neurone artificiel se connecte à de nombreux autres neurones dans un réseau neuronal, et ces millions de neurones connectés créent une structure cognitive sophistiquée.

Modèles d'apprentissage automatique

Les réseaux de neurones sont constitués d'une structure multicouche contenant une couche d'entrée, une ou plusieurs couches cachées et une couche de sortie. Comme chaque neurone est connecté à un autre neurone, il transfère les données d’une couche à l’autre neurone des couches suivantes. Enfin, les données atteignent la dernière couche ou couche de sortie du réseau neuronal et génèrent une sortie.

Les réseaux de neurones dépendent des données d'entraînement pour apprendre et améliorer leur précision. Cependant, un réseau neuronal parfaitement entraîné et précis peut regrouper rapidement les données et devenir un puissant outil d’apprentissage automatique et d’IA. L'un des réseaux de neurones les plus connus est L'algorithme de recherche de Google.

Classification

Les modèles de classification constituent le deuxième type de techniques d'apprentissage supervisé, qui sont utilisées pour générer des conclusions à partir des valeurs observées sous forme catégorielle. Par exemple, le modèle de classification peut identifier si l'e-mail est du spam ou non ; un acheteur achètera le produit ou non, etc. Des algorithmes de classification sont utilisés pour prédire deux classes et classer la production en différents groupes.

Lors de la classification, un modèle de classificateur est conçu pour classer l'ensemble de données en différentes catégories, et chaque catégorie se voit attribuer une étiquette.

Il existe deux types de classifications en apprentissage automatique :

    Classement binaire: Si le problème n'a que deux classes possibles, on parle de classificateur binaire. Par exemple, chat ou chien, Oui ou Non,Classification multiclasse: Si le problème a plus de deux classes possibles, il s'agit d'un classificateur multi-classes.

Certains algorithmes de classification populaires sont les suivants :

a) Régression logistique

La régression logistique est utilisée pour résoudre les problèmes de classification dans l'apprentissage automatique. Elles sont similaires à la régression linéaire mais sont utilisées pour prédire les variables catégorielles. Il peut prédire la sortie en Oui ou Non, 0 ou 1, Vrai ou Faux, etc. Cependant, plutôt que de donner les valeurs exactes, il fournit les valeurs probabilistes entre 0 et 1.

b) Machine à vecteurs de support

La machine à vecteurs de support ou SVM est l'algorithme d'apprentissage automatique populaire, largement utilisé pour les tâches de classification et de régression. Mais plus particulièrement, il est utilisé pour résoudre des problèmes de classification. L'objectif principal de SVM est de trouver les meilleures limites de décision dans un espace à N dimensions, qui peuvent séparer les points de données en classes, et la meilleure limite de décision est connue sous le nom d'hyperplan. SVM sélectionne le vecteur extrême pour trouver l'hyperplan, et ces vecteurs sont appelés vecteurs de support.

Modèles d'apprentissage automatique

c) Bayes naïfs

Naïve Bayes est un autre algorithme de classification populaire utilisé dans l'apprentissage automatique. Il est appelé ainsi car il est basé sur le théorème de Bayes et suit l'hypothèse naïve (indépendante) entre les caractéristiques qui est donnée comme suit :

Modèles d'apprentissage automatique

Chaque classificateur Bayes naïf suppose que la valeur d'une variable spécifique est indépendante de toute autre variable/caractéristique. Par exemple, si un fruit doit être classé en fonction de sa couleur, de sa forme et de son goût. Ainsi, jaune, ovale et sucrée sera reconnue comme mangue. Ici, chaque fonctionnalité est indépendante des autres fonctionnalités.

2. Modèles d'apprentissage automatique non supervisés

Les modèles d'apprentissage automatique non supervisés mettent en œuvre le processus d'apprentissage opposé à l'apprentissage supervisé, ce qui signifie qu'ils permettent au modèle d'apprendre à partir de l'ensemble de données d'entraînement non étiqueté. Sur la base de l'ensemble de données non étiqueté, le modèle prédit le résultat. Grâce à l'apprentissage non supervisé, le modèle apprend lui-même les modèles cachés de l'ensemble de données, sans aucune supervision.

Les modèles d'apprentissage non supervisé sont principalement utilisés pour effectuer trois tâches, qui sont les suivantes :

    Regroupement
    Le clustering est une technique d'apprentissage non supervisée qui consiste à regrouper ou à regrouper les points de données dans différents clusters en fonction des similitudes et des différences. Les objets présentant le plus de similitudes restent dans le même groupe et n’ont pas ou très peu de similitudes avec d’autres groupes.
    Les algorithmes de clustering peuvent être largement utilisés dans différentes tâches telles que Segmentation d'images, Analyse de données statistiques, Segmentation de marché , etc.
    Certains algorithmes de clustering couramment utilisés sont Clustering K-means, clustering hiérarchique, DBSCAN , etc.
    Modèles d'apprentissage automatique Apprentissage des règles d'association
    L'apprentissage des règles d'association est une technique d'apprentissage non supervisée, qui permet de trouver des relations intéressantes entre les variables au sein d'un grand ensemble de données. L'objectif principal de cet algorithme d'apprentissage est de trouver la dépendance d'un élément de données sur un autre élément de données et de cartographier ces variables en conséquence afin qu'il puisse générer un profit maximum. Cet algorithme est principalement appliqué dans Analyse du panier de marché, exploration de l'utilisation du Web, production continue , etc.
    Certains algorithmes populaires d'apprentissage des règles d'association sont Algorithme Apriori, Eclat, algorithme de croissance FP. Réduction de dimensionnalité
    Le nombre de caractéristiques/variables présentes dans un ensemble de données est connu sous le nom de dimensionnalité de l'ensemble de données, et la technique utilisée pour réduire la dimensionnalité est connue sous le nom de technique de réduction de dimensionnalité.
    Bien qu'un plus grand nombre de données fournisse des résultats plus précis, cela peut également affecter les performances du modèle/de l'algorithme, comme des problèmes de surajustement. Dans de tels cas, des techniques de réduction de dimensionnalité sont utilisées.
    ' Il s'agit d'un processus de conversion de l'ensemble de données de dimensions supérieures en un ensemble de données de dimensions inférieures garantissant qu'il fournit des informations similaires. .'
    Différentes méthodes de réduction de dimensionnalité telles comme PCA (analyse en composantes principales), décomposition en valeurs singulières, etc.

Apprentissage par renforcement

Dans l’apprentissage par renforcement, l’algorithme apprend des actions pour un ensemble donné d’états qui mènent à un état objectif. Il s'agit d'un modèle d'apprentissage basé sur la rétroaction qui prend des signaux de rétroaction après chaque état ou action en interagissant avec l'environnement. Ce feedback fonctionne comme une récompense (positive pour chaque bonne action et négative pour chaque mauvaise action), et l'objectif de l'agent est de maximiser les récompenses positives pour améliorer ses performances.

Le comportement du modèle dans l'apprentissage par renforcement est similaire à l'apprentissage humain, car les humains apprennent des choses par des expériences sous forme de rétroaction et interagissent avec l'environnement.

Vous trouverez ci-dessous quelques algorithmes populaires relevant de l’apprentissage par renforcement :

    Q-apprentissage :Q-learning est l’un des algorithmes d’apprentissage par renforcement sans modèle les plus populaires, basé sur l’équation de Bellman.

Il vise à apprendre la politique qui peut aider l'agent IA à prendre la meilleure action pour maximiser la récompense dans des circonstances spécifiques. Il intègre des valeurs Q pour chaque paire état-action qui indiquent la récompense du suivi d'un chemin d'état donné, et tente de maximiser la valeur Q.

    État-Action-Récompense-État-Action (SARSA) :SARSA est un algorithme On-policy basé sur le processus de décision de Markov. Il utilise l'action effectuée par la politique actuelle pour connaître la valeur Q. L'algorithme SARSA est pour State Action Reward State Action, qui symbolise le tuple (s, a, r, s', a'). Réseau Q profond :DQN ou le réseau neuronal Deep Q est Q-learning au sein du réseau neuronal. Il est essentiellement utilisé dans un grand environnement spatial d’états où la définition d’une table Q serait une tâche complexe. Ainsi, dans un tel cas, plutôt que d’utiliser la table Q, le réseau neuronal utilise des valeurs Q pour chaque action en fonction de l’état.

Formation de modèles d’apprentissage automatique

Une fois le modèle d’apprentissage automatique construit, il est entraîné afin d’obtenir les résultats appropriés. Pour entraîner un modèle d’apprentissage automatique, il faut une énorme quantité de données prétraitées. Ici, les données prétraitées signifient des données sous forme structurée avec des valeurs nulles réduites, etc. Si nous ne fournissons pas de données prétraitées, il y a d'énormes chances que notre modèle fonctionne mal.

Comment choisir le meilleur modèle ?

Dans la section ci-dessus, nous avons discuté de différents modèles et algorithmes d’apprentissage automatique. Mais une question des plus déroutantes qui peut se poser à tout débutant est « quel modèle dois-je choisir ? ». La réponse est donc que cela dépend principalement des exigences de l’entreprise ou des exigences du projet. En dehors de cela, cela dépend également des attributs associés, du volume de l'ensemble de données disponible, du nombre d'entités, de la complexité, etc. Cependant, en pratique, il est recommandé de toujours commencer par le modèle le plus simple pouvant être appliqué à un cas particulier. problème, puis augmentez progressivement la complexité et testez la précision à l'aide du réglage des paramètres et de la validation croisée.

Différence entre le modèle d'apprentissage automatique et les algorithmes

L’une des questions les plus déroutantes parmi les débutants est de savoir si les modèles d’apprentissage automatique et les algorithmes sont les mêmes ? Car dans divers cas d’apprentissage automatique et de science des données, ces deux termes sont utilisés de manière interchangeable.

La réponse à cette question est non, et le modèle d’apprentissage automatique n’est pas la même chose qu’un algorithme. De manière simple, un L'algorithme ML est comme une procédure ou une méthode qui s'exécute sur des données pour en découvrir des modèles et générer le modèle. Dans le même temps, un le modèle d'apprentissage automatique est comme un programme informatique qui génère des résultats ou fait des prédictions . Plus précisément, lorsque nous entraînons un algorithme avec des données, il devient un modèle.

 Machine Learning Model = Model Data + Prediction Algorithm