logo

Caractères génériques en Python

Un caractère générique est un symbole qui peut être utilisé à la place ou en plus d'un ou plusieurs caractères. Dans les programmes informatiques, les langages, les moteurs de recherche, y compris les systèmes d'exploitation, les caractères génériques sont utilisés pour condenser les critères de recherche. Le point d'interrogation (?) et l'astérisque () sont les caractères génériques les plus populaires.

Types de caractères génériques

L'astérisque (∗)

L'astérisque (*) ou le caractère peuvent être utilisés pour spécifier n'importe quel nombre de caractères. L'astérisque * est généralement utilisé à la fin de la racine du mot et lorsqu'il est nécessaire de rechercher des mots racines ayant diverses terminaisons possibles.

Par exemple, si nous utilisons le mot « jeu » comme exemple, les expressions « joueur » et « jeux » apparaîtront dans tous les résultats de recherche. En fonction des paramètres de recherche et d'autres mots, il peut y avoir des mots supplémentaires en plus de ces deux-là.

Le point d'interrogation (?)

Le point d'interrogation ou le personnage ? en désigne un. N'importe quelle lettre du mot racine peut être utilisée avec celui-ci. Lorsqu'un mot contient plusieurs autres orthographes, l'utilisation de l'opérateur point d'interrogation accélère le processus.

Au lieu du caractère générique de point d'interrogation, le point ou. Le caractère est utilisé pour la représentation d’un seul caractère.

Prenez le mot « honneur », par exemple. Cela indiquerait le résultat comme honneur tout en omettant l'honneur dans ce contexte.

Recherche par caractère générique en Python

Pour utiliser la recherche par caractère générique en Python, la bibliothèque re doit être incluse dans le programme. Une bibliothèque utilisée pour travailler avec des expressions régulières en Python est appelée la bibliothèque re, qui est un acronyme pour le terme expression régulière.

Pour effectuer la recherche, nous compilerons une liste de mots, puis nous utiliserons les fonctions de la bibliothèque re. À l’aide de caractères génériques, nous localiserons une correspondance avec un mot correct.

Le code Python qui suit effectue une recherche par caractère générique.

 import re str = re.compile('hel.o') a = ['hello', 'welcome', 'to', 'java', 'point'] match_is = [string for string in a if re.match_is(str, string)] print(match_is) 

Sortir:

 ['hello'] 

Implémentations :

En utilisant le module regex (expressions régulières), nous pouvons implémenter des caractères génériques en Python.

Le point. Le point d'interrogation a été remplacé par un caractère ?.

 import re # To change the outcomes, add or remove terms from this list. words = ['color', 'colour', 'work', 'working', 'apple', 'master', 'driving'] for word in words: # Instead of the? symbol, use the . symbol if re.search('col.r', word) : print (word) 

Sortir:

 color 

Tout comme le symbole astérisque (*) est utilisé, les caractères.+ sont utilisés pour correspondre à un ou plusieurs caractères. Ainsi, en Python, notre code regex pourrait ressembler à ceci pour rechercher tous les mots commençant par la racine « work » :

 import re # To change the outcomes, add or remove terms from this list. words = ['car', 'apple', 'work', 'working', 'goat', 'worker'] for word in words: # Instead of using the * symbol, use the.+ symbol. if re.search('work.+', word) : print (word) 

Sortir:

 working worker