Expression régulière

Définition - Que signifie l'expression régulière?

Une expression régulière est une méthode utilisée en programmation pour la correspondance de modèles. Les expressions régulières fournissent un moyen flexible et concis de faire correspondre des chaînes de texte. Par exemple, une expression régulière pourrait être utilisée pour rechercher dans de grands volumes de texte et changer toutes les occurrences de «chat» en «chien».

Les expressions régulières sont utilisées pour les systèmes de coloration syntaxique, la validation des données et dans les moteurs de recherche tels que Google, pour essayer de déterminer une correspondance algorithmique avec la requête qu'un utilisateur demande.

Les expressions régulières sont également connues sous forme abrégée sous le nom de regex ou regexp.

Definir Tech explique l'expression régulière

Les utilitaires, les éditeurs de texte et les langages de programmation utilisent des expressions régulières pour manipuler et rechercher des modèles de texte. Alors que certains langages intègrent des expressions régulières au cœur de la syntaxe du langage, comme TCL, Awk, PERL et RUBY, d'autres utilisent des expressions régulières via des bibliothèques, telles que Java, C ++ et C. Cela signifie qu'il existe des différences d'implémentation donc une expression régulière qui fonctionne bien avec une application peut ou non fonctionner avec une autre. Des différences subtiles existent.

Les expressions régulières peuvent être incroyablement puissantes. Essentiellement, si le modèle peut être défini, une expression régulière peut être créée. Un modèle simple peut être quelque chose d'aussi simple que de trouver toutes les situations où une phrase se termine par «cela» et est remplacée par «qui». Le motif pourrait devenir plus complexe en effectuant le même remplacement, mais uniquement à la 3e et 5e occurrence d'une correspondance. Ou cela pourrait devenir encore plus compliqué en utilisant différents ensembles de caractères correspondants en fonction de la fréquence et de l'emplacement des caractères correspondants précédents.

Les trois principaux composants d'une expression régulière sont des ancres qui sont utilisées pour spécifier la position d'un motif par rapport à une ligne de texte, des jeux de caractères qui correspondent à un ou plusieurs caractères à une seule position et des modificateurs qui spécifient le nombre le jeu de caractères précédent est répété.

Les opérations qui aident à créer des expressions régulières sont:

  • Quantification: les quantificateurs déterminent la fréquence à laquelle l'élément précédent peut se produire.
  • Regroupement: les opérateurs peuvent avoir leur portée et leur priorité spécifiées à l'aide de parenthèses.
  • Conditions booléennes: Une condition OR ou AND peut être définie pour les opérateurs et les groupes.

Les expressions régulières utilisent des algorithmes tels que l'automatisation finie déterministe (DFA) et l'automatisation finie non déterministe (NFA) pour faire correspondre une chaîne. Dans un NFA, pour chaque paire d'état et de symbole d'entrée, il existe plusieurs états suivants possibles, tandis qu'un DFA accepte une chaîne finie de symboles.