Guide regex
Tutoriel Regex pour Débutants
Les regex peuvent sembler intimidantes, mais la majorité des patterns utiles reposent sur quelques notions : texte exact, classes, répétitions, groupes et ancres.
Comment apprendre les regex étape par étape
La façon la plus simple d’apprendre les regex consiste à commencer par du texte exact, puis à ajouter progressivement les classes de caractères, les quantificateurs, les groupes et les ancres.
Tester chaque motif sur un vrai texte permet de comprendre non seulement ce qui correspond, mais aussi pourquoi cela correspond.
Commencer par du texte exact
Une correspondance littérale est la regex la plus simple : le motif recherche exactement les caractères saisis.
Par exemple, la regex cat trouve le texte cat, mais ne trouvera pas dog sans ajouter une alternative.
Utiliser les classes de caractères
Les classes de caractères permettent de faire correspondre un caractère appartenant à un ensemble donné, comme un chiffre, une lettre ou une plage personnalisée.
Elles sont utiles lorsque le caractère exact n’est pas connu à l’avance, mais que son type est défini.
Ajouter des quantificateurs
Les quantificateurs indiquent combien de fois un élément peut apparaître.
Les symboles *, +, ?, {3} et {1,10} permettent de rendre un élément optionnel, répété ou limité en longueur.
Organiser une regex avec des groupes
Les groupes permettent de combiner plusieurs éléments et d’appliquer des quantificateurs ou des alternatives à l’ensemble.
Ils peuvent aussi capturer des parties du texte, par exemple une date, un nom d’utilisateur ou un nom de domaine.
Tester souvent ses regex
Une regex devient vite difficile à lire lorsque plusieurs concepts sont combinés.
Tester régulièrement chaque modification permet de repérer les erreurs plus tôt et de comprendre l’effet de chaque symbole.
Erreurs fréquentes des débutants
Les débutants oublient souvent les ancres, utilisent des quantificateurs trop larges ou écrivent des motifs trop permissifs.
Une bonne regex doit être assez précise pour rejeter les valeurs invalides, sans bloquer inutilement des données valides.
Commencer par du texte exact
La regex la plus simple est simplement le texte que vous voulez trouver.
Par exemple, chat matche les lettres c, h, a et t dans cet ordre.
chat
Utiliser des classes de caractères
Une classe de caractères permet d’accepter un caractère parmi un ensemble.
[0-9] matche un chiffre. [A-Za-z] matche une lettre ASCII.
[A-Za-z]+
Ajouter des répétitions
Les quantificateurs indiquent combien de fois un élément peut apparaître.
\d+ signifie un ou plusieurs chiffres. \d{4} signifie exactement quatre chiffres.
\d{4}-\d{2}-\d{2}
Tester souvent
La façon la plus sûre de construire une regex est de la tester étape par étape avec des exemples positifs et négatifs.
C’est exactement le rôle du constructeur visuel.