Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Mariage pour tal monde
25 novembre 2014

Séance 7 Expression régulière et iconv

Durant la séance 7, nous avons reçu une présentation introductive des expressions régulières et des symboles qui les composent, de leur utilité dans le codage d'un script tel que le nôtre. Les expressions régulières aussi appelées expressions rationnelles, sont des chaînes de caractères qui permettent de représenter un ensemble (potentiellement infini si on le souhaite) de séquences de caractères définis. Ces caractères peuvent aussi se traduire textuellement par des éléments de mise en page (sauts de ligne, retours à la ligne). Les expressions régulières nécessitent l'utilisation d'une syntaxe précise, qui se retrouvent dans une foule de langages et d'outils: la maîtrise de cette syntaxe permet une manipulation de textes dans la majeure partie des langages de programmation.

Voilà des conventions "universelles" pour les expressions régulières:

  • ^ représente le début (d'une ligne, d'une chaîne de caractères)
  • $ représente la fin (d'une ligne, d'une chaîne de caractères)
  • . représente n'importe quel caractèren autant de fois qu'il y a de points. Ex: v.lle représente l'ensemble {"valle", "vblle", "vclle", "volle", ...}.
  • * représente 0 ou plus occurrences d'un élément. Ex: be*lle peut représenter "blle ", ou "belle", ou encore "beelle", ou "beeelle", ainsi de suite.
  • + représente 1 ou plus occurrences d'un élément. Ex: be+lle peut représenter "belle", "beelle", "beeelle", etc
  • ? exprime l'optionalité de la présence du caractère qui le précède. Ex: l'expression villes? représente l'ensemble {"ville", "villes"}.
  • | représente un choix possible parmi les caractères qui se trouvent de part et d'autre de ce symbole. Ex: (le|la) ville représente l'ensemble {"la ville", "le ville"}.
  • ( ) permet d'alléger une expression régulière en la factorisant (voir exemple ci-dessus).  Le groupage est aussi utile pour faire des substitutions.

Cette dizaine de symboles et de constructions constituent un noyau commun à presque tous les modules d'expressions régulières.

Quelques expressions régulières ont été testées dans le testeur de regex. En voici une capture d'écran:

tester expression reguliere

Les expressions régulières se maîtrisent à force d'exercices et d'entraînements. Son utilisation permet de rédiger des lignes de commandes concises et explicites, ce qui permet de conserver un programme élégamment rédigé et confortable à lire.

Un peu de screenshot dans notre tableaux, le premier, c'est celui en portugais:

1

Le tableau en chinois, j'ai eu de la chance, il n'y a pas beaucoup de codages délicats:

2

Il est intéressant de constater que dans le tableau français, on a des urls qui interdisent de detecter leurs codages et bien sur y compris ceux du gouvernement.

3

 

 

Publicité
Commentaires
T
long
Mariage pour tal monde
Publicité
Archives
Publicité