vordefinierte Zeichenmengen

Top  Previous  Next

Skripte > Tokendefinitionen > Reguläre Ausdrücke > vordefinierte Zeichenmengen

 

Es gibt einige vordefinierte Zeichenklassen. Sie können innerhalb einer Zeichenmengendefinition verwendet werden, indem ihr Name in  speziellen Klammern gesetzt wird: "[:Zeichenklassenname:]". Die Menge der Ziffern z.B. heißt "dgit" und eine Zeichenmenge: [[:digit:],] besteht aus allen Ziffern und dem Kommazeichen.

 

Folgende Zeichenklassen sind definiert:

 

alnum

die alphanumerischen Zeichen, alpha und digit (*)

alpha

die Zeichen des Alphabets a-z und A-Z, Umlaute etc. (*)

blank

das Leerzeichen, das geschützte Leerzeichen (dezimal 160) und der Tabulator

cntrl

die Steuerzeichen

digit

die Ziffern 0-9

graph

alle grafischen Zeichen, alle anderen außer cntrl

lower

die Kleinbuchstaben des Alphabets a-z (*)

print

alle druckbaren Zeichen; graph und blank

punct

die Interpunktionszeichen

space

die Leerzeichen (Leerzeichen, Tabulator, Wagenrücklauf, Zeilenvorschub, vertikaler Tabulator oder ein Seitenvorschub)

upper

die Großbuchstaben des Alphabets A-Z (*)

xdigit

die Hexadezimalzeichen, 0-9, a-f und A-F

word

die alphanumerischen Zeichen und der Unterstrich (*)

      

 

(*) entsprechend den lokalen Einstellungen auf Ihrem Computer können noch weitere Zeichen erkannt werden. Probieren Sie es mit dem Dialog zur Berechnung von Zeichenmengen aus!

 

Für einige dieser Zeichenklassen und ihre Komplementklassen gibt es wiederum eine abgekürzte Schreibweise

 

 

\w

[:word:]

\W

^[:word:]

\s

[:space:]

\S

^[:space:]

\d

[:digit:]

\D

^[:digit:]

\l

[:lower:]

\L

^[:lower:]

\u

[:upper:]

\U

^[:upper:]

                       



Diese Seite gehört zur TextTransformer Dokumentation

Home  Inhalt  English