Reguläre Ausdrücke

Top  Previous  Next

Einführung > Reguläre Ausdrücke

 

Es wurde bereits erwähnt, dass die Textbestandteile in die TETRA den Text zerlegt Token oder Terminalsymbole genannt werden. Diese werden anhand von regulären Ausdrücken identifiziert. Reguläre Ausdrücke sind bekannt aus vielen Skriptsprachen und Textverarbeitungen. Sie erweitern die Möglichkeiten zur Wortsuche und Ersetzung, indem sie es erlauben nicht nur einzelne bestimmte (Teil-)wörter zu suchen, sondern Gruppen von Worten, die ein gemeinsames Muster haben.

 

Reguläre Ausdrücke definieren anhand weniger einfacher Regeln Zeichenmuster, d.h. sie beschreiben auf welche Weise Buchstaben oder andere Zeichen aufeinander folgen.

Typische Textstücke (Token), die durch reguläre Ausdrücke identifiziert werden können sind Worte, Zahlen, Uhrzeiten und Datumsangaben, Anführungen, Sätze oder Formatierungszeichen.

 



Diese Seite gehört zur TextTransformer Dokumentation

Home  Inhalt  English