Wortgrenzen |
Top Previous Next |
Bedienung > Hauptmenü > Menü: Einstellungen > Projekteinstellungen > Parser/Scanner > Wortgrenzen
Diese Option wirkt sich auf die Erkennung literaler Token aus, nicht jedoch auf reguläre Ausdrücke. Bei aktivierter Wortgrenzen-Option gilt ein Token nur dann als erkannt, wenn es mit einer Wortgrenze beginnt und endet. An einer Wortgrenze in TETRA ist zumeist ein Zeichen beteiligt, das nicht alphanumerische ist und kein Unterstrich ist, also nicht zur Zeichenklasse \w gehört. Genau ist die Grenze durch drei Fälle definiert
das an das Token angrenzende Zeichen gehört nicht zu \w oder das außenstehende Zeichen des Tokens gehört nicht zu \w oder das Token bildet den Beginn bzw. das Ende des Eingabetextes
Beispiel:
in dem Text:
"sindbad der seefahrer"
hätten folgende Ausdrücke jeweils zei Wortgrenzen: "sindbad", "der" und "seefahrer". Jeweils nur ein Wortgrenze hätten z.B.: "sind", "bad", see" und "fahrer".
An dem Beispiel erkennt man, dass es bei deaktivierten Wortgrenzen möglich ist, auch die interne Struktur einzelner literaler Worte zu analysieren.
Im Normalfall wird empfohlen die Option zu aktivieren, da es sonst zu falschen Erkennungen kommen kann. Ist bei deaktivierter Wortgrenze beispielsweise ein Token "end" definiert, so erkennt es fälschlich bereits den Anfang des Variablennamens in der folgenden Zeile
endVar := 10; end
|
Diese Seite gehört zur TextTransformer Dokumentation |
Home Inhalt English |