Bezeichner

Top  Previous  Next

Skripte > Tokendefinitionen > Vordefinierte Token > Bezeichner

 

Die folgenden vordefinierten Token können über ein Popup-Menü in ein Projekt eingefügt werden.

 

ID:        [a-zA-Z_]\w*

 

Bezeichner, der mit einem Zeichen des Alphabets oder dem Unterstrich beginnt, dem in beliebiger Anzahl alphanumerische Zeichen oder Unterstriche (= \w)  folgen können.  Wichtig ist, dass ein Bezeichner nicht mit einer Ziffer beginnen darf, da er dann auch Zahlen abdecken würde, für die sich meist ein gesondertes Token empfiehlt.

 

 

URI_WS_DELIM

URI_QUOTE_DELIM

URI_ANGLE_DELIM

 

Diese regulären Ausdrücke stehen für einheitliche Bezeichner für Ressourcen, wie z.B. die Adressen von Webseiten, die gemäß der Norm RFC 3986

 

http://www.apps.ietf.org/rfc/rfc3986.html

 

definiert sind .Auf Englisch heißen diese Bezeichner "Uniform Resource Identifier" (URI).

Die drei Ausdrücke sind Varianten eines auf der genannten Seite gegebenen Ausdrucks. Im Unterschied zu letzterem erkennen diese Ausdrücke keinen leeren Text. Eine URI muss mit dem dort beschriebenen "scheme"-Ausdruck beginnen, d.h. mit Zeichen, auf die ein Doppelpunkt folgt. Außerdem muss eine URI vom umgebenen Text unterschieden werden können. In der Art dieser Abtrennung unterscheiden sich die hier gegebenen drei Ausdrücke.

 

 

URI_WS_DELIM : (([^:/?#]+):)(//([^/?#\\s]*))?([^?#\\s]*)(\\?([^#\\s]*))?(#([\\s]*))?

 

Diese URI wird durch Leerzeichen vom umgebenen Text unterschieden. D.h. die URI selbst darf keine Leerzeichen enthalten. URI_WS_DELIM erkennt so z.B. den folgenden Text:

 

http://www.ics.uci.edu/pub/ietf/uri/#Related

 

 

URI_QUOTE_DELIM : "(([^:/?#]+):)(//([^/?#"]*))?([^?#"]*)(\\?([^#"]*))?(#([^"]*))?"

 

Diese URI wird durch Anführungszeichen vom umgebenen Text unterschieden. D.h. die URI selbst könnte so geschrieben werden, dass sie Leerzeichen enthielte. URI_QUOTE_DELIM erkennt so z.B. den folgenden Text:

 

"http://www.ics.uci.edu/pub/ietf/uri/#Related"

 

 

URI_ANGLE_DELIM : <(([^:/?#]+):)(//([^/?#>]*))?([^?#>]*)(\\?([^#>]*))?(#([^>]*))?>

 

Diese URI wird duch Leerzeichen vom umgebenen Text unterschieden. D.h. die URI selbst könnte so geschrieben werden, dass sie Leerzeichen enthielte. URI_ANGLE_DELIM erkennt so z.B. den folgenden Text:

 

<http://www.ics.uci.edu/pub/ietf/uri/#Related>

 

 

Anmerkung:

 

Durch die Unterausdrücke werden im obigen Beispiel die folgenden Abschnitte erkannt:

 

     $1 = http:

     $2 = http

     $3 = //www.ics.uci.edu

     $4 = www.ics.uci.edu

     $5 = /pub/ietf/uri/

     $6 = <undefined>

     $7 = <undefined>

     $8 = #Related

     $9 = Related

 

wobei <undefined> anzeigt, dass diese Komponente nicht enthalten ist. Die in RFC 3986 beschriebenen Komponenten sinn dann wie folgt zuzuordnen:

 

     scheme    = $2

     authority = $4

     path      = $5

     query     = $7

     fragment  = $9



Diese Seite gehört zur TextTransformer Dokumentation

Home  Inhalt  English