Zeilenumbrüche |
Top Previous Next |
Glossar > Zeilenumbrüche
Zeilenumbrücke werden in Textdateien durch besondere Steuerzeichen dargestellt. In den Windows Betriebssystemen ist dies eine Kombination aus dem Carriage-Return-Zeichen '\r' und dem Linefeed-Zeichen '\n'. Werden z.B. die einzelnen Zeichen des dreizeiligen Texts:
1. Zeile 2. Zeile 3. Zeile
In einer Tabelle aufgelistet, sieht diese folgendermaßen aus:
In Unix-Betriebssystemen ist es üblich statt der '\r\n'-Kombination allein das Linfeed-Zeichen zu verwenden. Der gleiche Text ist dort also etwas kürzer:
Im TextTransformer Editor wird stets die Windows Konvention verwendet. Werden Unix-Texte geladen, so wird automatisch allen Linfeed-Zeichen ein Carriage-Return-Zeichen vorangestellt. Ab Version 0.9.8.1 erfolgt dann ein entsprechender Warnhinweis.
In den meisten Transformations-Projekten werden die Zeilenumbrüche ignoriert. Sind sie aber konstitutiv für die Struktur des zu analysierenden Textes, muss auf den eventuellen Einschub der '\r'-Zeichen geachtet werden. Im Extremfall kann dann die Ausführung eines Projekts verschiedene Ergebnisse haben, je nachdem, ob sie in der TETRA-Arbeitsoberfäche passiert oder im Transformationsmanager bzw. mit dem Kommandozeilen-Tool, die jeweils die unveränderten Texte behandeln.
Sowohl Windows- als auch Unix-Zeilenumbrüche werden durch folgendes Token erkannt (wenn die Zeilenumbrüche nicht ignoriert werden):
EOL ::= \r?\n |
Diese Seite gehört zur TextTransformer Dokumentation |
Home Inhalt English |