Zeilenumbrüche

Top  Previous  Next

Glossar > Zeilenumbrüche

 

Zeilenumbrücke werden in Textdateien durch besondere Steuerzeichen dargestellt. In den Windows Betriebssystemen ist dies eine Kombination aus dem Carriage-Return-Zeichen '\r' und dem Linefeed-Zeichen '\n'. Werden z.B. die einzelnen Zeichen des dreizeiligen Texts:

 

1. Zeile

2. Zeile

3. Zeile

 

In einer Tabelle aufgelistet, sieht diese folgendermaßen aus:

 

1

.

 

Z

e

i

l

e

\r

\n

2

.

 

Z

e

i

l

e

\r

\n

3

.

 

Z

e

i

l

e

 

 

 

In Unix-Betriebssystemen ist es üblich statt der '\r\n'-Kombination allein das Linfeed-Zeichen zu verwenden. Der gleiche Text ist dort also etwas kürzer:

 

1

.

 

Z

e

i

l

e

\n

2

.

 

Z

e

i

l

e

\n

3

.

 

Z

e

i

l

e

 

 

Im TextTransformer Editor wird stets die Windows Konvention verwendet. Werden Unix-Texte geladen, so wird automatisch allen Linfeed-Zeichen ein Carriage-Return-Zeichen vorangestellt. Ab Version 0.9.8.1 erfolgt dann ein entsprechender Warnhinweis.

 

In den meisten Transformations-Projekten werden die Zeilenumbrüche ignoriert. Sind sie aber konstitutiv für die Struktur des zu analysierenden Textes, muss auf den eventuellen Einschub der '\r'-Zeichen geachtet werden. Im Extremfall kann dann die Ausführung eines Projekts verschiedene Ergebnisse haben, je nachdem, ob sie in der TETRA-Arbeitsoberfäche passiert oder im Transformationsmanager bzw. mit dem Kommandozeilen-Tool, die jeweils die unveränderten Texte behandeln.

 

Sowohl Windows- als auch Unix-Zeilenumbrüche werden durch folgendes Token erkannt (wenn die Zeilenumbrüche nicht ignoriert werden):

 

EOL  ::= \r?\n



Diese Seite gehört zur TextTransformer Dokumentation

Home  Inhalt  English