Syntaxbaum |
Top Previous Next |
Einführung > Syntaxbaum
Ebenso wie die Terminalsymbole oder Token durch reguläre Ausdrücke beschrieben werden, kann auch Muster von Token selbst durch Regeln beschrieben werden. So besteht z.B. ein Hauptsatz aus einer Folge von Wörtern gefolgt von einem Punkt, oder eine Tabelle besteht aus dem Tabellenkopf mit den Namen für die einzelnen Spalten gefolgt von einer Reihe Zeilen..
Die Syntaxanalyse zeigt auf, in welchem grammatikalischen Zusammenhang die Token zueinander stehen. Dieser Zusammenhang kann als eine Baumstruktur, als eine sogenannter Syntaxbaum, dargestellt werden.
In diesem Beispiel sind die Token denkbar einfach. Sie bestehen aus jeweils nur einem Zeichen: "E", "m", "*", "c", "^", und "2". In der Abbildung sind die Token oder Terminalsymbole die Blätter des Baums und stehen in der untersten Zeile. Die Blätter sind grafisch dadurch ausgezeichnet, dass an ihnen jeweils nur eine Linie endet; grammatisch sind sie dadurch gekennzeichnet, dass sie sich nicht weiter zerlegen lassen (s. Anm.). Dies unterscheidet sie von den anderen Knoten des Baums, die die sogenannten Nonterminalsymbole repräsentieren. Die Nonterminalsymbole lassen sich in die Terminalsymbole zerlegen. Sie sind in der grafischen Darstellung Ausgangspunkt von Verzweigungen.
Im TextTransformer würde der Syntaxbaum der Abbildung in drei Baumstrukturen für die Nonterminalsymbole zerlegt in etwa folgendermaßen aussehen:
Anmerkung: Dass die Terminalsymbole sich grammatisch nicht weiter zerlegen lassen, heißt nicht, dass sie nicht in Zeichenfolgen zerlegbar wären, wie es bei komplexeren Token als in diesem Beispiel stets der Fall ist. |
Diese Seite gehört zur TextTransformer Dokumentation |
Home Inhalt English |