Unicode |
Top Previous Next |
Glossar > Unicode
Unicode ist ein Zeichencodierungsstandard, der vom Unicode Consortium entwickelt wurde. Unicode kann mit nur einem Zeichensatz fast alle geschriebenen Sprachen der Welt wiedergeben.
Die einzelnen Zeichen können aber nicht mehr alle durch ein einzelnes Byte dargestellt werden, wie es beim ASCII- bzw. ANSI-Code der Fall ist. Es gibt verschiedene Methoden, wie die Zeichen mittels mehrerer Bytes repräsentiert werden können.
Beispiel:
Wird eine UTF-8 codierte Datei im ANSI-Modus geöffnet, so erscheint das Wort "für" als:
für
Der Umlaut 'ü' belegt in UTF-8 zwei Bytes, die im ANSI-Modus als zwei Zeichen dargestellt werden. Öffnet man hingegen die Datei im UTF-8-Modus, wird das Wort korrekt angezeigt.
|
Diese Seite gehört zur TextTransformer Dokumentation |
Home Inhalt English |