KOI8-U

KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung.

KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig.

KOI-U ist beschrieben in RFC 2319[1] und ist IANA-registriert und für MIME zugelassen.

Tabelle

…0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… ungenutzt
1…
2… SP !" #$% & '() *+ ,-. /
3… 012 34 567 8 9: ; <= >?
4… @AB CDEFG H IJKLM NO
5… PQRST UVWX YZ[ \] ^_
6… `a bcdefgh ijklm no
7… pqrst uvwx yz{ |} ~
8…
9… NBSP°²·÷
A… ёєіїґ
B… ЁЄІЇҐ©
C… юабцдефгхийклмно
D… пярстужвьызшэщчъ
E… ЮАБЦДЕФГХИЙКЛМНО
F… ПЯРСТУЖВЬЫЗШЭЩЧЪ

Die Unterschiede zu KOI8-R sind an den Positionen A4hex, A6hex, A7hex, ADhex und B4hex, B6hex, B7hex, BDhex (in obiger Tabelle farblich hervorgehoben), wo die vier zusätzlich benötigten Buchstaben kodiert sind.

Während RFC 2319[1] sagt, dass 95hex Unicode U+2219 (∙) sein soll, wird es oft in U+2022 (•) umgesetzt, wegen der Kompatibilität mit Codepage 1251. Einige Referenzen haben einen Tippfehler und ordnen fehlerhafterweise B4hex U+0403 zu, anstatt des korrekten U+0404. Dieser Tippfehler befindet sich auch im Anhang A von RFC 2319, aber die Tabelle im Haupttext ist korrekt.

Siehe auch

  • RFC 2319 Ukrainian Character Set KOI8-U [Errata: RFC 2319]. April 1998 (englisch).

Einzelnachweise

  1. RFC 2319 Ukrainian Character Set KOI8-U [Errata: RFC 2319]. April 1998 (englisch).
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.