ISO 8859

Die Normenfamilie ISO 8859, genauer ISO/IEC 8859, der Internationalen Organisation für Normung definiert in 15 verabschiedeten und einer verworfenen Teilnorm verschiedene 8-Bit-Zeichensätze für die Informationstechnik, darunter:

  • ISO 8859-1 war im Dezember 2020 mit 1,7 % die zweithäufigste Kodierung von Websites, nach UTF-8 mit 95,9 %.
  • ISO 8859-9 wird von 0,1 % aller Websites verwendet.
  • die übrigen Teilnormen spielen in der Praxis keine Rolle.[1]
ISO 8859
-1 Latin-1, Westeuropäisch
-2 Latin-2, Mitteleuropäisch
-3 Latin-3, Südeuropäisch
-4 Latin-4, Nordeuropäisch
-5 Kyrillisch
-6 Arabisch
-7 Griechisch
-8 Hebräisch
-9 Latin-5, Türkisch
-10 Latin-6, Nordisch
-11 Thai
-12 (existiert nicht)
-13 Latin-7, Baltisch
-14 Latin-8, Keltisch
-15 Latin-9, Westeuropäisch
-16 Latin-10, Südosteuropäisch

Allgemeiner Aufbau der Zeichensätze

  • Die ersten 128 Positionen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.
  • Die Zeichen 7Fhex bis 9Fhex werden in der Norm nicht definiert ("Their use is outside the scope of ISO/IEC 8859; it is specified in other International Standards, for example ISO/IEC 6429.")[2]
  • Die letzten 96 Positionen (A0hex bis FFhex) enthalten regionale Sonderzeichen und machen den Unterschied zwischen den Teilnormen aus. Sie sind unten in Tabellenform dargestellt. Die Zeichenzuordnung insbesondere von ISO 8859-1 spiegelt dabei den Aufbau von ASCII wider.
    • A0hex bis BFhex enthält hauptsächlich Satz- und Sonderzeichen.
    • C0hex bis DFhex enthält hauptsächlich Großbuchstaben.
    • E0hex bis FFhex enthält hauptsächlich Kleinbuchstaben.

Anmerkungen

  • Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.
  • Der neuere Latin-9-Zeichensatz (ISO 8859-15) unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz; unter anderem wurde das allgemeine Währungszeichen ¤ durch das Eurozeichen € ersetzt.
  • Innerhalb der Normenfamilie wurde kein Zeichensatz „ISO 8859-12“ festgelegt. Die Bezeichnung wurde vorübergehend für zwei verschiedene Vorschläge benutzt, aber keiner der beiden wurde als Standard beschlossen.
  • Die ISO-8859-Normen werden von ISO/IEC nicht mehr aktiv weiterentwickelt. Die Zeichensätze wurden durch ISO UCS abgelöst das inhaltsgleich zum Unicode-Standard ist. Dieser findet vor allem in Form der UTF-8-Kodierung Verbreitung.

Buchstaben für die deutsche Sprache

Die deutschen Umlaute Ä = C4hex, ä = E4hex, Ö = D6hex, ö = F6hex, Ü = DChex und ü = FChex sowie das kleine Eszett ß = DFhex sind in zehn Teilnormen der Latin-Gruppe jeweils auf den gleichen Positionen bzw. mit dem gleichen Code vorhanden. Eine Kompatibilität zwischen diesen Normen zumindest für deutschsprachige Texte ist damit gegeben.

Lediglich in den Teilnormen für die Alphabete -5 Kyrillisch, -6 Arabisch, -7 Griechisch, -8 Hebräisch und -11 Thai sind die deutschen Sonderzeichen nicht verfügbar.

Tabelle der regionalen Sonderzeichen

An Position A0hex liegt stets das geschützte Leerzeichen (engl. non breaking space, NBSP) und an ADhex meist der bedingte Trennstrich (engl. soft hyphen, SHY), der nur am Zeilenende sichtbar ist. Weitere mit Buchstaben symbolisierte Zeichen sind im Hebräischen die bidirektionalen Steuerzeichen LRM und RLM an Position FDhex bzw. FEhex. Leere Felder sind entweder (noch) nicht belegt oder können auf dem verwendeten System nicht angezeigt werden.

Ergänzungen und Änderungen in der Version 2003 des Standards.
Nicht definierte Zeichen sind grün hinterlegt.

Belegung der ISO-8859-Teilnormen mit regionalen Sonderzeichen
BinärOktDezHex -1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
10100000240160A0 NBSP
10100001241161A1 ¡ĄĦĄЁ  ¡Ą¡Ą
10100010242162A2 ¢˘˘ĸЂ ¢¢Ē¢¢ą
10100011243163A3 £Ł£ŖЃ £££Ģ£££Ł
10100100244164A4 ¤¤¤¤Є¤¤¤Ī¤Ċ
10100101245165A5 ¥Ľ ĨЅ ¥¥Ĩċ¥
10100110246166A6 ¦ŚĤĻІ ¦¦¦Ķ¦ŠŠ
10100111247167A7 §§§§Ї §§§§§§§§
10101000250168A8 ¨¨¨¨Ј ¨¨¨ĻØšš
10101001251169A9 ©ŠİŠЉ ©©©Đ©©©©
10101010252170AA ªŞŞĒЊ ͺתŠŖªȘ
10101011253171AB «ŤĞĢЋ «««Ŧ«««
10101100254172AC ¬ŹĴŦЌ،¬¬¬Ž¬¬Ź
10101101255173AD SHYSHY
10101110256174AE ®Ž ŽЎ  ®®Ū®®®ź
10101111257175AF ¯ŻŻ¯Џ ¯¯ŊÆŸ¯Ż
BinärOktDezHex -1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
10110000260176B0 °°°°А °°°°°°°
10110001261177B1 ±ąħąБ ±±±ą±±±
10110010262178B2 ²˛²˛В ²²²ē²Ġ²Č
10110011263179B3 ³ł³ŗГ ³³³ģ³ġ³ł
10110100264180B4 ´´´´Д ΄´´īŽŽ
10110101265181B5 µľµĩЕ ΅µµĩµµ
10110110266182B6 śĥļЖ Άķ
10110111267183B7 ·ˇ·ˇЗ ·······
10111000270184B8 ¸¸¸¸И Έ¸¸ļøžž
10111001271185B9 ¹šıšЙ Ή¹¹đ¹¹č
10111010272186BA ºşşēК Ί÷ºšŗºș
10111011273187BB »ťğģЛ؛»»»ŧ»»»
10111100274188BC ¼źĵŧМ Ό¼¼ž¼ŒŒ
10111101275189BD ½˝½ŊН ½½½½œœ
10111110276190BE ¾ž žО Ύ¾¾ū¾ŸŸ
10111111277191BF ¿żżŋП؟Ώ ¿ŋæ¿ż
BinärOktDezHex -1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11000000300192C0 ÀŔÀĀР ΐ ÀĀĄÀÀÀ
11000001301193C1 ÁÁÁÁСءΑ ÁÁĮÁÁÁ
11000010302194C2 ÂÂÂÂТآΒ ÂÂĀÂÂÂ
11000011303195C3 ÃĂ ÃУأΓ ÃÃĆÃÃĂ
11000100304196C4 ÄÄÄÄФؤΔ ÄÄÄÄÄÄ
11000101305197C5 ÅĹĊÅХإΕ ÅÅÅÅÅĆ
11000110306198C6 ÆĆĈÆЦئΖ ÆÆĘÆÆÆ
11000111307199C7 ÇÇÇĮЧاΗ ÇĮĒÇÇÇ
11001000310200C8 ÈČÈČШبΘ ÈČČÈÈÈ
11001001311201C9 ÉÉÉÉЩةΙ ÉÉÉÉÉÉ
11001010312202CA ÊĘÊĘЪتΚ ÊĘŹÊÊÊ
11001011313203CB ËËËËЫثΛ ËËĖËËË
11001100314204CC ÌĚÌĖЬجΜ ÌĖĢÌÌÌ
11001101315205CD ÍÍÍÍЭحΝ ÍÍĶÍÍÍ
11001110316206CE ÎÎÎÎЮخΞ ÎÎĪÎÎÎ
11001111317207CF ÏĎÏĪЯدΟ ÏÏĻÏÏÏ
BinärOktDezHex -1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11010000320208D0 ÐĐ ĐаذΠ ĞЊŴÐĐ
11010001321209D1 ÑŃÑŅбرΡ ÑŅŃÑÑŃ
11010010322210D2 ÒŇÒŌвز  ÒŌŅÒÒÒ
11010011323211D3 ÓÓÓĶгسΣ ÓÓÓÓÓÓ
11010100324212D4 ÔÔÔÔдشΤ ÔÔŌÔÔÔ
11010101325213D5 ÕŐĠÕеصΥ ÕÕÕÕÕŐ
11010110326214D6 ÖÖÖÖжضΦ ÖÖÖÖÖÖ
11010111327215D7 ××××зطΧ ×Ũ×׌
11011000330216D8 ØŘĜØиظΨ ØØŲØØŰ
11011001331217D9 ÙŮÙŲйعΩ ÙŲŁÙÙÙ
11011010332218DA ÚÚÚÚкغΪ ÚÚŚÚÚÚ
11011011333219DB ÛŰÛÛл Ϋ ÛÛ ŪÛÛÛ
11011100334220DC ÜÜÜÜм ά ÜÜ ÜÜÜÜ
11011101335221DD ÝÝŬŨн έ İÝ ŻÝÝĘ
11011110336222DE ÞŢŜŪо ή ŞÞ ŽŶÞȚ
11011111337223DF ßßßßп ίßß฿ßßßß
BinärOktDezHex -1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11100000340224E0 àŕàāрـΰאàāąààà
11100001341225E1 ááááсفαבááįááá
11100010342226E2 ââââтقβגââāâââ
11100011343227E3 ãă ãуكγדããćããă
11100100344228E4 ääääфلδהääääää
11100101345229E5 åĺċåхمεוåååååć
11100110346230E6 æćĉæцنζזææęæææ
11100111347231E7 çççįчهηחçįēççç
11101000350232E8 èčèčшوθטèččèèè
11101001351233E9 ééééщىιיéééééé
11101010352234EA êęêęъيκךêęźêêê
11101011353235EB ëëëëыًλכëëėëëë
11101100354236EC ìěìėьٌμלìėģììì
11101101355237ED ííííэٍνםííķííí
11101110356238EE îîîîюَξמîîīîîî
11101111357239EF ïďïīяُοןïïļïïï
BinärOktDezHex -1-2-3-4-5-6-7-8-9-10-11-13-14-15-16
11110000360240F0 ðđ đِπנğðšŵðđ
11110001361241F1 ñńñņёّρסñņńññń
11110010362242F2 òňòōђْςעòōņòòò
11110011363243F3 óóóķѓ σףóóóóóó
11110100364244F4 ôôôôє τפôôōôôô
11110101365245F5 õőġõѕ υץõõõõõő
11110110366246F6 ööööі φצöööööö
11110111367247F7 ÷÷÷÷ї χק÷ũ÷÷ś
11111000370248F8 øřĝøј ψרøøųøøű
11111001371249F9 ùůùųљ ωשùųłùùù
11111010372250FA úúúúњ ϊתúúśúúú
11111011373251FB ûűûûћ ϋ ûûūûûû
11111100374252FC üüüüќ ό üü üüüü
11111101375253FD ýýŭũ§ ύLRMıý żýýę
11111110376254FE þţŝūў ώRLMşþ žŷþț
11111111377255FF ÿ˙˙˙џ   ÿĸ ÿÿÿ
BinärOktDezHex -1-2-3-4-5-6-7-8-9-10-11-13-14-15-16

Siehe auch

Einzelnachweise

  1. https://w3techs.com/technologies/history_overview/character_encoding ISO 8859-2, und 8859-15 werden da noch erwähnt, mit (etwas?) weniger als 0,17 %.
  2. ISO/IEC 8859-1:1998, S. 5
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.