ISO 8859-2

ISO 8859-2, genauer ISO/IEC 8859-2, auch bekannt als Latin-2, ist ein von der ISO zuletzt 1999 aktualisierter Standard für die Informationstechnik zur Zeichenkodierung mit acht Bit und der zweite Teil der Normenfamilie ISO/IEC 8859.

ISO 8859
-1	Latin-1, Westeuropäisch
-2	Latin-2, Mitteleuropäisch
-3	Latin-3, Südeuropäisch
-4	Latin-4, Nordeuropäisch
-5	Kyrillisch
-6	Arabisch
-7	Griechisch
-8	Hebräisch
-9	Latin-5, Türkisch
-10	Latin-6, Nordisch
-11	Thai
~~-12~~	(existiert nicht)
-13	Latin-7, Baltisch
-14	Latin-8, Keltisch
-15	Latin-9, Westeuropäisch
-16	Latin-10, Südosteuropäisch

Die mit sieben Bit kodierbaren Zeichen entsprechen US-ASCII mit führendem Nullbit. Zusätzlich zu den 95 darstellbaren ASCII-Zeichen (20₁₆–7E₁₆) kodiert ISO 8859-2 96 weitere (A0₁₆–FF₁₆), also insgesamt 191 von theoretisch möglichen 256 (= 2⁸). Den Positionen 00₁₆–1F₁₆ und 7F₁₆–9F₁₆ sind in ISO/IEC 8859 und damit ISO/IEC 8859-2 keine Zeichen zugewiesen. Dieser Bereich wurde bewusst freigehalten, um die entsprechenden Bytes für die Gerätesteuerung nutzen zu können oder sicherzustellen, dass diese bei einer unzureichend spezifizierten Codierung nicht in Konflikt mit solchen Steuerzeichen geraten. Die von der IANA definierte Bezeichnung ISO-8859-2 (mit Bindestrich) steht für die Kombination der Zeichen dieser Norm mit nicht darstellbaren Steuerzeichen gemäß ISO/IEC 6429. Im Januar 2019 verwenden 0,1 % aller Websites ISO 8859-2.[1]

ISO 8859-2 versucht, möglichst viele Sonderzeichen mittel- und teilweise südosteuropäischer, überwiegend slawischer Sprachen abzudecken, darunter folgende:

Albanisch
Bosnisch
Deutsch
Kroatisch
Polnisch
Rumänisch
Serbisch (in lateinischen Zeichen)
Serbokroatisch (in lateinischen Zeichen)
Slowakisch
Slowenisch
Ober- und Niedersorbisch
Tschechisch
Ungarisch

Tabelle

ISO-8859-2 inklusive der in ISO/IEC 8859-2 nicht enthaltenen Steuerzeichen
Code	…0	…1	…2	…3	…4	…5	…6	…7	…8	…9	…A	…B	…C	…D	…E	…F
0…	NUL	SOH	STX	ETX	EOT	ENQ	ACK	BEL	BS	HT	LF	VT	FF	CR	SO	SI
1…	DLE	DC1	DC2	DC3	DC4	NAK	SYN	ETB	CAN	EM	SUB	ESC	FS	GS	RS	US
2…	SP	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
3…	0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
4…	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
5…	P	Q	R	S	T	U	V	W	X	Y	Z	[	\	]	^	_
6…	`	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
7…	p	q	r	s	t	u	v	w	x	y	z	{	\|	}	~	DEL
8…	PAD	HOP	BPH	NBH	IND	NEL	SSA	ESA	HTS	HTJ	VTS	PLD	PLU	RI	SS2	SS3
9…	DCS	PU1	PU2	STS	CCH	MW	SPA	EPA	SOS	SGCI	SCI	CSI	ST	OSC	PM	APC
A…	NBSP	Ą	˘	Ł	¤	Ľ	Ś	§	¨	Š	Ş	Ť	Ź	SHY	Ž	Ż
B…	°	ą	˛	ł	´	ľ	ś	ˇ	¸	š	ş	ť	ź	˝	ž	ż
C…	Ŕ	Á	Â	Ă	Ä	Ĺ	Ć	Ç	Č	É	Ę	Ë	Ě	Í	Î	Ď
D…	Đ	Ń	Ň	Ó	Ô	Ő	Ö	×	Ř	Ů	Ú	Ű	Ü	Ý	Ţ	ß
E…	ŕ	á	â	ă	ä	ĺ	ć	ç	č	é	ę	ë	ě	í	î	ď
F…	đ	ń	ň	ó	ô	ő	ö	÷	ř	ů	ú	ű	ü	ý	ţ	˙

SP (space) auf Position 20₁₆ ist das Leerzeichen, NBSP (no-break space, auch non-breaking space) auf Position A0₁₆ ist das geschützte Leerzeichen und SHY (soft hyphen) an Position AD₁₆ ist der bedingte Trennstrich, der normalerweise nur am Zeilenende sichtbar ist.

Einzelnachweise

Historical trends in the usage of character encodings for websites. Abgerufen am 22. Oktober 2014.

Weblinks

Mapping bei Unicode.org

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] Historical trends in the usage of character encodings for websites. Abgerufen am 22. Oktober 2014.