Multipurpose Internet Mail Extensions
Die Multipurpose Internet Mail Extensions (MIME) sind Erweiterungen des Internetstandards RFC 822[1] (seit 2008 durch RFC 5322[2] ersetzt), der das Datenformat von E-Mails definiert. Dieser sieht nur den American Standard Code for Information Interchange (ASCII) vor. Die MIME schaffen Kompatibilität für zusätzliche Zeichen wie Umlaute sowie für Multimedia (etwa bei Mail-Anhängen). Sie wurden in RFC 2045,[3] RFC 2046,[4] RFC 2047[5] RFC 2048[6] und RFC 2049[7] definiert. RFC 2048 wurde von der Internet Engineering Task Force als Best Current Practice eingestuft.
Darüber hinaus findet MIME Anwendung bei der Deklaration von Inhalten in verschiedenen Internetprotokollen wie etwa HTTP sowie bei Desktop-Umgebungen wie KDE, Gnome, Xfce oder Aqua.
Allgemeine Beschreibung
MIME ermöglicht es, zwischen Sender und Empfänger Informationen über den Typ der übermittelten Daten auszutauschen (Content-Type-Field, Internet Media Type) und gleichzeitig eine für den verwendeten Übertragungsweg geeignete Zeichenkodierung (Content-Transfer-Encoding) festzulegen.
Es sind mehrere Kodierungsmethoden spezifiziert, die die Übertragung von Nicht-ASCII-Zeichen in Texten sowie von Nicht-Text-Dokumenten wie Bildern, Sprache und Video in textbasierten Übertragungssystemen wie E-Mail oder Usenet ermöglichen. Die Nicht-Text-Elemente werden beim Versender kodiert und beim Empfänger wieder dekodiert.
Die Kodierung von Nicht-7-Bit-ASCII-Zeichen erfolgt häufig mittels Quoted-Printable-Kodierung, Binärdaten hingegen werden üblicherweise Base64-kodiert. Bei dieser Kodierungsweise erhöht sich die Gesamtgröße der angehängten Dateien um 33–36 % (Erklärung siehe Base64). Aus 752 KiB werden 1 MiB (1.024 KiB) und aus 1 MiB werden 1393 KiB. Alternativ ist es für Textdaten mittels Content-Transfer-Encoding: 8bit
auch möglich, die Nicht-ASCII-Zeichen direkt zu übertragen (die Kodierung muss dabei angegeben sein, z. B. UTF-8 oder ISO 8859-15 für deutsche Texte).
Bei der Verwendung in anderen Protokollen wie etwa HTTP kann auch die Transport-Kodierung binary
verwendet werden, bei der beliebige Bytes direkt verschickt werden können, ohne spezielle Kodierung – bei E-Mails ist dies nicht erlaubt.
Es gibt eine Erweiterung dieses Standards namens S/MIME (Secure MIME), der auch das Verschlüsseln und digitale Signieren von Nachrichten erlaubt. Außerdem existiert mit PGP/MIME (beschrieben in RFC 2015[8] und RFC 3156[9]) auch eine PGP-kompatible Erweiterung für sicheren Datenaustausch.
Eine Multipart-Message enthält mehrere Bodyparts, die durch benannte Grenzlinien (boundary) abgegrenzt werden, bei deren Bezeichner sichergestellt werden muss, dass dieser nicht im restlichen Bodypart vorkommt. Häufig geschieht dies durch Wahl einer zufälligen Zeichenfolge, deren Auftreten im restlichen Bodypart unwahrscheinlich ist. Beispiel für eine einfache Multipart-Message (mit einem verkürzten boundary, das hier als frontier
festgelegt ist):
MIME-Version: 1.0 Content-Type: multipart/mixed; boundary=frontier This is a multi-part message in MIME format. --frontier Content-Type: text/plain This is the body of the message. --frontier Content-Type: text/html Content-Transfer-Encoding: base64 PGh0bWw+CiAgPGhlYWQ+CiAgPC9oZWFkPgogIDxib2R5PgogICAgPHA+VGhpcyBpcyB0aGUg Ym9keSBvZiB0aGUgbWVzc2FnZS48L3A+CiAgPC9ib2R5Pgo8L2h0bWw+Cg== --frontier--
Einzelne Bodyparts werden dabei durch die Sequenz aus einleitenden zwei Querstrichen (Bindestrich-Minuszeichen) und Boundary eingeleitet und der letzte durch dieselbe Sequenz mit auch abschließenden zwei Querstrichen.
Details der Spezifikation
MIME Part 1 – Format of Internet Message Bodies
Dieser erste Teil der Spezifikationen, RFC 2045,[3] führt grundlegende zusätzliche Felder im Kopf von E-Mails ein:
- MIME-Version
- Content-Type
- Content-Transfer-Encoding
Das Content-Transfer-Encoding gibt an, ob die Übertragung nach Internetstandard RFC 6152[10] erfolgen soll, dies stattgefunden hat, oder eine Kodierung für Internetstandard RFC 822[1] erfolgt ist, die beim Empfänger wieder rückgängig gemacht werden muss:
- 7bit – keine Kodierung, Text enthält nur ASCII-Zeichen
- 8bit – keine Kodierung, Text enthält auch Nicht-ASCII-Zeichen, Übertragung mittels Extended SMTP
- binary – keine Kodierung, binärer Inhalt
- quoted-printable – Kodierung von Steuerzeichen und Nicht-ASCII-Zeichen durch Ersetzung mit deren Hexadezimalwert
- base64 – Kodierung durch Transformation in eine 6-Bit-Darstellung
Was kein Text ist, erfordert, sofern der ESMTP-Server nicht Binärdaten nach RFC 3030[11] (BDAT
-Befehl) akzeptiert, auf jeden Fall Kodierung, die dann grundsätzlich nach Base64 erfolgt. Nichts weiter als beliebigen Text enthaltende E-Mails bedürfen hingegen keiner Umformung:
Beispiel
From: <adam@example.org> To: <eva@example.org> Subject: Umlaute dank MIME MIME-Version: 1.0 Content-Type: text/plain; charset=iso-8859-15 Content-Transfer-Encoding: 8bit
Wären die drei zusätzlichen Kopfzeilen nicht, wäre diese Zeile nicht leserlich.
MIME Part 2 – Media Types
Dieser zweite Teil der Spezifikationen, RFC 2046,[4] definiert für das Feld Content-Type Haupttypen und Untertypen von Inhalten.
Generell können jedoch auch weitere Internet Media Types verwenden werden, deren konkrete Verarbeitung dann dem Mailprogramm überlassen bleibt.
text
Als Parameter dieses Haupttyps ist die Angabe eines Zeichensatzes vorgesehen. Als Untertyp ist einfacher Text ohne Formatierung vordefiniert:
- text/plain
- text/html
application
Dieser Haupttyp ist für Daten von Anwendungsprogrammen vorgesehen. Vordefiniert sind zwei Untertypen:
- application/octet-stream
- Dieser Untertyp soll zum Speichern der Daten führen und ausdrücklich nicht zum Starten eines Anwendungsprogramms.
- application/postscript
- Dieser Untertyp soll zum Drucken der Daten führen.
multipart
Dieser Haupttyp ist für Kombinationen mehrerer Inhalte vorgesehen. Vordefiniert sind fünf Untertypen:
- multipart/mixed
- Dieser Untertyp ist für Zusammenstellungen in einer bestimmten Reihenfolge vorgesehen.
- multipart/alternative
- Dieser Untertyp ist für gleiche Inhalte in unterschiedlichen Formaten vorgesehen, von denen nur das passendste präsentiert werden soll. Typischerweise ist eines der Formate ein vordefinierter Untertyp der MIME.
- multipart/digest
- Dieser Untertyp ist dazu vorgesehen, eine Übersicht der Inhalte zu liefern.
- multipart/parallel
- Dieser Untertyp ist für Systeme vorgesehen, die alle Typen von Inhalten zugleich präsentieren können.
- multipart/related
- Dieser Untertyp ist separat in RFC 2387[12] definiert und zur Kombination mehrerer Inhalte vorgesehen, die nur zusammen Sinn ergeben. Die in RFC 2557[13] definierte MIME Encapsulation of Aggregate Documents baut darauf auf. Sie war die Konsequenz aus dem Umstand, dass Hypertext Markup Language (HTML) kein Standard für MIME werden konnte.[14] Zudem wurde der Begriff Internet Media Type und schließlich der Begriff XHTML Media Type für Ausrichtung auf das Hypertext Transfer Protocol (HTTP) statt auf das Simple Mail Transfer Protocol (SMTP) geprägt.[15]
message
Dieser Haupttyp ist zur Handhabung anderer E-Mails vorgesehen. Vordefiniert sind drei Untertypen:
- message/rfc822
- Dieser Untertyp ist dazu vorgesehen, mehrere herkömmliche E-Mails aufzunehmen.
- message/partial
- Dieser Untertyp ist dazu vorgesehen, eine große E-Mail in mehrere Teile zu zerlegen, diese nacheinander zu versenden und sie automatisch wieder zusammenzusetzen.
- message/external-body
- Dieser Untertyp ist dazu vorgesehen, nur eine Verknüpfung zu einer anderen E-Mail zu enthalten.
MIME Part 3 – Header Extensions for Non-ASCII Text
Dieser dritte Teil der Spezifikationen hebt auch für den Betreff und andere Felder im Kopf von E-Mails die Beschränkung auf den englischen Zeichensatz auf.
Ursprünglich war es nicht erlaubt, im Betreff von E-Mails Umlaute oder andere Sonderzeichen zu verwenden, sondern nur die in ASCII definierten Zeichen. Ein Betreff wie „Schöne Grüße“ konnte dann, je nachdem, von welchen Programmen die E-Mail übertragen wurde, als „Sch?ne Gr??e“, „Sch�ne Gr��e“ oder „Schvne Gr|_e“ ankommen. Um diese Probleme zu beheben, wurde in RFC 1522[16] im Jahr 1993 ein Verfahren definiert, wie der Betreff beim Absender codiert und beim Empfänger wieder decodiert wird, ohne dass während der Übertragung die Daten verfälscht werden. Dieses besteht aus folgendem Schema:
=?Zeichensatz?Kodierung?Kodierter Text?=
Gemäß RFC 2047[5] gibt es viele gleichwertige Varianten, die Betreffzeile „Schöne Grüße“ zu codieren:
=?UTF-8?B?U2Now7ZuZSBHcsO8w59l?=
=?ISO-8859-1?B?U2No9m5lIEdy/N9l?=
=?UTF-8?Q?Sch=C3=B6ne_Gr=C3=BC=C3=9Fe?=
=?ISO-8859-1?Q?Sch=F6ne_Gr=FC=DFe?=
Bei all diesen Varianten sind keine Umlaute mehr zu sehen, die Übertragung ist also gesichert. Dafür ist der Betreff nicht mehr direkt menschenlesbar. Bei den unteren beiden Varianten (mit der Kodierung Q
für Quoted-Printable) kann man den Text noch erahnen, bei den oberen beiden (mit der Kodierung B
für Base64) ist überhaupt nichts mehr erkennbar. Es sind jedoch alle Informationen enthalten, damit der ursprüngliche Betreff beim Empfänger wieder decodiert werden kann.
MIME Part 4 – Registration Procedures
Dieser vierte Teil der Spezifikationen, mittlerweile RFC 4289,[17] beschreibt die Registrierung zusätzlicher Erweiterungen bei der Internet Assigned Numbers Authority. Die dort registrierten Media Types sind vielfältig und umfassen auch ausdrücklich überholte und missbilligte.[18] Schon 1994 wurden Registrierungen ohne Berücksichtigung der MIME akzeptiert.[19] Seit 1995 ist die gesamte Registrierung nur noch Best Current Practice.[6] Ende 2005 wurde die Registrierung von Media Types aus der Spezifikation der MIME herausgenommen, um verbreiteten Missverständnissen entgegenzuwirken.[20] Wie sich ein registrierter Media Type zu MIME verhält, erschließt sich nur aus den Spezifikationen.
MIME Part 5 – Conformance Criteria and Examples
Dieser fünfte Teil der Spezifikationen, RFC 2049,[7] legt Mindestanforderungen an E-Mail-Programme fest:
- Obligatorische zusätzliche Kopfzeile jeder erstellten E-Mail:
MIME-Version: 1.0
- Senden aller nicht RFC 822[1] entsprechenden E-Mails mit Kodierungen und Kopfzeilen der MIME.
- Melden von Zeichensätzen der ISO 8859 in empfangenen E-Mails.
- Erkennen und Darstellen des Inhaltstyps message/rfc822.
- Weitgehendes Erkennen und Darstellen des Inhaltstyps multipart.
- Verarbeiten aller nicht erkannten Inhaltstypen als Inhaltstyp octet-stream.
Verschlüsselung
RFC 1847[21] definiert Verschlüsselung und elektronische Signatur mittels MIME grundlegend. Zwei zusätzliche Media Types sind dafür vorgesehen:
- multipart/signed
- multipart/encrypted
Die in RFC 5751[22] definierten Secure/Multipurpose Internet Mail Extensions (S/MIME) setzen Cryptographic Message Syntax darauf auf.
Die in RFC 2015[8] definierte MIME Security with Pretty Good Privacy (PGP/MIME) setzt stattdessen Pretty Good Privacy (PGP) auf.
Spezifikationen
- RFC – Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies. (englisch).
- RFC – Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types. (englisch).
- RFC – MIME (Multipurpose Internet Mail Extensions) Part Three: Message Header Extensions for Non-ASCII Text. (englisch).
- RFC – Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures. (englisch).
- RFC – Multipurpose Internet Mail Extensions (MIME) Part Five: Conformance Criteria and Examples. (englisch).
Einzelnachweise
- RFC – Standard for the Format of ARPA Internet Text Messages. 13. August 1982 (englisch).
- RFC – Internet Message Format. Oktober 2008 (englisch).
- RFC – Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies. (englisch).
- RFC – Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types. (englisch).
- RFC – MIME (Multipurpose Internet Mail Extensions) Part Three: Message Header Extensions for Non-ASCII Text. (englisch).
- RFC – Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures. (englisch).
- RFC – Multipurpose Internet Mail Extensions (MIME) Part Five: Conformance Criteria and Examples. (englisch).
- RFC – MIME Security with Pretty Good Privacy (PGP). Oktober 1996 (englisch).
- RFC – MIME Security with OpenPGP. August 2001 (englisch).
- RFC – SMTP Service Extension for 8-bit MIME Transport. März 2011 (englisch).
- RFC – SMTP Service Extensions for Transmission of Large and Binary MIME Messages. Dezember 2000 (englisch).
- RFC – The MIME Multipart/Related Content-type. August 1998 (englisch).
- RFC – MIME Encapsulation of Aggregate Documents, such as HTML (MHTML). März 1999 (englisch).
- RFC – The ‘text/html’ Media Type. Juni 2000 (englisch).
- XHTML Media Types. World Wide Web Consortium, 30. April 2002, abgerufen am 25. Juli 2011 (englisch).
- RFC – MIME (Multipurpose Internet Mail Extensions) Part Two: Message Header Extensions for Non-ASCII Text. März 1993 (englisch). später erweitert durch RFC 2047
- RFC – Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures. Dezember 2005 (englisch).
- MIME Media Types. Internet Corporation for Assigned Names and Numbers, abgerufen am 25. Juli 2011 (englisch).
- RFC – Media Type Registration Procedure. (englisch).
- RFC – Media Type Specifications and Registration Procedures. (englisch).
- RFC – Security Multiparts for MIME: Multipart/Signed and Multipart/Encrypted. Oktober 1995 (englisch).
- RFC – Secure/Multipurpose Internet Mail Extensions (S/MIME) Version 3.2 – Message Specification. Januar 2010 (englisch).