Ontologie (Informatik)
Ontologien im Datenmanagement sind meist sprachlich gefasste und formal geordnete Darstellungen einer Menge von Begriffen und der zwischen ihnen bestehenden Beziehungen in einem bestimmten Gegenstandsbereich (in Anlehnung an den klassischen Begriff der Ontologie). Sie werden dazu genutzt, „Wissen“ in digitalisierter und formaler Form zwischen Prozessen (oft Anwendungsprogrammen) und Diensten auszutauschen. Wissen umfasst dabei sowohl Allgemeinwissen als auch Wissen über sehr spezielle Themengebiete und Vorgänge.
Ontologien enthalten Inferenz- und Integritätsregeln, also Regeln zu Schlussfolgerungen und zur Gewährleistung ihrer Gültigkeit. Ontologien haben mit der Idee des semantischen Webs einen Aufschwung erfahren und sind damit Teil der Wissensrepräsentation im Teilgebiet Künstliche Intelligenz. Im Unterschied zu einer Taxonomie, die nur eine hierarchische Untergliederung bildet, stellt eine Ontologie ein Netzwerk von Informationen mit logischen Relationen dar.
In Veröffentlichungen wird meist von einer „expliziten formalen Spezifikation einer Konzeptualisierung“ (Begriffsbildung)[1] gesprochen. Da Ontologien über eine hohe semantische Ausdrucksstärke verfügen, sind sie geeignet, auch komplexe Datenmodelle oder Wissensrepräsentationen darzustellen. Damit kann auch in kollaborativen Projekten der Konsens einer großen Anzahl von Partnern mit Hilfe einer Ontologie formalisiert werden.[2]
Zweck
Ontologien dienen als Mittel der Strukturierung und zum Datenaustausch, um
- bereits bestehende Wissensbestände zusammenzufügen,
- in bestehenden Wissensbeständen zu suchen und diese zu editieren und
- aus Typen von Wissensbeständen neue Instanzen zu generieren.
Die meisten bekannten Anwendungen kennen keine individuellen Instanzen und beschränken sich auf wissenschaftliche Zwecke zur Systematisierung der Nutzung von Begriffsräumen. Ontologien sind bekannt für genetische Daten in der Bioinformatik oder räumliche Information in der Geosemantik.
Neue Anwendungen sind zu erwarten, wenn die Ontologien als Typen zur Instantiierung von individuellen Informationskonzepten verwendet werden, beispielsweise in der Humanmedizin für die fallspezifische medizinische Dokumentation, die Patientenakte. Bereits entwickelte Anwendungen in der Humanmedizin stellen bisher keine Verbindung zwischen bekannten Klassifikationssystemen der klinischen Praxis her. Stattdessen binden sie bislang lediglich an einzelne Klassifikationen für wissenschaftliche Arbeit an.
Experimente zur gewinnbringenden Nutzung von Ontologien in betriebswirtschaftlicher Anwendungssoftware wurden von SAP veröffentlicht.[3]
In der Brückenfunktion zwischen verschiedenen Klassifikationen und zu benachbarten Begriffswelten liegt die Stärke ontologischer Konzepte: Sie erlauben das Ablösen der konzeptionellen Arbeit von festen Textvorlagen und Textbausteinen und den Übergang zu wechselnden Zusammenstellungen halbfertig formulierter Texte zum Abfassen individueller Texte.
Aufbau und Typen
Analog zu einer Datenbank, in der Struktur (Datenbankschema) und Inhalt (Daten) ein Ganzes bilden, gehören auch bei einer Ontologie die Regeln und die Begriffe zusammen. Klassische Datenbanken bieten meist keine ausreichenden Informationen über die Bedeutung der gespeicherten Daten. Anwendern von Computern ist oft nicht bewusst, dass Daten über nicht unmittelbar erkennbare Metadaten verfügen und dass diese unter Umständen einen größeren Nutzen haben als die Daten selbst.[4] Ontologien sollen weitergehende Beschreibungen der Daten sowie der Regeln über deren Zusammenhang liefern. Diese Beschreibungen erlauben es, weitere Rückschlüsse aus den vorhandenen Daten zu ziehen, Widersprüche in den Daten zu erkennen und fehlendes Wissen zu ergänzen. Diese Rückschlüsse werden durch Inferenz abgeleitet, also durch logisches Folgern.
Unter „Ontology learning“ (vielleicht mit „ontologisches Lernen“ zu übersetzen) kann der Prozess beschrieben werden, bei dem eine Ontologie durch automatische Verfahren weiteres Wissen akquiriert. In diesem Prozess wird Wissen durch einen automatisierten Prozess erzeugt, während Ontologien sonst durch Eingaben menschlicher Experten Wissen hinzugewinnen.
Von der Möglichkeit von Relationen über Relationen (in RDF als Reifikation bezeichnet) und Regeln wird unter anderem aufgrund ihrer Komplexität in der Praxis relativ selten Gebrauch gemacht, obwohl gerade diese Merkmale Ontologien von anderen Begriffssystemen unterscheiden.
Bestandteile
Im Folgenden werden die Bestandteile am Beispiele der Ontologie „Landkarte“ beschrieben:
- Begriffe, Klassen (im Englischen: concepts, oft mit dem falschen Freund „Konzepte“ übersetzt): Die Beschreibung gemeinsamer Eigenschaften wird als Begriff definiert (z. B. „Stadt“ oder „Land“). Begriffe werden auch Klassen genannt. Diese können in einer Hierarchie mit Über- und Unterklasse angeordnet werden.
- Typen: Typen repräsentieren Objekttypen in der Ontologie und stellen die zur Verfügung stehenden Typen in Klassen dar. Diese werden anhand vorher definierter Begriffe erzeugt und als Types bezeichnet (z. B. Stadt als Typ des Begriffs topologisches Element der Klasse Punkte oder Fluss als Typ des Begriffs topologisches Element der Klasse Linien)
- Instanzen: Instanzen repräsentieren Objekte in der Ontologie. Sie werden anhand vorher definierter Begriffe erzeugt und auch als Individuals bezeichnet (z. B. München als Instanz des Begriffs topologischer Ort vom Typ Stadt oder Deutschland als Instanz des Begriffs topologischer Ort vom Typ Land).
- Relationen: Relationen werden verwendet, um zu beschreiben, welche Beziehungen zwischen den Instanzen bestehen (z. B. Stadt München liegt in Land Deutschland) und auch als Eigenschaften bezeichnet.
- Vererbung: Es ist möglich, Relationen und Eigenschaften der Begriffe zu vererben. Dabei werden alle Eigenschaften an das erbende Element weitergegeben. Mehrfachvererbung bei Begriffen ist grundsätzlich möglich. Durch den Einsatz von Transitivität können Instanzen in einer Bottom-Up-Hierarchie aufgebaut werden. Dabei spricht man von Delegation (z. B. ist Berlin die Hauptstadt von Deutschland und München die Hauptstadt von Bayern).
- Axiome: Axiome sind Aussagen innerhalb der Ontologie, die immer wahr sind. Diese werden normalerweise dazu verwendet, Wissen zu repräsentieren, das nicht aus anderen Begriffen abgeleitet werden kann (z. B. „Zwischen Amerika und Europa existiert keine Zugverbindung.“).
Ontologietypen
Grundsätzlich unterteilt man Ontologien in zwei Typen:
- Lightweight-Ontologien beinhalten Begriffe, Taxonomien und Beziehungen zwischen Begriffen und Eigenschaften, welche diese beschreiben. Daher sind Lightweight-Ontologien typischerweise für eine bestimmte Anwendungsdomäne entworfen.
- Heavyweight-Ontologien sind eine Erweiterung von Lightweight-Ontologien und fügen diesen Axiome und Einschränkungen hinzu, wodurch die beabsichtigte Bedeutung einzelner Aussagen innerhalb der Ontologie klarer wird. Eine besondere Form von Heavyweight-Ontologien sind Kernontologien. Diese stellen eine präzise Definition strukturierten Wissens in einem bestimmten Bereich dar, der sich über mehrere Anwendungsdomänen hin erstreckt. Kernontologien sollten dabei auf Basisontologien aufsetzen, um von deren Formalisierung und starker Axiomatisierung zu profitieren. Dazu werden in Kernontologien neue Konzepte und Relationen für den betrachteten Anwendungsbereich hinzugefügt und von den Basisontologien spezialisiert.
Erstellung
Eine Ontologie ist abhängig davon, von wem sie eingesetzt wird. Beispielsweise kann es bei einer Ontologie über Weine für ein Restaurant wichtig sein, auch passende Speisen zu den Weinen in der Ontologie aufzunehmen. Ist der Benutzer dagegen ein Weinabfüller, dürfte der Bereich der Speisen völlig uninteressant sein. Dagegen ist es für den Abfüller wichtig, welche verschiedenen Kork- und Flaschensorten existieren.
Zur Erstellung und Erweiterung von Ontologien wurden verschiedene formalisierte Prozessabläufe vorgeschlagen. Die Verfahren nach Holsapple und Joshi, nach Gómez-Pérez oder Uschold widmen sich verstärkt der Zusammenarbeit von Experten des Wissensgebietes der Ontologie und Informatikern oder allgemeiner Formalisten. Automatisch unterstützende Verfahren haben entweder das Ziel, eine vollständige Konstruktion der Ontologie vorzunehmen (wie etwa das Verfahren von Alexander Mädche) oder bestehende Ontologien durch Begriffsvorschläge zu erweitern (beispielsweise das Verfahren von Faatz und Steinmetz). Bei der Erstellung von Ontologien kann auch die Verschmelzung bestehender Ontologien von Interesse sein. Hierzu gibt es ein formales Verfahren nach Stumme und Mädche. Im Projekt „Ontoverse“[5] wird der Ansatz verfolgt, eine Ontologie kollaborativ aufzubauen und als Wiki zu realisieren.
Beispiel-Ontologie
Die nebenstehende Abbildung zeigt das Funktionsprinzip einer Ontologie. Die obere Ebene zeigt die Ontologie, die Begriffe und Relationen enthält. Begriffe werden durch Ellipsen dargestellt und Relationen durch Pfeile. Die Rechtecke stellen einfache Container für Informationen dar. Die Relationen verbinden zwei Begriffe miteinander und schränken diese gleichzeitig ein, beispielsweise wird ein Kunstwerk von einem Künstler erzeugt.
Begriffe können zur Vererbung herangezogen werden. Aus diesem Grund besitzen die Maler und Bildhauer ebenfalls die Relationen Name und Vorname. Der dicke Pfeil kennzeichnet die Vererbung. Die beiden Relationen schlägt und malt sowie gemaltVon und geschlagenVon sind vererbte Relationen von erzeugt und hergestelltVon. Die ursprünglichen Relationseigenschaften bleiben dabei erhalten, können jedoch erweitert werden.
Die Relationen malt und gemaltVon besitzen inverse Beziehungen zueinander, wodurch weitere Logik in die Ontologie integriert wird, die es ermöglicht, dass von einem Maler auf seine Kunstwerke und umgekehrt von einem Bild auf seinen Maler geschlossen werden kann.
Die untere Ebene der Abbildung zeigt Instanzen der Ontologie. Diese werden durch einen blauen Punkt dargestellt. Das Kürzel (I1) steht dabei für den eindeutigen Ressourcennamen der Instanz. Im Semantischen Web wird ein URI zur Kennzeichnung verwendet. Eine Besonderheit besitzt die Instanz des Malers Raffaello Santi. Dieser verwendet bereits existierende Instanzen, nämlich I3 vom Typ Ölzeichnung und I6 vom Typ Galleria dell’Accademia.
Ontologie-Editoren
Verschiedene Software-Werkzeuge unterstützen die Konstruktion von Ontologien in diversen Ontologie-Sprachen.
Ontologiesprachen
Formale Sprachen zur Beschreibung von Ontologien sind unter anderem das RDF-Schema, DAML+OIL, F-Logic, die vom World Wide Web Consortium für das semantische Web propagierte Web Ontology Language (OWL), die Web Service Modeling Language (WSML) und die unter ISO/IEC 13250:2000 normierten Topic Maps. Auch das Knowledge Interchange Format (KIF) wird gelegentlich benutzt.
Geschichte
Ursprünglich ist Ontologie als Lehre vom Seienden eine philosophische Disziplin und Teil der Metaphysik.
Als Vorläufer einer expliziten Formalisierung des Ontologiebegriffs sind Charles S. Peirce und Edmund Husserl zu nennen. Eine formale Sicht auf die philosophische Ontologie hatte auch Alonzo Church 1958[6] sowie Willard Van Orman Quine. Quine hat einen Ontologiebegriff vorgetragen, der mit der Tradition der klassischen Auffassung des Ontologiebegriffs in der Philosophie brach. Nach Quine meint „Sein“: Wert einer gebundenen Variable zu sein.[7] In Unterwegs zur Wahrheit findet sich die These: „Empirisch von Belang sind an einer Ontologie ausschließlich die besagten neutralen Knoten, die sie zur Struktur der Theorie beiträgt.“[8]
Im Bereich der künstlichen Intelligenz wurde der Begriff „Ontologie“ ab Anfang der 1990er Jahre durch einen Artikel von Neches et al.[9] und nachfolgende Publikationen[1] populär.
Von da an hat sich der Begriff „Ontologie“ als explizite Formalisierung ausgebreitet, wurde in der Künstliche-Intelligenz-Forschung verwendet und von der Bioinformatik[10] und weiteren Fächern aufgegriffen.
1999 stellte Tim Berners-Lee im Buch Weaving the Web seine Vision des Semantic Web vor.[11] Vielmals zitiert ist in diesem Zusammenhang auch der Artikel The Semantic Web von Berners-Lee u. a. aus dem Jahre 2001, in dem er auch die Verwendung von Ontologien im Zusammenhang mit dem Semantic Web beschreibt.[12]
Siehe auch
- Formale Begriffsanalyse. Ontologien im Sinne der Informatik lassen sich mathematisch mit den Mitteln der Formalen Begriffsanalyse darstellen. Es besteht also zwischen beiden Gebieten eine enge Verwandtschaft.
- Systemtheorie. Während die Ontologie ihren Fokus darauf hat, grundsätzliche Strukturen zu erfassen, bzw. in großen Datenmengen diese Strukturen zu erkennen und abzuleiten, versucht die Systemtheorie zumindest im technischen Bereich auch weitergehende Aspekte solcher Strukturen zu erfassen, z. B. quantitative Aspekte und deren zeitliches Verhalten.
Literatur
- Daniel Oberle, Nicola Guarino, Steffen Staab: What is an ontology? (PDF; 578 kB). In: Handbook on Ontologies. 2nd edition. Springer, 2009.
- Wolfgang Hesse: Ontologie(n). In: Informatik Spektrum, 25, 2002, S. 477–480.
- Steffen Staab, Rudi Studer: Handbook on Ontologies. Springer Verlag, 2004, ISBN 3-540-40834-7
- Tim Berners-Lee, Mark Fischetti: Weaving the web: the original design and ultimative destiny of the World Wide Web by its inventors. 1. Auflage. San Francisco, HarperCollins, 1999, ISBN 0-06-251586-1; aktuelle Auflage: New York, HarperBusiness, 2006, ISBN 0-06-251587-X; dt. Ausgabe: Tim Berners-Lee mit Mark Fischetti: Der Web-Report: der Schöpfer des World Wide Webs über das grenzenlose Potential des Internets. Econ, München 1999, ISBN 3-430-11468-3
- Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, 284 (5), S. 34–43, May 2001 (dt.: Mein Computer versteht mich. In: Spektrum der Wissenschaft, August 2001, S. 42–49)
- Andreas Faatz, Ralf Steinmetz: Precision and Recall for Ontology Enrichment. (PDF; 103 kB)
- Asunción Gomez-Perez, Mariano Fernández-Lopez, Oscar Corcho: Ontological Engineering. Springer Verlag 2004.
- Siegfried Handschuh, Steffen Staab (Hrsg.): Annotation for the Semantic Web. IOSPress, Amsterdam 2003.
- Pascal Hitzler, Markus Krötzsch, Sebastian Rudolph, York Sure: Semantic Web. Grundlagen. Springer 2008, ISBN 978-3-540-33993-9.
- Clyde W. Holsapple, K. D. Joshi: A collaborative approach to ontology design, Communications of the ACM 45/2 (2002), S. 42–47.
- Ludger Jansen, Barry Smith (Hrsg.): Biomedizinische Ontologie. Wissen strukturieren für den Informatik-Einsatz. vdf Hochschulverlag AG an der ETH Zürich, Zürich 2008, ISBN 978-3-7281-3183-6.
- Alexander Mädche: Ontology Learning for the Semantic Web. Kluwer Academic Publishers, 2002.
- Barry Smith et al.: Relations in Biomedical Ontologies. In: Genome Biology, 2005/6/5.
- Barry Smith, Bert Klagges: Philosophische Dimensionen der biomedizinischen Forschung. (PDF; 266 kB) In: Allgemeine Zeitschrift für Philosophie, 30/1, 2005, S. 5–26.
- Mike Uschold, Michael Grüninger: Ontologies: principles, methods, and applications. (PDF; 469 kB) In: Knowledge Engineering Review, 11/2, 1996, S. 93–155.
Grundlegendes zu Ontologie
- What is an Ontology? „An ontology is a specification of a conceptualization.“ (Tom Gruber)
- Ontology by Tom Gruber
- Lexikoneintrag zu Ontologie auf der Web-Site der Deutschen Gesellschaft für Informatik
- Buffalo Ontology Site
- Barry Smith’s Ontology Page (Barry Smith)
- National Center for Ontological Research
- Institute for Formal Ontology and Medical Information Science
- Videoaufzeichnung einer Vorlesung von Harald Sack über Ontologien am Hasso-Plattner-Institut. Die zugehörigen Folien kann man bei slideshare.net herunterladen.
Biomedizinische Ontologie
Anwendungen
- Semantic MediaWiki (eine MediaWiki-Erweiterung für das Semantische Web)
- KAON2 OWL-DL und ‚DL-safe rules‘ Inferenzmaschine
- OntoStudio (Grafischer Ontologie-Editor, Unterstützung für RDF(S), OWL und F-Logic, grafischer Regeleditor, Download bei semafora systems) (deutsch/englisch)
- protégé – Grafischer Ontology-Editor (Open Source)
- CIDOC Conceptual Reference Model – Ontologie für Begriffe und Informationen im Bereich des Kulturerbes (englisch)
- Jena – A Semantic Web Framework for Java (englisch)
- WebODE – Ontologie-Entwicklungswerkzeug (englisch)
Weblinks
Einzelnachweise
- T. R. Gruber: A translation approach to portable ontologies. In: Knowledge Acquisition. Band 5, Nr. 2. Academic Press, 1993, S. 199–220 (ksl-web.stanford.edu [abgerufen am 22. Februar 2017]).
- Christina Feilmayr, Wolfram Wöß: An analysis of ontologies and their success factors for application to business. In: Data & Knowledge Engineering. 2016, S. 1–23 (sciencedirect.com [abgerufen am 23. Mai 2017]).
- Daniel Oberle: How ontologies benefit enterprise applications. Hrsg.: Semantic Web journal. Band 5, Nr. 6. IOS Press, 2014, doi:10.3233/SW-130114 (semantic-web-journal.net [PDF; abgerufen am 22. Februar 2017]).
- Abhörskandal: Metadaten oft aufschlussreicher als der eigentliche Inhalt. In: datensicherheit.de. 23. September 2013, abgerufen am 11. September 2017.
- wwwalt.phil-fak.uni-duesseldorf.de (PDF)
- Ontological Commitment. In: The Journal of Philosophy, 55, S. 1008–1014
- Einschlägige Texte sind Von einem logischen Standpunkt, engl. Orig. 1961 und Ontologische Relativität, engl. Orig. 1969
- (W. V. O. Quine: Unterwegs zur Wahrheit, § 13 Auflösung der Ontologie, Paderborn u. a. 1995, S. 45.)
- Robert Neches, Richard Fikes, Tim Finin, Thomas Gruber, Ramesh Patil, Ted Senator, William R. Swartout: Enabling technology for knowledge sharing. In: AI Magazine, Band 12, Nummer 3, 1991 isi.edu
- M Ashburner, CA Ball, JA Blake, D Botstein, H Butler, JM Cherry, AP Davis, K Dolinski, SS Dwight, JT Eppig, MA Harris, DP Hill, L Issel-Tarver, A Kasarskis, S Lewis, JC Matese, JE Richardson, M Ringwald, GM Rubin, G Sherlock: Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. In: Nat Genet., 2000 May, 25(1), S. 25–29, PMID 10802651
- Tim Berners-Lee, Fischetti, Mark Fischetti: Weaving the Web. Hrsg.: HarperSanFrancisco. 1999, ISBN 978-0-06-251587-2, S. chapter 12.
- Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, 284 (5), S. 34–43, Mai 2001 (dt.: Mein Computer versteht mich. In: Spektrum der Wissenschaft, August 2001, S. 42–49)