VAK: | 03-799.59 |
Veranstalter: | Joachim Hammer <jhammer@cise.ufl.edu>
(CISE,
University of Florida), Sebastian Hübner <huebner@tzi.de> |
Kategorie: | V (ECTS: 4) |
Voraussetzungen: | 03-703.01 (Datenbanksysteme)
und 03-710.01 (Künstliche Intelligenz 1) |
Zeit: | Mo 15-17 |
Raum: | MZH 4194 |
Beginn: | 18.4.2005 |
Ende: | 4.7.2005 |
Beschreibung:
In verteilten Umgebungen, wie z.B. dem WWW, firmeneigenen Intranets und jetzt auch dem Semantic Web, ist ein einheitlicher Zugriff auf verschiedene Datenquellen von größter Wichtigkeit. Oftmals wurden diese Datenquellen unabhängig voneinander entwickelt und weisen deshalb sowohl wesentliche Unterschiede in Bezug auf Struktur (z.B. Datenmodell, Schema, Zugriff), als auch in Bezug auf die Bedeutung der Daten auf (Semantik, z.B. Preis mit und ohne MwSt.). Ziel der Datenintegration ist, diese so genannten Heterogenitätskonflikte zu beseitigen, um verwandte Daten zu konsolidieren und zu einer einheitlichen Struktur zur verknüpfen, z.B. um einen Datenaustausch zwischen kooperierenden Firmen zu ermöglichen. Bei der Semantischen Integration gilt es neben den strukturellen Heterogenitätskonflikten besonders die semantischen Konflikte zu beseitigen. Semantische Integration ist immer noch ein manueller und daher sehr fehlerbehafteter Prozess, und deswegen ein erheblicher Flaschenhals in der Anwendung moderner Informationssysteme.
In diesem Seminar werden wir eine Anzahl verschiedener Ansätze zur Semantischen Datenintegration aus der Datenbank- und KI-Literatur betrachten und anhand von Vorträgen und Diskussionen kritisch erörtern. Es wird von allen Teilnehmern erwartet, dass sie mehrere Papiere in englischer Sprache lesen und dazu mindestens einen Vortrag entweder alleine oder in einem Team halten.
Fragestellungen:
- Was sind die wissenschaftlichen Grundlagen der Datenintegration?
- Welche verschiedenen Ansätze der semantischen Datenintegration gibt es?
- Worin unterscheiden sie sich und wann werden sie am sinnvollsten
eingesetzt?
- Welche Annahmen werden gemacht, wie sinnvoll sind diese?
- Nach welchen Kriterien kann man die Ansätze klassifizieren?
- Welche Vor- und Nachteile haben die einzelnen Ansätze?
- Wie gut funktionieren sie in der Praxis?
Termine:
Verwendete Literatur:
- [Farquhar Et Al., 1995]
- Farquhar, A., A. Dappert, R. Fikes and W. Pratt: "Integrating Information Using Context Logic". AAAI 1995 Spring Symposium on Symposium on Information Gathering from Distributed Heterogeneous Environments,AAAI Press, Stanford University, March 1995.
- [Garcia-Molina Et Al., 1997]
- Garcia-Molina, H., Et Al.: "The TSIMMIS Approach to Mediation: Data Models and Languages". Journal of Intelligent Information Systems (JIIS) 8(2), pp. 117-132. 1997.
- [Gruber, 1993]
- Gruber, T. R.: "A Translation Approach to Portable Ontology Specifications". Academic Press. June 1993.
- [Mena Et Al., 1996]
- Mena, E., V. Kashyap, A. Sheth and A. Illarramendi: "OBSERVER: An approach for Query Processing in Global Information Systems based on Interoperation across Pre-existing Ontologies". Proceedings of the 1 st IFCIS International Conference on Cooperative Information Systems (CoopIS ´96), Brussels, Belgium, June 1996.
- [Noy and McGuinness, 2001]
- Noy, Natalya F., and Deborah L. McGuinness: "Ontology Development 101: A Guide to Creating Your First Ontology". Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880, March 2001.
- [Rahm and Bernstein, 2001]
- Rahm, E., and P. A. Bernstein: "A Survey of Approaches to Automatic Schema Matching", VLDB Journal 10, 4 (Dec. 2001), pp. 334-350.
- [Wache, 2003]
- Wache, Holger: "Semantische Mediation für heterogene Informationsquellen". Akademische Verlagsgesellschaft Aka GmbH, Dissertationen zur Künstlichen Intelligenz, Berlin. 2003.
- [Witte, 2005]
- Witte, Jörn: "Automatische Generierung eines Mediators auf Basis einer deklarativen Spezifikation". Universität Bremen. 2005.
Weitere lesenswerte Literatur:
- [Kent, 1988]
- William Kent, "The Many Forms of a Single Fact", Proc. IEEE COMPCON, Feb. 27-Mar. 3, 1989, San Francisco. Also HPL-SAL-88-8, Hewlett-Packard Laboratories, Oct. 21, 1988.