Aktuelle Anwendungen - offene Fragen

SE MANTiCS 2014 in Leipzig - 500 Experten aus aller Welt Von Dipl.-Ing. Uwe Emmrich-Kießling

Im September gab es in Leipzig ein Stelldichein der créme de la créme des Semantic Web – von Experten auch als Web 3.0 bezeichnet – anlässlich der internationalen Konferenz SEMANTiCS 2014. Diese fand am 4. und 5. September im Leipziger Kubus, dem Konferenz- und Bildungszentrum des UFZ im Wissenschaftspark Leipzig in der Permoserstraße, statt. Bereits an den Tagen vorher fanden an verschiedenen Orten in der Stadt Workshops zu Themen des Semantic Web statt.

Insgesamt über 500 Experten aus aller Herren Länder, aus Theorie und Praxis – Forschung und Wirtschaft – trafen sich, um sich über die neuesten Entwicklungen und Forschungsergebnisse, aber auch aktuelle Anwendungen und offene Probleme sowie zukünftige Entwicklungstrends auszutauschen.

In seiner einleitenden Grundsatzrede, mit der die Konferenz am Donnerstagmorgen eröffnet wurde, fasste Phil Archer, Data Activity Lead beim WorldWideWeb Consurtium (W3C), unter dem Titel „10 Years of Achievement“ die Geschichte des Semantic Web zusammen. Als die Entwicklung vor nunmehr 25 Jahren begann, stieß sie zunächst auf große Skepsis, doch heute existiert bereits eine große Bandbreite von sehr einfachen bis zu sehr komplexen Anwendungen dieser Technologie, deren Ziel es ist, die Arbeit mit Informationen im Web effektiver zu machen. Das Semantic Web ist die einzige Technologie, die einer Lösung des Problems der automatischen Datenverarbei tung in Bezug auf „Wissen“ nahekommt, indem sie Daten aus verschiedenen Quellen zueinander in Beziehung setzt.

Heute ist das Semantic Web bereits ein kommerzieller Erfolg, mit dem echtes Geld verdient wird. Schon 21% aller Seiten im Web beinhalten semantische Daten, und der Anteil wächst ständig. In Zukunft wird es immer mehr darum gehen, die Vorteile von Produkten, die auf dem Semantic Web basieren, zu kommunizieren, anstatt über die Technologie zu reden.

Allerdings gibt es noch einen Mangel an Fachleuten, was auf noch fehlende Ausbildungsmöglichkeiten zurückzuführen ist. Webentwickler müssen mit dem Semantic Web vertraut gemacht werden, damit sie diese Technologie in ihren Projekten einsetzen können. Das W3C bekennt sich klar zum Semantic Web und wird sich auch in Zukunft intensiv mit der Entwicklung von Standards auf diesem Gebiet beschäftigen. Anschließend wurden in parallelen „Tracks“ in verschiedenen Räumen des Kubus einzelne Themengebiete wie z. B. „Big Data“, „e-Commerce“, „Knowledge Management“ oder „Semantic Tools“ usw. vertieft.

Nach der Mittagspause setzte sich die Konferenz mit parallelen Tracks fort, nunmehr zu Themen wie „Visualization And User Experience“, „Knowledge Discovery“ oder „Publishing and Libraries“ sowie verschiedenen praktischen Beispielen, die vorgestellt wurden. Zahlreiche Beiträge der Konferenz kamen übrigens aus dem Umfeld von Bibliotheken, Standardisierungsinstitutionen (DIN) oder Rundfunkanstalten (z. B. BBC), die mit Hilfe der semantischen Technologien ihre Inhalte besser zugänglich und zielgerichtet nutzbar machen wollen. In einer Keynote sprach Orri Erling von OpenLink Software über Virtuoso – The Prometheus of RDF. RDF ist ein Standardmodell für den Datenaustausch im Web. Es ist generisch, minimalistisch, selbstbeschreibend und flexibel abfragbar. Im Gegensatz zu relationalen Datenbankmodellen behält es seine Bedeutung, wenn es in eine andere Umgebung übertragen wird. Erling sieht Herausforderungen bei Flexibilität, Performance und Skalierbarkeit von Anwendungen. Die schlechte Performance, für die RDF oft gerügt wird, komme zu 90% von schlechten query plans, wie z. B. die Verwendung von joins für jede einzelne property.

Mit RDF werden Daten in sog. Triples gespeichert. Ein Triple benennt eine Beziehung zwischen zwei „Dingen“ und natürlich die „Endpunkte“ dieser Beziehung. Diese Speicherung hat Nachteile, denn sie erfordert joins, Korrelationen und umfangreiches Indexing. Virtuoso versucht, diesen Nachteilen beizukommen u. a. durch die Verwendung sog. column store Technologie. Dabei werden Daten nicht wie in herkömmlichen Datenbanksystemen zeilenweise, sondern spaltenweise gespeichert. Zudem wird, wo es sinnvoll ist, durchaus auch in Tabellen gespeichert. Die RDF Semantik bleibt dabei gewahrt. Das Mantra lautet: „structure is servant, not tyrant“ oder: „do the job, forget dogma“... So erzielt Virtuoso eine Performanceparität mit relationalem Datenbanksystemen und proklamiert für sich die Führerschaft in linked data.

Am zweiten Tag war ein Vortrag über „Healthcare Information Systems“ zu hören, der am Beispiel des Projektes Health- Direct aus Australien die Anwendung semantischer Technologie erläuterte, um auf einer einheitlichen Plattform, aber über spezialisierte Seiten, Informationen über gesundheitliche Fragen der Bevölkerung in dem großen, und oft dünn besiedelten Land zur Verfügung zu stellen, wo der nächste Arzt oder die nächste Apotheke oft hunderte Kilometer entfernt sind. In diesem Projekt zeigte sich eine der Herausforderungen, vor denen die Implementierung semantischer Technologien oft steht, nämlich die sehr spezifische Terminologie eines Fachgebietes (hier: Medizin und Latein) sowie „industry jargon“, was die Anwendung allgemeiner oder bereits vorhandener Ontologien erschwert.

Ein Beispiel für eine Anwendung in der Industrie lieferte der Vortrag über das „Oerlikon Metco Knowledge Portal“. Dieses Projekt eines Unternehmens, das sich mit Oberflächenbehandlung in verschiedenen Anwendungen und Technologien befasst, basiert auf einer MS Sharepoint Infrastruktur, verwendet die Semantic Applications for Sharepoint, und liefert ein überzeugendes Beispiel, wie sich semantische Technologien in eine bestehende Kommunikations- und Kooperationsinfrastruktur einfügen lassen.In einer weiteren Keynote kurz vor dem Ende der Konferenz beschäftigte sich Thomas Kelly von der Firma Cognizant mit „Enterprise Semantic Technology“. Er betonte, dass die Zeit gekommen sei, von einzelnen Projekten in Unternehmen zu unternehmensweiten Ansätzen bei der Anwendung semantischer Technologien überzugehen, mithin, zu „industrialisieren“. Dazu dient die Schaffung eines semantic technology competence center, um Industrieontologien zu verwenden und zu erweitern, bestehende Investitionen in relationalen Datenbanktechnologien auszubauen durch semantische Technologien, die Brücken zwischen relationalen Datenbanken schlagen. Er sieht einen unbefriedigten Bedarf nach der Verbindung und Anwendung organisationsübergreifender Daten. Dabei muss die Öffnung des Zugriffs auf Daten mit der Sicherung des Zugriffs auf Daten einhergehen, um nicht autorisierte Zugriffe zu verhindern. Es brauche neue Lösungen mit beschleunigtem Nutzen, besserer Anwendung und reduziertem Risiko.

Abschließend gab es noch einen Track zum Thema „Towards Linked Data Driven Economy For Europe“, das angesiedelt ist unter der großen Überschrift Horizont 2020 (H2020). Unter Horizont 2020 werden alle forschungs- und innovationsrelevanten Förderprogramme der Europäischen Kommission zusammengeführt. Tim Heuss von der University of Plymouth beschäftigte sich darin einleitend mit der Frage, weshalb es momentan noch so ist, dass die Anzahl der Datasets die Anzahl der Anwendungen übersteigt. Es fehle noch an „Apps“ für Endanwender mit einem echten Nutzwert. Hier sind Entwickler aufgerufen, sich mit dem Thema Semantic Web zu beschäftigen und diese Technologie in neuen, nutzwertigen Apps einzusetzen, und so dem Semantic Web zum endgültigen Durchbruch zu verhelfen. Aber auch Anwendungen für Regierungsbehörden und die Industrie werden noch mehr benötigt. Hierzu müsse auch die Standardisierung semantischer Technologien noch weiter vorangetrieben werden. 

Zurück