Loading…
Thumbnail Image

Eine offene Architektur für die agentenbasierte, adaptive, personalisierte Informationsfilterung

Lommatzsch, Andreas

Im Informationszeitalter stellt das Auffinden von auf die individuellen Benutzerpräferenzen abgestimmten Informationen einen entscheidenden Erfolgsfaktor dar. Um die Relevanz von Informationen zu beurteilen, müssen unterschiedliche Bewertungskriterien herangezogen werden, die jeweils auf die persönlichen Vorlieben des Benutzers und den Kontext der Suche abgestimmt sind. Im Rahmen dieser Arbeit werden die Anforderungen an ein adaptives personalisiertes Informationssystem motiviert und eine Architektur entwickelt, die die gestellten Anforderungen erfüllt. Die Architektur ermöglicht die Integration heterogener Datenquellen, die Berücksichtigung einer großen Anzahl von Bewertungskriterien sowie das Kombinieren der Bewertungen, um optimierte Dokumentenmengen zusammenzustellen. Die Auswahl und Kombination der für eine Informationsanfrage eingesetzten Algorithmen und Komponenten erfolgt jeweils unter Berücksichtigung des jeweiligen Suchszenarios, der verfügbaren Ressourcen und der individuellen Präferenzen des Benutzers. Die Architektur ermöglicht es, die von unterschiedlichen Quellen stammenden Dokumente umfassend (d. h. inhaltsbasiert, kollaborativ, personalisiert, auf Basis von semantischem Wissen) zu bewerten und die Dokumente für eine optimale Präsentation mit zusätzlichen Informationen (Metadaten) anzureichern. Auf Basis der Metadaten und der Bewertungen werden die Dokumente bezüglich verschiedener Gütefunktionale optimierter Ergebnismengen zusammengestellt. Schwerpunkte der Arbeit bilden Verfahren zum Bewerten von Dokumenten und Methoden zum Kombinieren von Bewertungen, die von unterschiedlichen Bewertungsstrategien stammen. Darüber hinaus werden Verfahren zur Unterstützung des Benutzers beim Erstellen und Optimieren von Informationsanfragen entwickelt. Die Leistungsfähigkeit der Verfahren wird anhand von Benutzerfeedback und Benchmarkdatensätzen evaluiert. Auf der Basis der entworfenen Architektur wurden unter Verwendung eines Multi-Agentenframeworks für verschiedene Anwendungsbereiche optimierte Informationssysteme entwickelt. Es wird gezeigt, dass die Informationssysteme die gestellten Anforderungen bezüglich Qualität der Ergebnisse, Offenheit für neue Algorithmen sowie der Adaptivität an individuellen Benutzerpräferenzen und den Suchkontext erfüllen. Das einheitliche Bewerten von aus unterschiedlichen Quellen stammenden Informationen und die adaptive Kombination der Bewertungen ermöglicht das zuverlässige Ermitteln von für den Benutzer relevanten Dokumenten.
As today the amount of accessible information is overwhelming and still growing, the intelligent and personalized filtering of available information constitutes a main challenge. In order to assess the relevance of a document a wide variety of criteria must be considered while taking into account individual user preferences and the context of the search. This thesis analyzes typical information retrieval scenarios and derives the requirements for an adaptive personalized information system. Since existing information systems possess various disadvantages, the architecture for an information system is developed that allows the integration of heterogeneous sources, various relevance measurement methods as well as strategies for assembling optimized result sets. The system components are modeled as intelligent agents, which enables the adaption to future requirements and the integration of new components at runtime. Information requests are delegated to the most appropriate agents, in consideration of the individual user preferences, the available system resources and the search context. The proposed architecture ensures that documents from heterogeneous information sources (such as search engines, recommender systems, and databases) are evaluated uniformly. This is accomplished by employing diverse rating strategies (such as semantic, collaborative, content based and personalized rating algorithms). For an optimal presentation, the documents are enriched with various metadata so as to enable the user to understand and exploit the results of a particular query. On the basis of the comprehensive set of ratings, document sets are assembled optimized according to personalized quality criteria. Furthermore, this thesis analyzes components for assessing documents and methods for combining various rating strategies in detail. Moreover, algorithms aiming to support the user with the generation and optimization of queries are discussed. The methods and algorithms are evaluated both with regard to user feedback and benchmark datasets. Based on the proposed architecture, several information systems are implemented optimized for specific domains and scenarios. The evaluation of these systems shows that the developed framework meets the requirements according to flexibility, result quality and personalization. The generation of optimized result sets which are based on the comprehensive relevance criteria ensures personalized high quality search results.