Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-3387
Autor(en): Cipriani, Nazario
Titel: Flexible processing of streamed context data in a distributed environment
Sonstige Titel: Flexible Verarbeitung von Kontextdatenströmen in einer verteilten Umgebung
Erscheinungsdatum: 2014
Dokumentart: Dissertation
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-95108
http://elib.uni-stuttgart.de/handle/11682/3404
http://dx.doi.org/10.18419/opus-3387
Zusammenfassung: Nowadays, stream-based data processing occurs in many context-aware application scenarios, such as in context-aware facility management applications or in location-aware visualization applications. In order to process stream-based data in an application-independent manner, Data Stream Processing Systems (DSPSs) emerged. They typically translate a declarative query to an operator graph, place the operators on stream processing nodes and execute the operators to process the streamed data. Context-aware stream processing applications often have different requirements although relying on the same processing principle, i.e. data stream processing. These requirements exist because context-aware stream processing applications differ in functional and operational behavior as well as their processing requirements. These facts are challenging on their own. As a key enabler for the effcient processing of streamed data the DSPS must be able to integrate this speciVc functionality seamlessly. Since processing of data streams usually is subject to temporal aspects, i.e. they are time critical, custom functionality should be integrated seamlessly in the processing task of a DSPS to prevent the formation of isolated solutions and to support exploitation of synergies. Depending on the domain of interest, data processing often depends on highly domain-specific functionalities, e.g. for the application of a location-aware visualization pipeline displaying a three-dimensional map of its surroundings. The application runs on a mobile device and consists of many interconnected operations that form a network of operators called stream processing graph (SP graph). First, the friends’ locations must be collected and connected to their public profile. However, to enable the application to run smoothly for some parts of data processing the presence of a Graphics Processing Unit (GPU) is mandatory. To solve that challenge, we have developed concepts for a flexible DSPS that allows the integration of specific functionality to enable a seamless integration of applications into the DSPS. Therefore, an architecture is proposed. A DSPS based on this architecture can be extended by integrating additional operators responsible for data processing and services realizing additional interaction patterns with context-aware applications. However, this specific functionality is often subject to deployment and run time constraints. Therefore, an SP graph model has been developed which reWects these constraints by allowing to annotate the graph by constraints, e.g. to constrain the execution of operators to only certain processing nodes or specify that the operator necessitates a GPU. The data involved in the processing steps is often subject to restrictions w.r.t the way it is accessed and processed. Users participating in the process might not want to expose their current location to potentially unknown parties, restricting e.g. data access to known ones only. Therefore, in addition to the Wexible integration of specialized operators security aspects must also be considered, limiting the access of data as well as the granularity of which data is made available. We have developed a security framework that defines three different types of security policies: Access Control (AC) policies controlling data access, Process Control (PC) policies influencing how data is processed, and Granularity Control (GC) policies defining the Level of Detail (LOD) at which the data is made available. The security policies are interpreted as constraints which are supported by augmenting the SP graph by the relevant security policies. The operator placement in a DSPS is very important, as it deeply influences SP graph execution. Every stream-based application requires a different placement of SP graphs according to its specific objectives, e.g. bandwidth should not fall below 500 MBit/s and is more important than latency. This fact constrains operator placement. As objectives might conflict among each other, operator placement is subject to trade-offs. Knowing the bandwidth requirements of a certain application, an application developer can clearly identify the specific Quality of Service (QoS) requirements for the correct distribution of the SP graph. These requirements are a good indicator for the DSPS to decide how to distribute the SP graph to meet the application requirements. Two applications within the same DSPS might have different requirements. E.g. if interactivity is an issue, a stream-based game application might in a first place need a minimization of latency to get a fast and reactive application. We have developed a multi-target operator placement (M-TOP) algorithm which allows the DSPS to find a suitable deployment, i.e. a distribution of the operators in an SP graph which satisfies a set of predefined QoS requirements. Thereby, the M-TOP approach considers operator-specific deployment constraints as well as QoS targets.
Ausgehend von typischen Anwendungsszenarien kontextbezogener Anwenungen wurden Anforderungen definiert. Diese Anwendungen stellen besondere Anforderungen und stellen wichtige Kriterien dar, die auf geeignete Weise in Datenstromverarbeitungssystemen unterstützt werden müssen. Für die definierten Anforderungen wurden in einem zweiten Schritt Methoden und Konzepte entwickelt, welche es einem Datenstromverarbeitungssystem erlaubt sich auf die Bedürfnisse kontextbezogener Anwendungen anzupassen und somit eine flexible Verarbeitung der damit zusammenhängenden Kontextdatenströme zu ermöglichen. Es entstand das flexible und erweiterbare Datenstromverarbeitungssystem NexusDS, das besonders auf Bedürfnisse kontextbezogener Anwendungen zugeschnitten ist. Ein besonderes Merkmal ist das flexible Operatormodell, um neue Funktionalität zur Datenverarbeitung in das System integrieren zu können. Zudem kann NexusDS durch die Integration zusätzlicher Dienste funk tional erweitert werden. Da NexusDS ein verteiltes Datenstromverarbeitungssystem ist und die Verarbeitung der Daten Restriktionen, wie einer Beschränkung der Verarbeitung auf bestimmte Rechenknoten unterliegen kann, bietet NexusDS die Möglichkeit, das Deployment den Anwendungsbedürfnissen anzupassen. Insbesondere bietet es auch die Möglichkeit, das Deployment anhand von QoS-Anforderungen anzupassen. Hierzu wird der Verarbeitungsgraph mit entsprechenden Laufzeit und Deployment-Restriktionen annotiert. Beispielsweise lässt sich durch diesen Mechanismus die Ausführung bestimmter Teile des Anfragegraphen auf eine bestimmte administrative Domäne beschränken. Für das automatische Deployment wurde M-TOP vorgestellt, ein multikriterielles Verteilungsverfahren, das QoS-Anforderungen sowie die im Verarbeitungsgraphen definierten Restriktionen geeignet unterstützt und berücksichtigt. M-TOP definiert hierfür Vorverarbeitungsschritte, um die entsprechenden Restriktionen auf Verarbeitungsgraphebene zu berücksichtigen. Die Abbildung auf die zur Verfügung stehende Infrastruktur erfolgt dann unter Anwendung eines genetischen Algorithmus. Dieser wird durch die vorangegangenen Vorverarbeitungsschritte geeignet unterstützt und erreicht gute Platzierungsergebnisse bei gleichzeitiger Reduzierung der Zeit zur Lösungsfindung. Da allerdings auch der Datenzugriff geregelt werden muss, müssen geeignete Zugriffsmechanismen vorhanden sein, um einen kontrollierten Zugriff und eine kontrollierte Verarbeitung der Daten zu gewährleisten. Hierfür bietet NexusDS einen Zugriffskontrolldienst, durch den der Zugriff auf Daten und die Verarbeitung geregelt werden kann. So lassen sich beispielsweise für bestimmte Anwender Positionsinformationen unschärfer machen oder ein Zugriff komplett verwehren, um einen Missbrauch der Daten zu verhindern. Abgeschlossen wird die Arbeit durch die Vorstellung der im Rahmen dieser Arbeit entstandenen Werkzeugunterstützung für Datenstromverarbeitungssysteme. Der NexusDSEditor unterstützt sowohl die Modellierung des technischen Kontextes der einzelnen Systemkomponenten (Operator- und Dienst-Metadaten) als auch die Formulierung entsprechender Verarbeitungsgraphen.
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
diss_final.pdf10,17 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.