Titel:

Eine Cluster-Strategie für Data Mining Probleme in Netzstrukturen

Startseite
english
  
ISBN: 3865506305   ISBN: 3865506305   ISBN: 3865506305   ISBN: 3865506305 
 
  Wir empfehlen:       
 

Eine Cluster-Strategie für Data Mining Probleme in Netzstrukturen

Im Verlauf der letzten Jahre sind in den Unternehmensdatenbanken riesige Datenmengen erfaßt worden, deren tatsächlicher Informationsgehalt vielfach ungenutzt bleibt. Die Wettbewerbsfähigkeit eines Unternehmens wird in Zukunft entscheidend davon beeinflußt, ob es bei anstehenden Entscheidungen oder Planungen in der Lage ist, den tatsächlichen "Wert" bzw. den Informationsgehalt dieser Daten zu erkennen und zu berücksichtigen. In letzter Zeit werden deswegen bei fortschrittlichen Unternehmen moderne Datenanalyse-Techniken eingesetzt, die versuchen, das vorhandene Datendickicht zu durchdringen um die dringend notwendigen Informationen zu extrahieren. Mit Hilfe sogenannter Data Mining-Verfahren werden dabei oftmals auch völlig neue Zusammenhänge oder Wechselwirkungen zwischen Daten aufgedeckt, die in der Regel unbekannt und auf den ersten Blick auch nicht ersichtlich sind.

Im Umfeld Geographischer Informationssysteme (GIS) werden Datenanalysen - wenn überhaupt - noch manuell durchgeführt und z.T. dann auch noch ergebnislos abgebrochen. Der Hauptgrund für diese Situation ist in der Tatsache zu suchen, daß kommerziell verfügbare Data Mining-Werkzeuge nicht in der Lage sind, die komplexen und heterogenen Datenbestände Geographischer Informationssysteme zu analysieren. Die wenigen bekannten GIS-spezifischen Data Mining-Verfahren werden zur Zeit noch im universitären Umfeld erprobt und konzentrieren sich primär auf das Aufdecken von Zusammenhängen zwischen der räumlichen Lage und Sachdaten von Objekten. Wechselwirkungen unter Berücksichtigung von Netztopologien, die das Herzstück vieler geographischer Datenbestände bilden, werden bisher von keinem existierenden Verfahren erkannt.

Im Rahmen dieser Diplomarbeit wurden die theoretischen Grundlagen für ein Clusterverfahren auf Netzstrukturen ausgearbeitet und dieses Verfahren in einem Data Mining-Werkkzeug prototypisch realisiert, sowie abschließend in einer praxisnahen Fallstudie erprobt.

Die schriftliche Ausarbeitung gliedert sich neben der kurzen Einleitung im ersten Kapitel und dem Literaturverzeichnis in sechs weitere Kapitel. Im zweiten Kapitel werden die wichtigsten Grundlagen existierender konventioneller und GIS-spezifischer Data Mining-Verfahren vorgestellt, so daß dem Leser ausreichende Informationen zum Verständnis der nachfolgenden Ausführungen zur Verfügung stehen. Im dritten Kapitel wird dann ein existierendes GIS-spezifisches Verfahren, das Punktobjekte in einer Ebene bezüglich ihres Abstands zu Clustern zusammenfaßt, auf Netzstrukturen übertragen. Dazu werden zunächst die notwendigen theoretischen Grundlagen erarbeitet, um anschließend ein Clusterverfahren auf Netzstrukturen zu definieren, das Knoten- bzw. Kantenobjekte auf Basis einer konfigurierbaren Gewichtsfunktion unter Berücksichtigung der Netztopologie zu Clustern zusammenfaßt. Im vierten Kapitel steht der Entwicklungsprozeß des realisierten Data Mining-Werkzeugs im Mittelpunkt. Hier werden wichtige Hinweise zur Realisierung der zentralen Architekturkomponenten beschrieben. Im fünften Kapitel werden die wichtigsten Schritte zur Bedienung des Prototyps vorgestellt. Im Verlauf der Arbeit wurde der Prototyp bzw. das entwickelte Verfahren bei den Gas- und Elektrizitäts- und Wasserwerken Köln anhand einer realen Problemstellung erfolgreich erprobt. Ein Überblick über dieser Fallstudie befindet sich im sechsten Kapitel. Eine Zusammenfassung und abschließende Bewertung des gesamten Vorgehens findet sich am Ende der Arbeit.

  
Data Mining Techniken im Marketing und Vertrieb. Grundlagen, Methoden und Funktionsweisen (Broschiert)
von Ingo Blum
Siehe auch:
Data Mining. Verfahren, Prozesse, Anwendungsarchitektur
von Helge Petersohn
Customer Relationship Analytics. Praktische Anwendung des Data Mining im CRM
von Peter Neckel
Data Mining. Concepts and Techniques (Morgan Kaufmann Series in Data Management Systems): Concepts and Techniques (Morgan Kaufmann Series in Data Management Systems)
von Jiawei Han
Web Analytics. An Hour a Day
von Avinash Kaushik
 
    
     

Zurück zur Themenseite:
ScientificPublication.com/Startseite/Informatik

Das Setzen von Verweisen (Links) auf diese Seite ist gestattet und bedarf keine vorherige Absprache.
   
  Startseite  |  english  |  Bookmark setzen  |  Webseite weiterempfehlen  |  Copyright ©  |  Impressum