Einschreibeschlüssel: inf16as
Zusammenfassung
- Ziele und Aufgaben: (S.1)
- Exploration
- Suche nach potentiellen Interessantem
- ungerichtete Suche nach Verwertbarem
- Oft als DataMining benannt
- Bestätigende Analyse
- Benötigt eine vorausgehende Vermutung
- Prognose
- Präsentationen
- Exploration
- Zielerreichung durch menschliche Stärken (S.1)
- Menschen können Dinge, die Computer nicht können
- Geschichte (S.2/3)
- Bis 1984 drei Meinungen zur Nützlichkeit
- Tabellen > Graphik
- Tabellen < Graphik
- Tabellen = Graphik
- Grafiken: viele Grafiken haben Vorteile
- Tabellen: ist interpretationsgenauer
- Cognitive Fit (1991)
- Aufgabentypen
- räumlich: Zusammenhänge/Beziehungen erkennen → Verknüpfungen
- symbolisch: diskrete Werte ablesen/extrahieren
- Visualisierunsformen:
- räumlich/kontinuierlich → typischerweise mit Grafiken (z.B. UML)
- symbolisch/diskret → typischerweise mir Tabellen, Listen, Texte
- Wahl der Visualisierungsform abhängig von der gestellten Aufgabe
- Aufgabentypen
- Bis 1984 drei Meinungen zur Nützlichkeit
- Graphische Darstellungen (S.4-33)
- Überblick
- Wertedarstellung im 2D-Koordinatensystem (S.4-9)
- Unterschiedliche Schrittweisen
- Normale (immer gleicher Abstand zwischen Werten)
- Logarithmus
- Problem: ist eher ein Vergleichsmaß
- Prozentuale
- Wahl des Stichzeitpunkts(Vergleichszeitpunkts) kann den Eindruck beeinflussen
- Trendlinien: Simlpe Moving Average (SMA) (“gleitender Durchschnitt”) (S.6)
- Filter gegen Rauschen
- verringert die in einer Datenreihe vorhandene Variation
- eher geeignet für diskrete Werte
- Durchschnitt von N-Vorherigen Werten
- Anwendung
- Alarmfunktion (Funktionswert & GD zu große Differenz)
- Finanzmathematik
- Trendlinien: Exponential Moving Average (EMA) (S.7)
- Entspricht genau dem Tiefpass
- Neue Änderungen stärker berücksichtigt
- reagiert schnell auf zeitnahe Ereignisse
- konvergiert gegen 1, wird aber nie 1
- Trennlinien: MACD (Moving Average Convergence Divergence) (S.8)
- Differenz eines längerfristigen EMAs und eines mittelfristigen EMAs
- Wird gegen Signallinie (kurzfristiger EMA) betrachtet
- Trendfiguren (S.9)
- Unterstützung
- Widerstand
- Trendkanal
- Kombination von Unterstützung & Widerstand
- Kombination von Unterstützung & Widerstand
- Unterstützung
- Unterschiedliche Schrittweisen
- Mehrdimensionale Darstellungen – 3D Darstellung (S.9-16)
- Punkte
- Flächen
- Greyscale-Chart (S.13)
- Schwärzung einer Fläche ist 3. Dimension
- Vorteil: Große Datenmengen erfassbar, schnell zu lesen (überblicklich)
- Nachteil: grob, manchmal anstrengend zu lesen
- Schwärzung einer Fläche ist 3. Dimension
- Area Chart (S.14)
- Anteiligkeit (Fläche) von Teilmengen ist dritte Dimension
- 3D-Bar Chart (S.14)
- Dritte Dimension ist absolut sinnlos!!!
- (am besten nicht benutzen)
- Portfolioanalyse: (S.15)
- Dicke von Kugeln als dritte Dimension
- Punkte
- Mehrdimensionale Darstellungen – Streumatrix/Scatterplottmatrix (S.17-19)
- Gesamtsicht eines n-dimensionalen Merkmalraumes
- nxn-Matrix aus (n²-n) Scatterplots
- Redundante Informationen an der Diagonalen gespiegelten Plots (Achsenvertrauschung)
- Mehrdimensionale Darstellungen – Hybrider Ansatz: 3D-Glyphen (S.20)
- Kombination aus 3D-Scatterplot und Icon-Technik
- 5-Dimensionale Werte in 3-dimensionaler Darstellung
- Mehrdimensionale Darstellungsmethoden – Netz-Profil-Darstellungen (S.21)
- Profil-Darstellung
- Vergleich verschiedener Aspekte, geeignet für sehr sehr viele Dimensionen
- Vergleich verschiedener Aspekte, geeignet für sehr sehr viele Dimensionen
- Netzdarstellung
- Vergleich verschiedener Aspekte, circa bis zu 6 Dimensionen
- Vergleich verschiedener Aspekte, circa bis zu 6 Dimensionen
- Profil-Darstellung
- Mehrdimensionale Darstellung – Ikonographische Methoden (S.22-27)
- Idee
- Icons in ein Koordinatensystem zeichnen
- Zwei Dimensionen pro Achse
- zusätzliche, untergeordnete Dimensionen in das Icon codiert
- V-Icon-Technik
- Vorteil Größenvergleich/Nomierung, unkompliziert
- Open-High-Low-Close-Darstellung (OHLC)
- Candlesticks
- Tendenz durch Färbung:
- schwarz (oder Rot) → oben = Beginn, unten = Ende
- weiß → oben = Ende, unten = Beginn
- Quartil-Darstellung
- Shape Coding
- Attribute füllen einzelne Pixel, werden zu einem Datensatz/Icon
- Datensätze werden zusammen gefasst, (hier: X = Stunde, Y = Tag)
- Attribute füllen einzelne Pixel, werden zu einem Datensatz/Icon
- Color Icons
- Variante 1: Siehe Shape Coding
- Variante 2; keine globalen Koordinaten, jedoch geordnet
- Dadurch Cluster (ähnliche Objekte) erkennbar
- Rekursiv anwendbar
- Icons nach Durchschnitt sortieren und selbes Muster erneut anwenden
- Idee
- Mehrdimensionale Darstellungsmethoden – Icons für stark explorative Aufgaben
(S.27-30)
- Chernoff-/Semantic Faces
- Vorteile
- Clustererkennung möglich
- viele Dimensionendarstellbar (durch Augen/Nasen/...)
- Nachteile
- MEthode muss erlernt werden
- keine Diskreten Werte
- Nur geringe Datenmengen darstellbar
- Cluster leiten Daten bezüglich X & Y ab
- Stick Figures
- Länge und Gliedmaßen (Länge, Winkel) codieren Daten
- Vorteil:
- mehr Daten, bis zu 1000
- Cluster gut erkennbar
- Nachteil:
- Methode muss "erlernt” sein
- Werte nicht direkt ablesbar
- Hauptkoordinaten notwendig
- Bsp.:
- Chernoff-/Semantic Faces
- Mehrdimensionale Darstellungsmethoden – Mosaik-Metaphern (S.30-33)
- Unterteilung der Dimensionen in Maiskolben (und nein, ich scherze NICHT)
- Überblick