Hierarchische Aggregationsebene

Zeitreihen-Hierarchien

Beim Arbeiten mit Zeitreihen ist zunächst eine geeignete Definition der Zeitreihen zu finden. Dies beinhaltet, neben der Granularität beispielsweise, auch die Wahl einer geeigneten hierarchischen Ebene, auf welche die Daten aufsummiert (aggregiert) werden sollen. Der Begriff der hierarchischen Ebene soll mit nachfolgendem Beispiel veranschaulicht werden.

Ein Unternehmen hat Daten über den Verkauf seiner Produkte. Es werden die Artikelbezeichnung, die verkaufte Menge, die Kunden und das Verkaufsdatum erfasst:

ArtikelbezeichnungVerkaufsdatumMengeKunde
Artikel12020-01-0110Kunde1
Artikel12020-01-015Kunde2
Artikel12020-01-016Kunde3
Artikel12020-01-0210Kunde1
Artikel12020-01-027Kunde4
Artikel12020-01-0320Kunde1
Artikel12020-01-0410Kunde1
Artikel12020-01-0520Kunde1
Artikel22020-01-012Kunde5
Artikel22020-01-022Kunde5
Artikel22020-01-032Kunde5
Artikel22020-01-042Kunde5
Artikel22020-01-052Kunde5
............

Für die Definition von Artikelzeitreihen bieten sich hier verschiedene hierarchische Ebenen an. Die tiefste hierarchische Ebene entspricht der Definition einer Zeitreihe als Verkaufszahlen eines Artikels pro Kunde. Diese Definition führt zur Bildung von Zeitreihen, die sich anhand der ganzen verfügbaren Merkmale (Artikelbezeichnung, Verkaufsdatum, Menge, Kunde) unterscheiden.

Eine höhere hierarchische Ebene ist die Zeitreihe von Artikelverkaufszahlen wobei über alle Kunden summiert wird. Es ergibt sich dem obigen Beispiel folgend:

ArtikelbezeichnungVerkaufsdatumMenge
Artikel12020-01-0121
Artikel12020-01-0217
Artikel12020-01-0320
Artikel12020-01-0410
Artikel12020-01-0520
Artikel22020-01-012
Artikel22020-01-022
Artikel22020-01-032
Artikel22020-01-042
Artikel22020-01-052
.........

Das Merkmal Kunde ist bei diesem Schritt verloren gegangen.

Um Zeitreihen bilden zu können bedarf es mindestens einer Zeitinformation und eines dazu passenden Wertes. Somit entspricht die Zeitreihe der höchsten hierarchisch Ebene in unserem Beispiel der gesamten Verkaufsmenge.

VerkaufsdatumMenge
2020-01-0123
2020-01-0219
2020-01-0322
2020-01-0412
2020-01-0522

Wahl von hierarchischen Ebenen

Je höher die hierarchische Ebene ist, auf welche die Daten aggregiert werden, desto größer ist der Informationsverlust. Jedoch gibt es weitere Kriterien, die bei der Wahl einer geeigneten hierarchischen Ebene zu beachten und abzuwägen sind.

Motivation

Ein wesentlicher Punkt ist die generelle Motivation die hinter der Datenanalyse steckt. Primär sollte das Ziel sein, die Daten auf einer hierarchischen Ebene zu aggregieren, welche für nachfolgende Analysen von Interesse ist. Sind mehrere Ebenen von Interesse, so bieten sich mehrere Möglichkeiten. Falls auf der tiefsten Zielebene gearbeitet wird, so können Ergebnisse auf höheren Ebenen mittels Aggregation erzeugt werden. Im umgekehrten Fall müssen Zeitreihen von einer höheren Ebene erst auf die darunterliegenden Ebenen heruntergerechnet (disaggregiert) werden. Zuletzt können Analysen und Vorhersagen auch parallel auf verschiedenen Ebenen erarbeitet werden.

Prognostizierbarkeit

Die Wahl einer hierarchischen Ebene hat große Auswirkungen auf Charakteristiken der damit verbundenen Zeitreihen. Es besteht oftmals ein starker Zusammenhang zwischen gewählter hierarchischer Ebene und Prognostizierbarkeit, also über die voraussichtliche Güte der Vorhersagen.

Auf unteren Ebenen, wie zum Beispiel Artikel-Kunden Ebene, kann das Kaufverhalten einzelner Kunden sehr sporadisch sein und damit können auch die resultierenden Zeitreihen sehr verrauscht und sporadisch sein. Aggregiert man jedoch die Zeitreihen über alle Kunden hinweg, so können die entstehenden Artikel Zeitreihen starke saisonale Muster oder Trends aufweisen. Diese Charakteristiken können bei der Wahl der Artikel-Kunden Ebene verloren gehen.

Performance

Auch die Performance kann ein maßgeblicher Punkt bei der Wahl der Aggregationsebene sein. Die Laufzeit von Prozessierungsschritten hängt eng mit der Anzahl an zu prozessierenden Zeitreihen ab. Je tiefer also die gewählte hierarchische Ebene liegt, desto mehr Zeitreihen können generiert werden und desto größer kann der nachfolgende Prozessierungsaufwand werden.

Eindeutigkeit

Die Beziehung von Zeitreihen unterschiedlicher hierarchischer Ebenen muss nicht immer eindeutig sein. Entscheidet man sich beispielsweise für die Aggregationsebenen Artikel-Kunde und Artikel-Kunden_Standort, so muss nicht immer eine eindeutige Beziehung zwischen den resultierenden Zeitreihen bestehen (ein Kunde kann beispielsweise Niederlassungen in mehreren Ländern haben). Uneindeutige Beziehungen machen zusätzliche Regeln beim Aggregieren und Disaggregieren notwendig.

Hierarchische Prognosen

Unter Hierarchischen Prognosen versteht man Vorhersagen, die die unterschiedlichen Charakteristiken und Abhängigkeiten der einzelnen hierarchischen Ebenen berücksichtigen.

Die Disaggregation anhand von Mengenanteilen kann als hierarchische Prognose Methode verstanden werden. Dazu sagt man beispielsweise die Verkaufsmengen auf Artikel-Ebene vorher und disaggregiert auf Artikel-Kunden-Ebene, wobei man den Anteil jedes Kunden aus dessen Verkaufshistorie ermittelt.

Komplexere hierarchische Prognosemethoden treffen Vorhersagen auf allen hierarchischen Ebenen. Zusätzlich wird versucht den Prognosefehler auf jeder Ebene kleinzuhalten und dabei zueinander konsistente Vorhersagen zu liefern (Aufaggregieren der unteren Ebene liefert obere Ebene).

Sie sind dabei, unsere Webseite über einen externen Link zu verlassen. Bitte beachten Sie, dass der Inhalt der verlinkten Seite außerhalb unserer Kontrolle liegt.

Cookies und andere (Dritt-)Dienste

Diese Website speichert Cookies auf Ihrem Computer nur, wenn Sie dem ausdrücklich zustimmen. Bei Zustimmung werden insbesondere auch Dritt-Dienste eingebunden, die zusätzliche Funktionalitäten, wie beispielsweise die Buchung von Terminen, bereitstellen. Diese Cookies und Dienste werden verwendet, um Informationen darüber zu sammeln, wie Sie mit unserer Website interagieren, und um Ihre Browser-Erfahrung zu verbessern und anzupassen. Zudem nutzen wir diese Informationen für Analysen und Messungen zu unseren Besuchern auf dieser Website und anderen Medien. Weitere Informationen zu den von uns verwendeten Cookies und Dritt-Diensten finden Sie in unseren Datenschutzbestimmungen.