Prognoseverfahren / Forecast-Methoden (spezifische Methoden)
Diese Übersicht bietet einen Einblick in die gängigsten Prognosemethoden, angefangen bei klassischen statistischen Verfahren über Machine-Learning-Ansätze bis hin zu modernen Foundation-Modellen. Sie dient als Leitfaden, um die grundlegende Funktionsweise und Logik der verschiedenen Forecasting-Modelle besser nachvollziehen zu können. Die hier aufgeführten Verfahren stellen dabei eine Auswahl der praxisrelevanten Methoden dar.
Naive Prognose
Die naive Prognose ist ein einfaches, intuitives Prognoseverfahren. Für die Prognose wird der aktuellste Wert der vorliegenden Zeitreihe konstant in die Zukunft fortgeschrieben.
Gleitender Mittelwert (Moving Average)
Der gleitende Mittelwert ist ein einfaches, intuitives Prognoseverfahren. Um eine Prognose zu erstellen, wird aus aktuellen Datenpunkten der gegebenen Zeitreihe (z. B. den aus allen Datenpunkten des letzten Quartals) das arithmetische Mittel errechnet und konstant in die Zukunft fortgeschrieben. Die Anzahl der aktuellen Datenpunkte, die bei der Mittelung berücksichtigt werden soll, wird als Ordnung des gleitenden Mittelwerts bezeichnet und ist à priori zu definieren. Ein Spezialfall des gleitenden Mittelwerts ist die naive Prognose (Gleitender Mittelwert der Ordnung 1).
Autoregressive Integrated Moving Average (ARIMA)
Ein ARIMA-Modell (ARIMA = Autoregressive Integrated Moving Average) ist ein Modell zur Analyse und Prognose von Zeitreihen, in das vergangene Werte der Zeitreihe selbst sowie vergangene Fehlerterme eingehen. Die Analyse kann hierbei statt auf den Rohdaten auch auf (mehrfach) differenzierten Daten stattfinden. Saisonalitäten sowie exogene Einflussgrößen können in ARIMA-Modellen ebenfalls mitmodelliert werden.
Exponentielle Glättung mit Kovariaten (ESCov)
Das Verfahren der exponentiellen Glättung ist ein bewährtes Verfahren zur Analyse und Prognose von Zeitreihen, welches Niveau-, Trend - und multiple Saisonkomponenten in Betracht ziehen kann. Hierbei werden weiter zurückliegende Zeitreihenwerte üblicherweise weniger stark gewichtet als die jüngere Historie. Die Erweiterung „Exponentielle Glättung mit Kovariaten“ (Exponential Smoothing with Covariates) kann zusätzlich mit exogenen Einflussgrößen umgehen.
TBATS
TBATS ist ein von De Livera, Hyndman & Snyder (2011) entwickelte Erweiterung der exponentiellen Glättung, die insbesondere bei komplexen Saisonalitätsmustern ihre Vorteile ausspielt. Die Saisonmodellierung erfolgt hierbei über Fourieranalyse und trigonometrische Funktionen. Der Name TBATS ist ein Akronym, das die Fähigkeiten des Verfahrens gut zusammenfasst: trigonometrische Funktionen zur Modellierung multipler Saisonalität (T), Box-Cox Transformation (B), ARMA-Fehlermodellierung (A), Trend (T), Saisonalität (S).
Croston-Methode (Croston)
Croston ist eine Prognosemethode für sporadische Zeitreihen. Das Verfahren wurde 1972 von Croston zur Vorhersage von sporadischen Artikelbedarfen vorgeschlagen. Hierbei werden die Höhe von Bedarfsereignissen (= Nicht-Nullwerte der Zeitreihe) sowie die Dauer zwischen zwei aufeinanderfolgenden Ereignissen (= Nullerintervalle) getrennt voneinander modelliert, in der Regel mittels exponentieller Glättung, und daraus anschließend eine Prognose abgeleitet.
Neben der klassischen Version von Croston gibt es mittlerweile mehrere Erweiterungen und Varianten des Verfahrens, wie z. B. die Teunter-Syntetos-Babai-Methode (TSB).
Teunter-Syntetos-Babai-Methode (TSB)
TSB ist eine von Teunter, Syntetos and Babai (2011) entwickelte Erweiterung von Croston, die zwei nachteilige Aspekte der Originalvariante adressiert und überwindet:
- Positiver Bias in den Vorhersagen
- Trägheit bei auslaufenden Bedarfsereignissen (Obsoleszenz)
Im Wesentlichen geschieht dies dadurch, dass TSB von der Modellierung der Dauer zwischen zwei Ereignissen (Nullerintervalle) zu Eintrittswahrscheinlichkeiten übergeht.
Machine-Learning beim Forecasting
Auch Machine-Learning-Verfahren können zum Forecasting verwendet werden und bieten gerade bei versteckteren bzw. vielschichtigen Mustern sowie einer Vielzahl von Einflussfaktoren einen Vorteil gegenüber klassischen Ansätzen wie ARIMA und Exponentielle Glättung. Um die Strukturen der Datenhistorie und zeitliche Effekte modellieren zu können, wird in der Regel eine selektierte Menge an verschiedenen zeitverzögerten Ist-Werten sowie spezifisch aufbereiteten Features verwendet. Diese verschiedenen Eingangsgrößen umfassen insbesondere Trendkomponenten und saisonale Indikatoren, um zyklisch wiederkehrende Muster innerhalb der Datenstruktur abzubilden.
Spezifische Machine-Learning-Verfahren finden sich hier.Foundation-Modelle für Zeitreihen
Foundation-Modelle, die auf den Fortschritten des Deep Learning und insbesondere der Transformer-Architektur basieren, haben auch in der Prognoseanwendung an Bedeutung gewonnen. Ein wesentlicher Vorteil von Foundation-Modellen liegt in ihrer Fähigkeit zur Generalisierung und Anpassung an neue Zeitreihen. Dabei lassen sich unterschiedliche Ansätze unterscheiden, wie diese Modelle für die Prognose eingesetzt werden können:
- Zero-Shot-Vorhersage: Foundation-Modelle können aufgrund ihres umfangreichen Vortrainings auf vielfältigen Datensätzen Prognosen für völlig neue Zeitreihen erstellen, ohne dass sie explizit auf diese trainiert wurden. Somit erhält man in wenigen Sekunden selbst bei langen Zeitreihen genaue Vorhersagen. Die Zero-Shot-Vorhersage stellt die Hauptanwendung von Foundation-Modellen in der Zeitreihenprognose dar.
- Few-Shot-Vorhersage: Mit nur wenigen Beispielzeitreihen können Foundation-Modelle adaptiert werden, um sich schneller an die spezifischen Charakteristika dieser Zeitreihen anzupassen. Dies ermöglicht eine genauere Anpassung des Modells und potenziell genauere Prognosen im Vergleich zur Zero-Shot-Vorhersage, ohne umfangreiches Training (Finetuning) zu erfordern.
- Full-Shot-Vorhersage: Wie bei traditionellen Machine-Learning-Modellen können auch Foundation-Modelle mit einem großen Datensatz verschiedener Zeitreihen trainiert werden. Dieser Ansatz zielt darauf ab, die höchste Güte für diese spezifischen Zeitreihen zu erzielen, indem das Modell vollständig auf deren historische Daten trainiert wird. Allerdings findet die Full-Shot-Anwendung in der Praxis eher selten statt, da der Aufwand für das Training (Finetuning) solch großer Modelle enorm ist und oft nicht im Verhältnis zum potenziellen Leistungsgewinn steht.
Architektonisch existieren verschiedene Ansätze für Foundation-Modelle in der Zeitreihenprognose. Anfänglich wurden oft vortrainierte Sprachmodelle verwendet, jedoch hat sich gezeigt, dass Modelle, die ausschließlich auf Zeitreihendaten trainiert werden, tendenziell bessere Ergebnisse erzielen. Darüber hinaus gibt es unterschiedliche Modelle, die auch multivariate Vorhersagen und die Integration von Kovariaten ermöglichen. Weiterführende Informationen zu Foundation-Modellen im Kontext der Zeitreihenvorhersage finden sich in der Übersichtsstudie von Liang et al. (2024), hier abrufbar. Im Allgemeinen können Foundation-Modelle auch in anderen Bereichen eingesetzt werden.
Jetzt