Extremwertstatistik: Parameterschätzung bei der Gumbel-Verteilung für Vermögensminima eines Portfolios
Wie wir in unserem Beitrag Extremwertstatistik im Portfoliomanagement deutlich gemacht haben, spielt die Gumbel-Verteilung für den Portfoliomanager zur Risikobewertung und zum Risikomanagement eine herausragende Rolle.
Es wurde gezeigt, dass die Gumbel-Verteilung für Minima auf Basis von beobachteten, vergangenen Vermögensminima eine nach vorne gerichtete Risikobewertung für das Risikomanagement erlaubt.
Anhand des Beispiels einer Stiftung wurde diese Vorgehensweise erläutert.
In dem Beispiel lagen dem Portfoliomanager die Wochenendstände eines Stiftungsvermögens der letzten zehn Kalenderjahre vor.
Für jedes Kalenderjahr bestimmte der Portfoliomanager das Vermögensminimum, so dass er eine Datenreihe von zehn Vermögensminima vorliegen hatte und eine Gumbel-Verteilung anpassen konnte.
Der Portfoliomanager konnte damit in seinem Risikoreport für die Stiftung eine Prognose über die mögliche Höhe eines erneuten Vermögensminimums im kommenden Jahr durchführen.
Zentraler Bestandteil zur Erstellung der Prognose war die Anpassung der Gumbel-Verteilung an die beobachteten, vergangenen Vermögensminima.
Ganz allgemein liefert die Anpassung in der Form einer Parameterschätzung im Ergebnis die Parameter der Gumbel-Verteilung.
Neben der Momentenmethode wurde in dem vorgenannten Beitrag auch die Maximum-Likelihood-Methode betrachtet, um eine Parameterschätzung bei der Gumbel-Verteilung durchzuführen.
Die Maximum-Likelihood-Methode soll in diesem Beitrag detaillierter untersucht werden.
Wir wollen zeigen, wie die Parameterschätzung bei der Gumbel-Verteilung aus der Maximum-Likelihood-Methode folgt.
Gumbel-Verteilung für Maxima – Parameterschätzung
Wir stellen der Vollständigkeit halber noch einmal die wesentlichen Formeln für die Gumbel-Verteilung für Maxima zusammen.
Rückblick: Gumbel-Verteilung für Maxima
Die Dichte der Gumbel-Verteilung für Maxima
hat die Form:
In der Dichte beschreibt
den Lageparameter der Dichte und entspricht anschaulich, dem Hochpunkt der Dichte.
Verändert sich , so verschiebt sich die Dichte entlang der
-Achse.
Der Parameter ist ein Streuungsparameter und bestimmt – etwas bildhaft beschrieben – die Breite der Dichte über der
-Achse.
Mit ansteigendem wird die Verteilung flacher und breiter.
Der integrierten Dichte entsprechend, hat die Gumbel-Verteilung für Maxima folgende Gestalt:
Für die Quantilfunktion gelangten wir durch Bildung der Inversen von
zu dem Ausdruck:
Parameterschätzung bei der Gumbel-Verteilung für Maxima
Für die Dichte der Gumbel-Verteilung für Maxima führt die Maximum-Likelihood-Methode auf analytische Ausdrücke, um den Lageparameter und den Streuungsparameter
aus den vorliegenden Messdaten zu bestimmen, vgl. hierzu usable estimators for parameters in Gumbel distribution.
Dort werden die nachfolgenden Zusammenhänge zur Bestimmung der Parameter angegeben, wenn die betrachteten Messdaten Maxima darstellen.
Lageparameter :
Streuungsparameter :
Gumbel-Verteilung für Minima – Parameterschätzung
Im Folgenden wollen wir im Detail zeigen, wie die entsprechenden Parameter der Gumbel-Verteilung für Minima aus den vorliegenden Vermögensminima ermittelt werden können.
Rückblick: Gumbel-Verteilung für Minima
In dem Beitrag Extremwertstatistik im Portfoliomanagement hatten wir durch eine Koordinatentransformation aus der Gumbel-Verteilung für Maxima die Darstellung der Gumbel-Verteilung für Minima hergeleitet.
Als Dichte der Gumbel-Verteilung für Minima erhielten wir nach der Koordinatentransformation:
Die Werte stehen nun für Minima. Weiterhin bezeichnet
den Lageparameter und
den Streuungsparameter.
Der integrierten Dichte entsprechend hat die Gumbel-Verteilung folgende Gestalt:
Für die Quantilfunktion gelangten wir durch Bildung der Inversen von
zu dem Ausdruck:
Dichte, Verteilung und Quantilfunktion der Gumbel-Verteilung sind abhängig von Lage- und Streuungsparameter und
.
Maximum-Likelihood-Methode
Es wird angenommen, dass dem Portfoliomanager vergangene, beobachtete Vermögensminima
vorliegen.
Zur Vorbereitung werden bei freien Parametern und
die Vermögensminima
für
in die Dichte
eingesetzt.
Anschließend wird das Produkt aller Dichten gebildet:
Die Funktion wird als Likelihood-Funktion bezeichnet. Diese Funktion stellt für uns den Ausgangspunkt für die Parameterschätzung bei der Gumbel-Verteilung dar.
Die Grundidee der Maximum-Likelihood-Methode ist – vereinfacht ausgedrückt – denjenigen Parametersatz und
zu finden, der den Wert des Produkts der Dichten maximiert.
Bei der Gumbel-Verteilung ist es günstiger, die Likelihood-Funktion zu logarithmieren, bevor mit der Suche nach dem Maximum von
begonnen wird.
Das Produkt der Dichten geht dann in eine Summe von logarithmierten Dichten über und wir erhalten die logarithmierte Likelihood-Funktion :
Für die Dichte der Gumbel-Verteilung hat die logarithmierte Likelihood-Funktion schließlich folgende Darstellung:
Die Parameter und
der logarithmierten Likelihood-Funktion
sind nun so zu bestimmen, dass
maximal wird.
Dies führt uns auf das bekannte Verfahren der Extremwertsuche für eine Funktion.
Extremwert der logarithmierten Likelihood-Funktion
Wie bei Extremwertproblemen üblich, werden auch hier zur Bestimmung der Extremwerte die partiellen Ableitungen der logarithmierten Likelihood-Funktion gebildet und gleich null gesetzt.
Partielle Ableitung nach dem Lageparameter a :
Mit der Bedingung
folgt die Gleichung
Aus dieser Gleichung lässt sich folgender Zusammenhang herleiten:
Wir formen diesen Ausdruck weiter um:
Die letzte Zeile führt uns auf den gesuchten Ausdruck für den Lageparameter:
(1)
Die Bestimmungsgleichung für den Lageparameter ist noch abhängig von dem unbekannten Schätzer für den Streuungsparameter
.
D. h. wenn wir den Streuungsparameter kennen, können wir den Lageparameter
abschätzen.
Bemerkung: Da die wahren Parameter und
der Gumbel-Verteilung im Allgemeinen unbekannt sind und geschätzt werden müssen, sind die aus den Daten
berechneten Parameter somit lediglich Schätzer für die unbekannten Parameter.
Streng mathematisch müssten die Schätzer mit einem ‚Dach‘ gekennzeichnet werden; z. B. als Schätzer für
.
Damit die Formeln im Rahmen der Parameterschätzung bei der Gumbel-Verteilung einfach bleiben und weil keine Verwechselung auftreten kann, wird hier auf diese Notation verzichtet.
Partielle Ableitung nach dem Streuungsparameter b :
Wir leiten nun die logarithmierte Likelihood-Funktion partiell nach dem Streuungsparameter
ab:
Auch hier soll wieder die Bedingung
gelten.
Daraus folgt nach der Multiplikation mit :
In der letzten Summe der letzten Zeile nutzen wir den oben mit gekennzeichneten Zusammenhang und notieren:
Abschließend wird die letzte Zeile noch nach umgestellt und wir erhalten unsere Endformel zur Schätzung des Parameters
aus den Datenpunkten
:
(2)
Mit wird der empirische Mittelwert der Daten
bezeichnet:
Im Anhang zeigen wir anhand der Hesse-Matrix, dass für den hier berechneten Parametersatz und
die logarithmierte Likelihood-Funktion
tatsächlich ein lokales Maximum besitzt.
Vorgehensweise zur Parameterschätzung bei der Gumbel-Verteilung
In einem ersten Schritt wird der Parameter aus der impliziten Gleichung (2) durch eine numerische Nullstellensuche ermittelt.
In Excel kann das z. B. durch die Funktion ‚Zielwertsuche‘ erfolgen.
Der so aus den Daten geschätzte Streuungsparameter
wird in die Gleichung (1) eingesetzt und der Lageparameter
berechnet.
Zusammenfassung der Ergebnisse der Parameterschätzung bei der Gumbel-Verteilung für Minima
Lageparameter :
Streuungsparameter :
Beispiel: Stiftungsvermögen
Für das Beispiel des Stiftungsvermögens aus dem Beitrag Extremwertstatistik im Portfoliomanagement lagen Vermögensminima der letzten zehn Kalenderjahre vor.
Dort wurde die Parameterschätzung bei der Gumbel-Verteilung mit Hilfe der Maximum-Likelihood-Methode durchgeführt.
Im Ergebnis konnte der Lage- und der Streuungsparameter aus den vorliegenden Daten ermittelt werden.
Die nachfolgende Abbildung zeigt die Dichte der Gumbel-Verteilung des Beispiels.
Die Dichte der Gumbel-Verteilung (rot) überdeckt in der Abbildung einen bestimmten Wertebereich des Stiftungsvermögens und markiert damit die Lage der möglichen minimalen Vermögenswerte im nächsten Kalenderjahr.
Daraus folgt der Schluss: Wenn im nächsten Kalenderjahr ein minimales Stiftungsvermögen auftritt, dann liegt dieses mit hoher Wahrscheinlichkeit irgendwo in der Bandbreite zwischen 4,94 Mrd. Euro und 4,98 Mrd. Euro.
Dargestellt ist zusätzlich die Lage der Minima des Stiftungsvermögens (orange) in den vergangenen zehn Kalenderjahren.
Der Vermögenswert von etwa 4,971 Mrd. Euro markiert das wahrscheinlichste Minimum – mathematisch: Modalwert – des Stiftungsvermögens (weinrot) und ist gleichzeitig der Lageparameter der Verteilung.
Aus der Anpassung der Gumbel-Verteilung an die zehn Minima des Stiftungsvermögens folgte neben dem Lageparameter auch der Streuungsparameter .
Im vorliegenden Fall hat der Streuungsparameter den Wert von etwa 0,005 Mrd. Euro.
In der Abbildung ist der durch den Streuungsparameter bemessene Streubereich symmetrisch um den Lageparameter mit den hellgrünen Strichen verdeutlicht.
Anhang
Die Hesse-Matrix – hinreichende Bedingung für ein Maximum
Wir wollen anhand der Hesse-Matrix zeigen, dass die zuvor durchgeführte Parameterschätzung bei der Gumbel-Verteilung zu einem Maximum der logarithmierten Likelihood-Funktion
führt.
Die Hesse-Matrix besitzt in unserem Fall als Einträge die zweifachen Ableitungen der logarithmierten Likelihood-Funktion
nach den Parametern
und
:
Die Hesse-Matrix selbst ist somit noch abhängig von den Parametern und
.
Der Nachweis, dass die oben im Haupttext geschätzten Parameter und
die logarithmierte Likelihood-Funktion
tatsächlich maximieren, gelingt durch die Überprüfung, dass die Hesse-Matrix
negativ definit ist.
Für den Spezialfall, dass die logarithmierte Likelihood-Funktion lediglich von zwei Parametern abhängt, reicht es zu zeigen, dass
- der erste Eintrag oben links in der Hesse-Matrix negativ und
- die Determinante der Hesse-Matrix positiv ist.
Gelten diese zwei Bedingungen, dann ist unsere Hesse-Matrix negativ definit und wir haben damit eine hinreichende Bedingung für das Vorliegen eines Maximums von .
Die notwendige Bedingung für ein Maximum von war das Verschwinden der jeweils ersten Ableitung von
nach den Parametern
und
.
Diese notwendige Bedingung haben wir bereits im Haupttext angenommen, um die Formeln für die Bestimmung der Parameter und
herzuleiten.
Zweite Ableitungen der logarithmierten Likelihood-Funktion
Die logarithmierte Likelihood-Funktion war:
Die erste Ableitung nach dem Lageparameter war:
Die erste Ableitung nach dem Streuungsparameter war:
Als wichtige Zwischenergebnisse – aus der im Haupttext durchgeführten Herleitung der Formeln für die Parameter und
– können wir folgende drei Zusammenhänge notieren:
Mit diesen Zusammenhängen lassen sich die gesuchten zweiten Ableitungen einfacher formulieren.
Wichtig ist die Reihenfolge: Zuerst die zweite Ableitung durchführen und dann erst die vorgenannten Ersetzungen nutzen.
Partielle Ableitung zweifach nach a :
Partielle Ableitungen erst nach a und dann nach b :
Nach dem Satz von Schwarz entspricht dieser Ausdruck der partiellen Ableitung erst nach und dann nach
.
Also gilt:
Partielle Ableitung zweifach nach b :
Auswertung der hinreichenden Bedingungen für ein Maximum:
Die zweifache Ableitung nach dem Lageparameter ist negativ, weil
als Anzahl der Datenpunkte nur Werte größer als eins annehmen kann und
stets größer als null ist.
Somit ist die erste Teilbedingung bereits erfüllt: Der linke, obere Eintrag in der Hesse-Matrix ist negativ.
Die zweite Teilbedingung war, dass die Determinante der Hesse-Matrix positiv ist.
Wir müssen also zeigen, dass der Ausdruck
positiv ist.
Wir multiplizieren die Terme aus und erhalten:
Wird betrachtet, so strebt der Mittelwert der Daten
gegen den Erwartungswert
.
Für den Erwartungswert hatten wir in dem Artikel Extremwertstatistik im Portfoliomanagement folgenden Zusammenhang gefunden:
Wobei die Euler-Mascheroni-Konstante war.
Wir setzen also für :
Damit können wir den Ausdruck in der letzten Klammer oben durch
ersetzen.
Für die Determinante der Hesse-Matrix kann dann notiert werden:
Wir stellen fest, dass jeder einzelne Terme der Summe positiv ist.
Ebenso sind und
stets positiv, so dass die aus diesen Parametern gebildeten Brüche in der Formel auch positiv sind.
Und auch der einzige kritische Term ist positiv.
Daraus folgt der Schluss: Die Determinante der Hesse-Matrix ist größer als null.
Damit ist insgesamt gezeigt, dass die Parameterschätzung bei der Gumbel-Verteilung für Minima zu Parametern und
führt, die tatsächlich die logarithmierte Likelihood-Funktion maximal werden lässt.
Kolmogorow-Smirnow-Test bei der Gumbel-Verteilung - Birkenland
[…] Die Anpassung erfolgte mit Hilfe der logarithmierten Maximum-Likelihood-Methode. […]
Kolmogorow-Smirnow-Test bei der Normal-Verteilung - Birkenland
[…] Die Anpassung erfolgte mit Hilfe der logarithmierten Maximum-Likelihood-Methode. […]
Kolmogorow-Smirnow-Test bei der Exponentialverteilung - Birkenland
[…] Die Anpassung erfolgte mit Hilfe der logarithmierten Maximum-Likelihood-Methode. […]