Kritische Werte für den Kolmogorow-Smirnow-Test bei der Exponentialverteilung
Wird der Parameter der Exponentialverteilung geschätzt, so können für den Kolmogorow-Smirnow-Test bei der Exponentialverteilung nicht die üblichen tabellierten kritischen Werte genutzt werden.
Die nachfolgende Tabelle zeigt die entsprechenden kritischen Werte für den Kolmogorow-Smirnow-Test bei der Exponentialverteilung, wenn der Verteilungsparameter aus vorliegenden Datenpunkten geschätzt wurde.
Bei dem Test wird von der Nullhypothese ausgegangen, dass die vorgelegten Daten statistisch durch die Exponentialverteilung beschrieben werden.
Ablehnungs- und Annahmebereich für die Nullhypothese werden bei geschätztem Verteilungsparameter durch kritische Werte getrennt, die rund kleiner als die standardmäßig tabellierten Werte sind.
Darüber hinaus sind diese kritischen Werte auch noch abhängig von der zugrundeliegenden Verteilungsfunktion und im Allgemeinen nicht analytisch berechenbar, vgl. hierzu die Beiträge Kolmogorow-Smirnow-Test bei der Gumbel-Verteilung und Kolmogorow-Smirnow-Test bei der Normal-Verteilung.
Monte-Carlo-Simulationen können dann die benötigten kritischen Werte liefern.
Für den Fall der angepassten Exponentialverteilung wurden für den vorliegenden Beitrag Monte-Carlo-Simulationen durchgeführt und die kritischen Werte für den Anpassungstest in obiger Tabelle notiert.
Gütebewertung mit dem Kolmogorow-Smirnow-Test bei der Exponentialverteilung
Die Nullhypothese wird zu einem Konfidenzniveau bei einer Länge der Datenreihe von Punkten abgelehnt, wenn die Testgröße des Kolmogorow-Smirnow-Tests größer als der entsprechende kritische Wert ist.
Konzentration auf kleine Datenbestände
In vielen Anwendungsbereichen können die vorliegenden Datenreihen zur Anpassung der Exponentialverteilung sehr kurz und damit eine Gütebewertung unerlässlich sein.
Von besonderem Interesse sind kritische Werte für kleine Datenbestände im Bereich von 4 bis 20 Datenpunkten.
Denn je kleiner der vorgelegte Datenbestand, umso ungenauer kann die Anpassung des Parameters der Exponentialverteilung sein und umso wichtiger ist die Überprüfung der Güte der Anpassung.
Daher haben wir uns hier auf diesen Datenumfang konzentriert und die entsprechenden kritischen Werte für den Kolmogorow-Smirnow-Test bei der Exponentialverteilung numerisch bestimmt.
Extrapolation auf größere Datenbestände
Sind mehr als 20 Datenpunkte in dem vorgelegten Datensatz gegeben, kann der Kolmogorow-Smirnow-Test bei der Exponentialverteilung immer noch angewendet werden, wenn die benötigten kritischen Werte simuliert oder aus obiger Tabelle extrapoliert werden.
Eine gute Näherungsformel lässt sich aus folgendem asymptotischen Verhalten der kritischen Werte herleiten:
Angenommen für die Datensätze gilt und sei aus der Tabelle bekannt.
Dann berechnet sich der unbekannte kritische Wert für Datenpunkte gemäß:
Wir setzen jetzt 20.
Somit entsprechen die kritischen Werte zu den verschiedenen Konfidenzniveaus gerade der letzten Zeile in der obigen Tabelle.
Zur Extrapolation der benötigten kritischen Werte für einen Datensatz von Datenpunkten gilt dann die Näherungsformel:
Dokumentation der Monte-Carlo-Simulation
Es wurden für jede in der Tabelle notierte Anzahl von Datenpunkten jeweils 500.000 Monte-Carlo-Simulationen durchgeführt.
In jedem einzelnen Monte-Carlo-Simulationsschritt sind Datenpunkte mit einer Exponentialverteilung erzeugt worden. Der Verteilungsparameter war dabei zwar bekannt, blieb aber für die weiteren Analysen ungenutzt.
Stattdessen wurde jedes Mal eine Anpassung an die erzeugten Datenpunkten vorgenommen und dabei der Verteilungsparameter der Exponentialverteilung berechnet.
Die Anpassung erfolgte mit Hilfe der logarithmierten Maximum-Likelihood-Methode.
Des Weiteren erfolgte eine Berechnung der empirischen Verteilungsfunktion aus den Datenpunkten.
Das Ergebnis jedes Simulationsschritts war der maximale Abstand zwischen der angepassten Exponentialverteilung und der empirischen Verteilungsfunktion
Pro Anzahl an Datenpunkten sind somit 500.000 maximale Abstandswerte zufällig erzeugt worden.
Aus der aufsteigend sortierten Reihe der maximalen Abstände sind zu den entsprechenden Konfidenzniveaus sodann die kritischen Werte für den Kolmogorow-Smirnow-Test bei der Exponentialverteilung entnommen worden.
Vergleich mit anderen Ergebnissen
Lilliefors hat 1969 die kritischen Werte für den Kolmogorow-Smirnow-Test bei der Exponentialverteilung im Zusammenhang mit Datenbeständen von drei bis dreißig Datenpunkten und eine Näherungsformel zur Berechnung der kritischen Werte für darüber hinausgehende Datenbestände angegeben.
Die dort tabellierten kritischen Werte entstammen Monte-Carlo-Simulationen mit einem Umfang von rund 1.000 Simulationen.
Unsere simulierten Werte entsprechen im Rahmen einer Genauigkeit von den von Lilliefors angegebenen Werten.
Shorack et al. stellen Grenzwerte (Percentage Points of Statistic ) und Näherungsformeln zur Verfügung, mit deren Hilfe die benötigten kritischen Werte in sehr guter Approximation berechnet werden können.
Allerdings hat sich in dem Lehrbuch von Shorack et al. in der Tabelle 1 (Part a) auf Seite 239 in der englischen Ausgabe von 1986 ein Vorzeichenfehler in der Approximationsformel eingeschlichen, den es zu berücksichtigen gilt.
Die von uns simulierten Werte entsprechen im Rahmen einer Genauigkeit von den mit der – im Vorzeichen korrigierten – Methode von Shorack et al. approximierten Werten.
Die kritischen Werte beim Kolmogorow-Smirnow-Test - Birkenland
[…] Die kritischen Werte beim Kolmogorow-Smirnow-Test für die Exponentialverteilung: Dokumentation der Berechnung. […]