Kritische Werte
für den Kolmogorow-Smirnow-Test bei der Normal-Verteilung
Werden die Parameter der Normal-Verteilung geschätzt, so können für den Kolmogorow-Smirnow-Test bei der Normal-Verteilung nicht die üblichen tabellierten kritischen Werte genutzt werden.
Die nachfolgende Tabelle zeigt die entsprechenden kritischen Werte für den Kolmogorow-Smirnow-Test bei der Normal-Verteilung, wenn die Verteilungsparameter aus vorliegenden Datenpunkten geschätzt worden sind.
Bei dem Test wird von der Nullhypothese ausgegangen, dass die vorgelegten Daten statistisch durch die Normal-Verteilung beschrieben werden.
Ablehnungs- und Annahmebereich für die Nullhypothese werden bei geschätzten Verteilungsparametern durch kritische Werte getrennt, die rund kleiner als die standardmäßig tabellierten Werte sind.
Darüber hinaus sind diese kritischen Werte auch noch abhängig von der zugrundeliegenden Verteilungsfunktion und im Allgemeinen nicht analytisch berechenbar.
Monte-Carlo-Simulationen können dann die benötigten kritischen Werte liefern.
Für den Fall der angepassten Normal-Verteilung wurden für den vorliegenden Beitrag Monte-Carlo-Simulationen durchgeführt und die kritischen Werte für den Anpassungstest in obiger Tabelle notiert.
Gütebewertung mit dem Kolmogorow-Smirnow-Test bei der Normal-Verteilung
Die Nullhypothese wird zu einem Konfidenzniveau bei einer Länge der Datenreihe von
Punkten abgelehnt, wenn die Testgröße
des Kolmogorow-Smirnow-Tests größer als der entsprechende kritische Wert
ist.
Konzentration auf kleine Datenbestände
In vielen Anwendungsbereichen können die vorliegenden Datenreihen zur Anpassung der Normal-Verteilung sehr kurz und damit eine Gütebewertung unerlässlich sein.
Von besonderem Interesse sind kritische Werte für kleine Datenbestände im Bereich von 4 bis 20 Datenpunkten.
Denn je kleiner der vorgelegte Datenbestand, umso ungenauer kann die Anpassung der Parameter sein und umso wichtiger ist die Überprüfung der Güte der Anpassung.
Daher haben wir uns hier auf diesen Datenumfang konzentriert und die entsprechenden kritischen Werte für den Kolmogorow-Smirnow-Test bei der Normal-Verteilung numerisch bestimmt.
Extrapolation auf größere Datenbestände
Sind mehr als 20 Datenpunkte in dem vorgelegten Datensatz gegeben, kann der Kolmogorow-Smirnow-Test bei der Normal-Verteilung immer noch angewendet werden, wenn die benötigten kritischen Werte simuliert oder aus obiger Tabelle extrapoliert werden.
Eine gute Näherungsformel lässt sich aus folgendem asymptotischen Verhalten der kritischen Werte herleiten:
Angenommen für die Datensätze gilt und
sei aus der Tabelle bekannt.
Dann berechnet sich der unbekannte kritische Wert für Datenpunkte gemäß:
Wir setzen jetzt 20.
Somit entsprechen die kritischen Werte zu den verschiedenen Konfidenzniveaus gerade der letzten Zeile in der obigen Tabelle.
Zur Extrapolation der benötigten kritischen Werte für einen Datensatz von Datenpunkten gilt dann die Näherungsformel:
Dokumentation der Monte-Carlo-Simulation
Es wurden für jede in der Tabelle notierte Anzahl von Datenpunkten jeweils 500.000 Monte-Carlo-Simulationen durchgeführt.
In jedem einzelnen Monte-Carlo-Simulationsschritt sind Datenpunkte mit einer Normal-Verteilung erzeugt worden. Die Verteilungsparameter waren dabei zwar bekannt, blieben aber für die weiteren Analysen ungenutzt.
Stattdessen wurde jedes Mal eine Anpassung an die erzeugten Datenpunkten vorgenommen und dabei der Lage- und der Streuungsparameter der Normal-Verteilung
berechnet.
Die Anpassung erfolgte mit Hilfe der logarithmierten Maximum-Likelihood-Methode.
Des Weiteren erfolgte eine Berechnung der empirischen Verteilungsfunktion aus den Datenpunkten.
Das Ergebnis jedes Simulationsschritts war der maximale Abstand zwischen der angepassten Normal-Verteilung
und der empirischen Verteilungsfunktion
Pro Anzahl an Datenpunkten sind somit 500.000 maximale Abstandswerte
zufällig erzeugt worden.
Aus der aufsteigend sortierten Reihe der maximalen Abstände sind zu den entsprechenden Konfidenzniveaus sodann die kritischen Werte für den Kolmogorow-Smirnow-Test bei der Normal-Verteilung entnommen worden.
Vergleich mit anderen Ergebnissen
Lilliefors hat 1967 die kritischen Werte für den Kolmogorow-Smirnow-Test bei der Normal-Verteilung im Zusammenhang mit Datenbeständen von vier bis dreißig Datenpunkten und eine Näherungsformel zur Berechnung der kritischen Werte für darüber hinausgehende Datenbestände angegeben.
Die dort tabellierten kritischen Werte entstammen Monte-Carlo-Simulationen mit einem Umfang von rund 1.000 Simulationen.
Unsere simulierten Werte entsprechen im Rahmen einer Genauigkeit von 5 % den von Lilliefors angegebenen Werten.
Shorack et al. stellen Grenzwerte (Percentage Points of Statistic ) und Näherungsformeln zur Verfügung, mit deren Hilfe die benötigten kritischen Werte in sehr guter Approximation berechnet werden können.
Die von uns simulierten Werte entsprechen im Rahmen einer Genauigkeit von den mit der Methode von Shorack et al. approximierten Werten.
Kolmogorow-Smirnow-Test bei der Exponentialverteilung - Birkenland
[…] Darüber hinaus sind diese kritischen Werte auch noch abhängig von der zugrundeliegenden Verteilungsfunktion und im Allgemeinen nicht analytisch berechenbar, vgl. hierzu die Beiträge Kolmogorow-Smirnow-Test bei der Gumbel-Verteilung und Kolmogorow-Smirnow-Test bei der Normal-Verteilung. […]