Kolmogorow-Verteilung
Die Kolmogorow-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die als Grenzverteilung einer Teststatistik des Kolmogorow-Smirnow-Anpassungstests für einen über alle Grenzen wachsenden Stichprobenumfang auftritt.
Definition
Eine stetige Zufallsvariable heißt Kolmogorow-verteilt, falls sie die Verteilungsfunktion
hat.[1][2] Die zugehörige Wahrscheinlichkeitsverteilung heißt Kolmogorow-Verteilung.
Eigenschaften
Eine alternative Summendarstellung der Verteilungsfunktion[3][4] ist
Diese alternative Darstellung ist für numerische Berechnungen in bestimmten Fällen günstiger.[3]
Für eine Kolmogorow-verteilte Zufallsvariable gilt
Die Zufallsvariable hat den Erwartungswert
und die Varianz
Anwendung
Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die -Quantile der Kolmogorow-Verteilung für sind näherungsweise .[5]
Eine Approximation der Verteilungsfunktion ergibt sich, wenn nur der erste Summand für verwendet wird,
Das -Quantil der Kolmogorow-Verteilung ergibt sich dann näherungsweise als Lösung der Gleichung . Dies führt zur Näherungsformel
- ,
die zu Werten führt, die bis zur dritten Nachkommastelle mit den oben angegebenen Tabellenwerten übereinstimmen. Manchmal wird diese Formel angegeben, ohne klarzustellen, dass es sich um eine doppelte Approximation handelt.[6] Die asymptotische Verteilung wird für endlichen Stichprobenumfang verwendet und dabei wird nur die Approximation der Kolomogorow-Verteilung verwendet. Wie der Vergleich der Funktionen und in der Abbildung zeigt, ist die Approximation zur Quantilbestimmung nur für hinreichend kleine Werte von , z. B. für , anwendbar. Insbesondere ist die Approximation keine Verteilungsfunktion.
Theoretischer Hintergrund
Die reellwertigen Zufallsvariablen seien stochastisch unabhängig und identisch verteilt mit der stetigen Verteilungsfunktion .
- Dann hängt die Wahrscheinlichkeitsverteilung der Stichprobenfunktion
- wobei
- die zufällige empirische Verteilungsfunktion bezeichnet, nicht von ab. ist also bezüglich der Klasse aller stetigen Verteilungsfunktionen eine verteilungsfreie Statistik.
- Außerdem konvergiert die Folge in Verteilung gegen die Kolmogorow-Verteilung, es gilt daher
- .
ist die Teststatistik des Kolmogorov-Smirnov-Anpassungstest für den Stichprobenumfang . Sie heißt auch Kolmogorow-Smirnow-Statistik. Es gibt Tabellen für Quantile der Verteilung von .[7]
Für große Stichprobenumfänge können die Quantile der Kolmogorow-Verteilung verwendet werden.[5] Es gibt eine Tabelle für Werte der Verteilungsfunktion der Kolomogorov-Verteilung.[8]
Literatur
- Kevin Ford: From Kolmogorov’s theorem on empirical distribution to number theory. In: Eric Charpentier, Annick Lesne, Nikolai Kapitonowitsch Nikolski (Hrsg.): Kolmogorov’s Heritage in Mathematics. Springer, Berlin / Heidelberg 2007, ISBN 978-3-540-36349-1, S. 97–108, doi:10.1007/978-3-540-36351-4_5.
- A. Kolmogoroff: Sulla determinazione empirica di una legge di distribuzione. In: Giornale dell’Istituto italiano degli attuari. Band IV, Nr. 1, 1933, S. 83–91 (italienisch, sbn.it).
- A. Kolmogorov: On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 106–113, doi:10.1007/978-1-4612-4380-9_10 (Übersetzt aus dem Italienischen von Quirino Meneghini, 1990).
- P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Kolmogorow-Verteilung, S. 188–189, 627.
- M. A. Stephens: Introduction to Kolmogorov (1933) On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 93–105, doi:10.1007/978-1-4612-4380-9_9.
Einzelnachweise und Anmerkungen
- Die leicht abweichende Darstellung
- Eine - vermutlich fehlerhafte – Darstellung der Verteilungsfunktion mit anstelle von findet sich in den beiden folgenden Quellen:
- N. Smirnov: Table for estimating the goodness of fit for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 279–281, S. 279, JSTOR:2236278.
- William Feller: On the Kolmogorov-Smirnov limit theorems for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 177–186, S. 178, JSTOR:2236265.
- Anirban DasGupta: Asymptotic Theory of Statistics and Probability. Springer, New York 2008, ISBN 978-0-387-75970-8, S. 425, doi:10.1007/978-0-387-75971-5.
- Jaroslav Hájek, Zbyněk Šidák, Pranab K. Sen: Theory of Rank Tests. 2. Auflage. Academic Press, San Diego et al. 1999, ISBN 978-0-12-642350-1, S. 247, doi:10.1016/B978-0-12-642350-1.X5017-6.
- Robert J. Serfling: Approximation Theorems of Mathematical Statistics. Wiley, New York 1980, ISBN 0-471-21927-4, S. 62.
- Galen R. Shorack, Jon A. Wellner: Empirical Processes with Applications in Statistics. Wiley, New York 1986, S. 142 (Unveränderter Nachdruck: SIAM, Philadelphia 2009, ISBN 978-0-89871-684-9).
- Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188.
- William Feller: On the Kolmogorov-Smirnov limit theorems for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 177–186, S. 178, JSTOR:2236265.
- Z. B. Lexikon der Stochastik: Tafel XIII B: Kolmogorow-Test: Quantile der Kolmogorow-Verteilung. S. 627.
- Lothar Sachs, Jürgen Hedderich: Angewandte Statistik. Methodensammlung mit R. 17. Auflage. Springer Spektrum, Berlin / Heidelberg 2018, ISBN 978-3-662-62293-3, S. 496, doi:10.1007/978-3-662-62294-0.
- Z. B. Lexikon der Stochastik: Tafel XIII A: Kolmogorow-Test: Quantile . S. 625–626.
- N. Smirnov: Table for estimating the goodness of fit for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 279–281, JSTOR:2236278. Diese Tabelle wurde zuerst abgedruckt in N. Smirnov: On the estimation of the discrepancy between empirical curves of distribution for two independent samples. In: Bulletin Mathématique de l'Université Moscou. Band 2, Nr. 2, 1939. Die Tabelle ist wiederabgedruckt auf S. 143 in Galen R. Shorack, Jon A. Wellner: Empirical Processes with Applications in Statistics. Wiley, New York 1986 (Unveränderter Nachdruck: SIAM, Philadelphia 2009, ISBN 978-0-89871-684-9).