Kolmogorov-Smirnov proba
Estatistikan, Kolmogorov-Smirnov proba, laburtuta K-S proba, lagin bat dimentsio bakarreko probabilitate banaketa jakin bati jarraitzen dion (lagin bakarreko K-S proba) edota bi lagin homogeneoak edo populazio berekoak diren (bi lagineko K-S proba) erabakitzeko proba edo kontraste estatistiko bat da. K-S proba egokitzapenaren doitasunerako proba ez parametriko bat da.
K-S probak erabiltzen duen estatistikoa da banaketa funtzioen arteko distantzia maximoa da:
- probabilitate banaketaren banaketa funtzioaren eta laginaren banaketa-funtzio enpirikoaren arteko distantzia maximoa, lagin bakarreko K-S probaren kasuan, edota
- bi lagineko K-S probaren kasuan, dagozkien banaketa funtzio enpirikoen arteko distantzia maximoa.
Hipotesi nulupean, laginak emandako probabilitate banaketari jarraitzen dio (lagin bakarreko K-S proba) edota bi laginak populazio berekoak dira (bi lagineko K-S proba). Horrela, kalkulaturiko distantzia maximoa erreferentziazko balio bat baino handiagoa bada, hipotesi nulua baztertu eta laginak ezarritako banaketari jarraitzen ez diola (lagin bakarreko K-S proba) edota bi laginak populazio ezberdinekoak direla (bi lagineko K-S proba) erabaki behar da, erreferentziazko balioak datu kopuruaren eta aurrez ezarritako errore maila baterako. [1]
Kanpo estekak
- Aurrez ezarri beharreko errorea hipotesi nulua egia izanik, bera baztertzeko probabilitatea da.