Khi-karratuaren proba
Estatistikan, doikuntzaren egokitasunerako khi-karratuaren proba datu multzo baten probabilitate eredu batekiko doikuntzaren egokitasunari buruz erabakitzen duen proba estatistiko bat da, khi-karratu estatistikoan oinarritzen dena. Probak balio edo balio-tarte bakoitzeko maiztasun enpiriko eta teorikoen arteko aldea hartzen du oinarrittzat, khi-karratu estatistikoaren bitartez, erabakia hartzeko: aldea txikia bada, hipotesi nulua onartu eta eredua datuetara doitasunez egokitzen dela erabaki behar da; aldea handia bada, berriz, probabilitate ereduaren berezko aldakortasunarengantik gertatu ez eta ereduaren egokitzapenaren doitasun ezari dagozkiola erabakitzen da. Khi-karratu estatistikoak kalkulatrzen duen aldearen adierazgarritasuna khi-karratu banaketaren bitartez aztertzen da, hipotesi nulupean estatistikoa banaketa horri jarraiki banatzen baita.
Proba probabilitate eredu jarraitu zein diskretuetarako erabil daiteke. Eredu jarraituetan datuak tartetan biltzen dira maiztasunak eratzeko.
Adibideak
Probabilitate berdintasunerako proba bat
Jogurt berri baterako lau aukera eman zaie dastatzeko 60 bezero potentzialeko talde bati eta lauetatik zein nahiago duten galdetu zaie. A, B, C eta D aukerak nahiago izan dituztenak 20, 14, 12 eta 14 dira, hurrenik hurren. Lau aukerak berdintsuak edo probabilitate berekoak direla baiezta al daiteke %10eko adierazgarritasun-maila batez?
Aukerak Maiztasun enpirikoak: Oi Probabilitatea: pi Maiztasun teorikoak: Ei (Oi-Ei)2/Ei A 20 0.25 0.25×60=15 1.666 B 14 0.25 0.25×60=15 0.066 C 12 0.25 0.25×60=15 0.600 D 14 0.25 0.25×60=15 0.066 Totalak 50 1 50 2.398
Estatistikoaren emaitza da, khi-karratu banaketa bateko 90. pertzentilarekin alderatu behar da, gainetik %10eko probabilitatea (adierazgarritasun maila) utziz, askatasun-maila kopurua 4-1 (4 jogurt edo datu-klase - 1) izanik:
betetzen denez, khi-karratu estatistikoak maiztasun enpiriko eta teorikoen artean duen aldea, probabilitate berdintasuna ezartzen duen hipotesi nulupean, ez da aski handia eta beraz probabilitate berdintasuna onartu egiten da: lau jogurt aukerak neurri berean nahiago direla erabaki behar da.
Eredu diskretu baten egokitasuna
100 egunetan zehar egunero gertatzen den matxura kopurua jaso da (datu gordinak 0, 0, ..., 1, ... izango lirateke):
Matxura kopurua 0 1 2 3 >3 Egun kopurua 21 19 15 20 25
Eguneko matxura kopurua Poissonen banaketari jarraiki gertatzen dela esan al daiteke, adierazgarritasun maila %10 izanik?
Poissonen banaketak ezartzen dituen probabilitateak kuantifikatzeko parametroa zenbatetsi behar da lehenbizi. Ohiko zenbateslea batezbesteko aritmetikoa da (3 baino handiagoak diren datuen balio adierazgarri gisa 5 balioa hartu da, jatorrizko daturik ezean):
Parametroaren zenbatespen honekin, ereduaren probabilitate zehatzak eman daitezke. Poissonen banaketaren probabilitate funtzioa erabiliz:
Probabilitateak kalkulaturik, khi-karratu estatistikoa kalkulatzeari ekiten zaio:
Matxura kopuruak Maiztasun enpirikoak: Oi Probabilitatea: pi Maiztasun teorikoak: Ei (Oi-Ei)2/Ei 0 21 0.096 0.096×100=9.6 13.537 1 19 0.225 0.225×100=22.5 0.544 2 15 0.264 0.264×100=26.4 4.922 3 20 0.205 0.205×100=20.5 0.012 >3 25 0.208 0.208×100=20.8 0.848 Totalak 25 1 25 19.863
Kasu honetan, ereduaren parametro bat datuetatik zenbatetsi denez, erreferentzia gisa hartu beharreko khi-karratu banaketak 5-1-1 (5 klase - 1 zenbatespen - 1) askatasun-maila ditu, zenbatespenaren balioaren erabilerak askatasun-maila bat gutxiago uzten baitu:
betetzen denez, hipotesi nuluak baieztatzen duen Poissonen eredua baztertu behar da eta beraz, datuetarako bestelako probabilitate-eredu bat zehaztu behar da.
Eredu jarrai baten egokitasuna
Eredua jarraia denean, datuak tartetan bildu behar dira.
Ikasle talde bati matematika-test bat proposatu zaie. Izandako puntuazioak hauek dira:
Puntuazioa 0-20 20-40 40-60 60-80 80-100 Ikasleak 2 14 34 38 12
%10eko adierazgarritasun mailaz datuetara banaketa normala doi egokitzen den erabaki behar da.
Banakuntza normalaren probabilitateak kalkulatzeko, batezbestekoa eta desbidazio estandarra zenbatetsi behar dira:
Datuek konfirmatu beharreko eredu normal zenbatetsia hau da: . Eredu honetatik probabilitateak zehaztuko dira.
Puntuazioak Maiztasun enpirikoak: Oi Probabilitatea: pi Maiztasun teorikoak: Ei (Oi-Ei)2/Ei 0-20 2 0.02 0.02×100=2 0 20-40 14 0.14 0.14×100=14 0 40-60 34 0.37 0.37×100=37 0.243 60-80 38 0.34 0.34×100=34 0.470 80-100 12 0.13 0.13×100=13 0.077 Totalak 100 1 100 0.79
Balio hau 5-2-1=2 askatasun maila dituen khi-karratu banaketaren 90. pertzentilarekin alderatu behar da, zenbatespenek bi askatasun-maila kentzen dituztelako: . Estatistikoaren balioa txikiagoa denez, hipotesi nulua onartu eta beraz, eredu normala egokitzat jotzen da.