Bolada-proba
Bolada-proba edo Wald Wolfowitzen bolada-proba bi balioko segida bat zorizkoa edo independentea den erabakitzeko erabiltzen den hipotesi-proba ez-parametriko bat da. Proba burutzeko, boladak edo ondoz ondoko balio berdinen segidak kontatzen dira. Bolada kopurua zorizkotasun hipotesi nuluaren pean espero daitezkeenak baino nabarmen gehiago edo gutxiago badira, hipotesi nulua baztertu eta segida zorizkoa ez dela edo datuek dependentzia-mota bat erakusten dutela erabaki behar da. Proba Abraham Wald eta Jacob Wolfowitz estatistikariek asmatu zuten 1940 urtean.
Bolada-proba aldagai dikotomikoetarako
Aldagai dikotomikoak bi balio bakarrik hartzen dituzten aldagaiak dira (adibidez, sexua, akasgabe/akastun, azterketa bat gainditu/ez gainditu). Bolada-proba datu dikotomikoetan oinarritzen da, datuak jaso diren ordenan boladak edo balio bereko ondoz ondoko datu segidak zenbatuz. Adibidez, industria-prozesu batean ekoiztutako piezak akasgabeak (0) edo akastunak (X) diren jaso da:
- X00X0000X00000XXXXX
Aurreko segidan 7 bolada daude: X-00-X-0000-X-00000-XXXXX.
Datuak zoriz jaso badira edo segida independentziaz suertatu bada, bolada kopurua ez da ez handiegia ez txikiegia izango. Izan ere,
- bolada gutxi badaude, akastunak eta akasgabeak oro har batera gertatu eta beraz, akasgabe ondoren akasgabe eta akastun ondoren akastun suertatzeko joera (beraz, zorizkotasun-eza) dagoela baieztatu ahal izango da;
- bolada asko badaude, akastunak eta akasgabeak txandakatzeko joera dagoela baiezta daiteke, akasgabe ondoren akastun eta akastun ondoren akasgabe suertatzeko joera (beraz, zorizkotasun-eza) dagoela baieztatu ahal izango da.
Hipotesi nulu moduan zorizkotasuna harturik, bolada-proba alde bikoa da: bolada kopurua txikia nahiz handia denean baztertuko da zorizkotasuna eta independentzia. Zorizkotasuna baztertzea dakarten balio kritikoak ematen dituzten taulak badaude.
Bolada kontrastea aldagai jarraituetarako
Bolada-proba aldagai jarraituetan aplikatzeko, datuen mediana kalkulatu eta, jaso diren ordenan, medianatik gora (+) edo behera (-) dauden sailkatzen dira. Era horretan, aldagai dikotomiko bat eskuratuko da. Adibidez, lantegi bateko eguneko ekoizpen datuak jaso dira:
- 45,26,36,40,39,32,28,25,24,22,18,17
Mediana 27 da. Beraz, datuak 27tik behera edo gora dauden sailkatuz:
- + - + + + + + - - - - -
Aldagai dikotomiko horretan 4 bolada daude. Aski da jaso diren datu-kopuruetarako balio kritikoa tauletan bilatzea, 4 balioak zorizkotasuna onartzera edo baztertzera daraman erabakitzeko.
Lagin-tamaina handiak
Taulak aldagai dikomotikoaren balio kopuru mugatuetarako eratzen dira, gehienetan 20ra bitartekoak. Hortik aurrera, zorizkotasunaren hipotesi nulupean R bolada kopuruen probabilitateak kalkulatzeko hurbilketa normala erabil daiteke:
Proba alde bikoa denez, lagineko bolada kopuruaren probabilitatea, norabide egokian, adierazgarritasun-mailaren erdiarekin alderatu beharko da erabakia hartzeko.
Kanpo estekak
- (Ingelesez) Bolada-probarako balio kritikoen taulak