Nollahypoteesi
Luonnontieteisiin kuuluu hypoteesien muodostaminen. Hypoteesit ovat aina falsifioitavissa eli kokeelliset tiedot voivat osoittaa hypoteesin vääräksi. Nollahypoteesi vastaa tavallisesti tyypillistä, odotettavissa olevaa tulosta; esimerkiksi ettei kahden mitatun ilmiön välillä ole yhteyttä[1] tai että tietty hoito on tehotonta[2]. Termin esitti ensimmäisenä englantilainen geneetikko ja tilastotieteilijä Ronald Fisher.[3][4]
Tyypillisesti nollahypoteesin yhteydessä käytetään toista, vaihtoehtoista hypoteesia, jossa oletetaan yhteys ilmiöiden välillä. Jerzy Neyman ja Egon Pearson ovat formalisoineet vaihtoehtohypoteesin käsitteen. Sen ei tarvitse olla nollahypoteesin looginen negaatio, mutta se ennustaa kokeen tuloksen, jos vaihtoehtohypoteesi on paikkansapitävä.
On tärkeää ymmärtää, että nollahypoteesia ei voida koskaan todistaa. Kokeellisen datan perusteella nollahypoteesi voidaan vain falsifioida tai jättää falsifioimatta. Jos esimerkiksi kahden ryhmän (esimerkiksi hoitoa saaneiden ja hoitamattomien) vertailu ei paljasta tilastollisesti merkitsevää eroa ryhmien välillä, eroa saattaa silti todellisuudessa olla. Tällaisessa tilanteessa voidaan ainoastaan sanoa, ettei aineisto tarjoa evidenssiä nollahypoteesin hylkäämiselle.[5]
Nollahypoteesin käyttö
Tilastollinen testaus etenee seuraavasti:
- Valitaan testattavalle suureelle x nollahypoteesi ja vaihtoehtoinen hypoteesi, esimerkiksi ja
- Valitaan testin riskitaso, esimerkiksi 5 % tai 1 %
- Lasketaan testisuure tutkittavasta aineistosta, esimerkiksi t-testi
- Verrataan testisuuretta sen jakaumaan olettaen, että nollahypoteesi on tosi. Yleisimpien testisuureiden kriittiset arvot ovat taulukoituna oppi- ja taulukkokirjoissa.
- Hylätään nollahypoteesi, jos testisuure ylittää kriittisen arvon valitulla riskitasolla. Esimerkiksi kaksisuuntaisen suuren otoksen t-testin kriittinen arvo 5 % riskitasolla on noin 1,96. Muutoin nollahypoteesi jää voimaan.
Nollahypoteesin hylkäämiseen voi liittyä kahdenlaisia virheitä:
- Tyypin I virhe syntyy, kun nollahypoteesi on oikein, mutta tilastollinen testi hylkää sen
- Tyypin II virhe syntyy, kun nollahypoteesi on virheellinen, mutta tilastollinen testi hyväksyy sen
Tilastollista testiä suunniteltaessa tyypin I virheen todennäköisyys kiinnitetään (eli valitaan riskitaso) ja tyypin II virhe pyritään minimoimaan.
Ongelmia
Tutkijoilla on usein taipumus jättää julkaisematta tutkimuksia, joissa nollahypoteesi jää voimaan. Yleensä tämä tilanne syntyy, kun lopputulos ei eroa jo aikaisemmin otaksutusta.
Lähteet
- null hypothesis definition Businessdictionary.com. Arkistoitu 4.7.2010. Viitattu 29.7.2010.
- HTA 101: Glossary 8.9.2009. Nlm.nih.gov. Viitattu 29.7.2010.
- Glossary 25.7.2010. Statistics.berkeley.edu. Arkistoitu 8.3.2013. Viitattu 29.7.2010.
- OED quote: 1935 R. A. Fisher, Design Experience ii. 19, "We may speak of this hypothesis as the ‘null hypothesis’, and it should be noted that the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation."
- Can We Accept the Null Hypothesis? stattrek.com. Arkistoitu 22.5.2011. Viitattu 27.5.2011.