Hajontaluku
Hajontaluku on tilastotieteessä todennäköisyysjakauman hajonnan eli sen satunnaismuuttujan vaihtelun mitta.[1] Yleisimpiä hajontalukuja ovat keskihajonta, varianssi, otoskeskihajonta, otosvarianssi, kvantiili ja variaatiokerroin. [2] Hajontaluvut ovat keskilukujen ohella keskeisimpiä jakaumiin liittyviä käsitteitä.[1]
Hajonnan mittaaminen
Hajontaluku on reaaliluku, joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman satunnaismuuttujien arvoissa esiintyy. Yleensä tämä lasketaan mittaamalla havaittujen arvojen etäisyyttä havaintoarvojen odotus- tai keskiarvosta. Käytettävän hajontaluvun valinta riippuu käyttötarkoituksesta; eri hajontaluvut sopivat eri tilanteisiin riippuen, pyritäänkö tarkastelemaan jakauman absoluuttista vaiko suhteellista hajontaa. Jos otannassa ei ole vaihtelua, hajontaluku saa arvon nolla.[1]
Joskus hajontaa kuvattaessa käytetään mittauksen kohteen kanssa samaa yksikköä. Jos mittauksen kohteen yksikkö on esimerkiksi kilogramma, myös hajonnan yksikkönä käytetään kilogrammaa. Tällöin hajontalukua voi käyttää hajonnan absoluuttisten arvojen tarkasteluun. Tällaisia hajonnan mittoja ovat:
- Keskihajonta
- Otoshajonta
- Vaihteluväli
- Kvantiili- ja kvartiiliväli
- Mediaanin absoluuttinen keskipoikkeama (MAD)
Yksiköttömät hajontaluvut kuvaavat suhteellista hajontaa satunnaismuuttujan odotusarvoon nähden. Usein nämä voidaan ilmaista prosentteina. Tällöin on mahdollista vertailla myös eri yksiköissä ilmaistujen jakaumien hajontoja. Yksiköttömiä hajontalukuja ovat:
- Variaatiokerroin
- Hajonnan kvartiilikerroin
Muita hajontalukuja ovat:
Yleisimmät hajontaluvut
Varianssi
- Pääartikkeli: Varianssi
Varianssi kuvaa, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin neliöjuurta sanotaan keskihajonnaksi.
Diskreetin jakauman varianssi lasketaan kaavalla
, jossa X on satunnaismuuttuja ja μ on sen odotusarvo tai keskiarvo.[3]
Keskihajonta
- Pääartikkeli: Keskihajonta
Satunnaismuuttujan standardipoikkeama eli keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Keskihajonta on varianssin neliöjuuri: .[2][3] Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.
Otosvarianssi
Otosvarianssi on varianssi, joka lasketaan suuremman joukon osajoukosta. Kun n lukuarvon joukko on suuremman joukon Y osajoukko, tämän otosvarianssi on , missä on tutkittavan muuttujan y keskiarvo.[3]
Otoshajonta
- Pääartikkeli: Otoshajonta
Otoksen keskihajonnan harhaton estimaatti eli otoshajonta on otosvarianssin neliöjuuri:
- .[3]
Kvantiiliväli
Kvantiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Satunnaismuuttujan -kvantiili , , on luku, joka toteuttaa ehdot ja .[1]
Jakamalla todennäköisyysjakauman kertymäfunktio q kappaleeseen yhtä suuria joukkoja saadaan q-kvantiili. Osalle kvantiileista on vakiintuneet nimet: 100-kvantiilit ovat persentiilejä, 10-kvantiilit ovat desiilejä, 5-kvantiilit ovat kvintiilejä, ja 4-kvantiilit ovat kvartiileja. Kvantiilien avulla on mahdollista muodostaa kvantiiliväli, joka kuvaa todennäköisyyttä, jolla satunnaismuuttuja saa arvot kahden eri kvantiilin välillä.[1]
Variaatiokerroin
Variaatiokerroin on hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla on mahdollista vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin on määritelty keskihajonnan ja keskiarvon osamääränä:
Käyttötarkoituksia
Hajonnan avulla on mahdollista saada kattavampi käsitys satunnaismuuttujan todennäköisimmistä arvoista. Esimerkiksi joukkojen ja lukuja arpomalla saadaan alkioiden arvojen yhtäsuuresta odotusarvosta huolimatta hyvin erilaisia tuloksia. Tunnettujen hajontalukujen avulla onkin mahdollista arvioida erilaisten tapahtumien todennäköisyyksiä, mikä on keskeistä muun muassa riskienhallinnassa.
Fysiikassa, kemiassa ja muissa mitattavissa luonnontieteissä mittaustulosten vaihtelua tarkastelemalla on mahdollista arvioida koetulosten luotettavuutta.
Biologiassa populaation ominaisuuksien määrittämisessä on keskeistä huomioida havaittujen ominaisuuksien vaihtelu.
Rahoitusmatematiikassa portfolion odotetun tuoton varianssi ja keskihajonta kuvaavat sijoitukseen kohdistuvaa riskiä. Mitä pienempi hajonta on, sitä todennäköisemmin sijoituksesta saatu tuotto vastaa sen odotusarvoa ja sitä houkuttelevampi sijoituskohde on.
Taloustieteessä, rahoituksessa ja muissa tieteissä hajontaa pyritään selittämään regressioanalyysillä, joka kuvaa muuttujan saamia arvoja suhteessa toiseen muuttujaan.[5]
Lähteet
- Milton, J.S., Arnold, J.C.: Introduction to Probability and Statistics. McGraw-Hill Inc., 1995.
- Hajontaluvut Yhteiskuntatieteellinen tietoarkisto. 31.08.2003. Tampereen yliopisto. Viitattu 10.4.2015.
- Ilkka Mellin: Tilastolliset menetelmät: Kaavat. TKK, 2006.
- Nummenmaa, Lauri: Käyttäytymistieteiden Tilastolliset Menetelmät.. Tammi, 2004. ISBN 951-26-5203-X..
- Alan O. Sykes: Introduction to Regression Analysis The Inaugural Coase Lecture. Arkistoitu 7.2.2015. Viitattu 10.04.2015.