Moodi (tilastotiede)
Moodi (Mo) eli tyyppiarvo[1] on havaintoaineiston useimmin esiintyvä arvo tai luokitellun aineiston luokkakeskus, jolla on suurin frekvenssi eli esiintymistiheys.
Moodi on aritmeettisen keskiarvon ja mediaanin ohella keskiluku, jolla ilmaistaan tietoa satunnaismuuttujasta tai populaatiosta. Kvalitatiivista muuttujaa kuvatessa moodi on keskiluvuista käyttökelpoisin, koska luvuilla ei ole järjestystä eikä määrätyn arvon voida sanoa olevan toiseen verrattuna enempää "keskellä". Kvantitatiivisessa aineistossa moodi kuvaa aineistoa parhaiten, jos jakauma ei ole kovin epäsäännöllinen.[2]
Aritmeettisen keskiarvon, mediaanin ja moodin vertailu
Tyyppi | Kuvaus | Esimerkki | Tulos |
---|---|---|---|
Aritmeettinen keskiarvo | Joukon jäsenten summa jaettuna sen jäsenten lukumäärällä: | (1+2+2+3+4+7+9) / 7 | 4 |
Mediaani | Mediaani on järjestetyn joukon keskimmäinen alkio. | 1, 2, 2, 3, 4, 7, 9 | 3 |
Moodi | havaintoaineiston useimmin esiintyvä arvo. | 1, 2, 2, 3, 4, 7, 9 | 2 |
Käyttöesimerkki
Kommuunissa asuu 6 henkilöä: 4 naista ja 2 miestä. Muuttuja "sukupuoli" jakaantuu arvoihin "nainen" (frekvenssi 4) ja "mies" (frekvenssi 2). Arvot "mies" ja "nainen" eivät ole lukuja, minkä vuoksi keskiarvon laskeminen ei ole mahdollista. Niillä ei ole määrättyä järjestystä, eikä näin ollen myöskään mediaania. Aineiston ainoa mielekäs keskiluku on moodi, joka kuvaa aineiston dominoivaa arvoa. Moodi on "nainen".
Luokitellun aineiston moodi
Luokitellun aineiston tapauksessa moodi kuvaa frekvenssiltään suurinta luokkaa. Tasavälisellä luokituksella frekvenssijakauman moodi on siinä luokassa, jota vastaava frekvenssi on suurin tai sitä vastaava histogrammi saavuttaa maksiminsa. Vastaavasti, kun luokitus ei ole tasavälinen, ei myöskään jakauman moodi välttämättä ole suurimman frekvenssin luokassa. [3]
Moodi havaintoarvojen jakauman kuvaajana
Luokittelemattomassa aineistossa moodi on sen muuttujan arvo, jonka frekvenssi on suurin [2]. Havaintoarvojen jakauman ollessa symmetrinen ja yksihuippuinen, havaintoarvojen keskiluvut moodi, mediaani ja aritmeettinen keskiarvo ovat identtiset [4]. Kahden identtisen huippuarvon esiintyessä kyseessä on kaksihuippuinen (bimodal) aineisto ja molemmat arvot ovat aineiston moodeja. Useamman kuin kahden arvon esiintyessä korkeimmalla tiheydellä kutsutaan havaintoaineistoa monihuippuiseksi (multimodal). Aineistolla ei sanota olevan moodia, jos yksikään arvo ei toistu. [5]
Moodi ja vinous
Aritmeettisen keskiarvon M, mediaanin Me ja moodin Mo asettuminen vinossa, jatkuvan muuttujan frekvenssijakaumassa.[3]
(i) Vasemmalle vinoilla jakaumilla
- M < Me < Mo
(ii) Symmetrisillä jakaumilla
- M ≈ Me ≈ Mo
(iii) Oikealle vinoilla jakaumilla
- Mo > Me > M
Lähteet
- Tilastotieteen ja todennäköisyyslaskennan englantilais–suomalainen sanasto
- Komulainen, Erkki & Karma. (2002): Tilastollisen kuvauksen perusteet käyttäytymistieteissä
- Ilkka Mellin. (2006): Tilastolliset menetelmät: Johdanto
- Lund Research, (2013): Measures of Central Tendency
- Triola, Mario F. (2015): "Essentials of statistics". Pearson, 2015. ISBN 0-321-92459-2"