Paneeliaineisto
Paneeliaineisto on tilastotieteessä ja erityisesti ekonometriassa käytetty termi aineistolle, jossa havaintoyksiköistä on useita havaintoja[1]. Havaintoyksiköt voivat olla esimerkiksi yrityksiä, yksilöitä, kaupunkeja tai maita. Paneeliaineistossa on useita havaintoja näistä yksiköistä, tyypillisesti eri ajan hetkiltä esimerkiksi vuosittain. Tällöin yksittäisen vuoden havainnot muodostavat poikkileikkausaineiston ja kustakin yksiköstä on aikasarja. Kyseessä voi olla rekisteriaineisto tai satunnaisotannalla poimittu joukko yksilöitä. Taloustieteen ulkopuolella käytetty nimitys paneeliaineistolle on pitkittäisaineisto[1].
Paneeliaineistoilla on useita etuja poikkileikkausaineistoihin nähden. Se mahdollistaa kausaalivaikutusten estimoinnin ilman instrumenttimuuttujia. Lisäksi paneeliaineistolla voi tutkia erilaisia dynaamisia vaikutuksia sekä mahdollistaa havaintoyksiköiden erilaisuus laajemmin.[1] Esimerkiksi kaksostutkimusten avulla voidaan tutkia ympäristön vaikutusta yksilöiden lopputulemiin (kuten koulutus tai tulot). Vertailemalla eri ympäristöissä kasvaneita kaksosia keskenään voidaan sulkea geneettiset vaikutukset näihin lopputulemiin. Tällöin erot kaksosten ympäristöissä voidaan tulkita aiheuttavan erot lopputulemissa.
Kiertävä paneeli on paneeliaineisto, jossa osa havaintoyksiköistä vaihtuu ajan kuluessa[1]. Näin ollen havaintoyksikön aikasarja on lyhyempi kuin aineiston koko aikaulottuvuusselvennä. Jos aineistossa on enemmän kuin kaksi ulottuvuutta, sanotaan aineistoa moniulotteiseksi paneeliksi.
Määritelmä
Paneeliainesto on koostuu havaintoyksiköistä joista on havaintoa. Yleisimmin on aikayksikkö, mutta havainnot voivat myös koostua ryhmistä. Havaintoyksiköt voivat olla esimerkiksi yrityksiä, joista on työntekijää eli havaintoa.
Jokaisella havainnolla on paneeliaineistossa siis kaksi indeksiä, yksikkö ja aika (tai ryhmä). Yksittäinen havainto voi koostua useammasta muuttujasta, jotka jaotellaan vaste- ja kontrollimuuttujiin: . Yksilöistä koostuvassa aineistossa muuttujat voivat esimerkiksi olla tulot, koulutus, sukupuoli ja ikä. Paneeliaineisto on tasapainoinen, jos jokaisesta yksiköstä on havainto jokaisella ajan hetkellä. Tällöin havaintoja on kaikille havaintoyksiköille ja havaintoja on yhteensä .
Esimerkki
Henkilö | Vuosi | Tulot (€) | Työpaikka |
---|---|---|---|
1 | 2010 | 40 000 | A |
1 | 2011 | 45 000 | B |
2 | 2010 | 60 000 | B |
2 | 2011 | 68 000 | A |
3 | 2010 | 22 000 | B |
3 | 2011 | 20 000 | B |
Ylläolevassa esimerkissä on kolmen henkilön paneeliaineisto kahdelta vuodelta. Paneeli on tasapainoinen, sillä siinä on yhtä monta havaintoa jokaiselle ajan hetkelle. Paneelia voisi käyttää estimoimaan työpaikan vaikutusta palkkaan. Tällöin tulee olettaa, että työpaikan vaihdos ja vuosi ovat ainoat tekijät, jotka vaikuttavat yksilöiden palkkaan.
Analyysi
Paneeliaineistoja käytetään taloustieteessä tyypillisesti kausaalivaikutusten estimointiin. Eri menetelmissä on tavoitteena päästä eroon puuttuvan muuttujan harhasta valitsemalla yksiköille sopivat verrokkiryhmät. Tyypillisesti käytettäviä menetelmiä on:
- Kiinteiden vaikutusten malli[2]
- Satunnaisten vaikutusten malli
- Erotusten erotus –asetelma[2]
- Tapahtumatutkimus
Vaikutusten estimoimiseksi tutkijan on tehtävä oletuksia vaikutusten luonteesta. Tyypillinen malli paneeliregressiota varten on , missä on ajasta riippumaton vakiotermi yksikölle . Tässä yksinkertaisessa mallissa on jo oletettu vakiotermin olemassaolo sekä vaikutusten lineaarisuus ja additiivisuus.
Kirjallisuutta
- Angrist, Joshua & Pischke, Jörn-Steffen: Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press, 2009.
- Cunningham, Scott: Causal Inference: The Mixtape (v. 1.8). Käsikirjoitus, 2020. Teoksen verkkoversio (Arkistoitu – Internet Archive)
- Hansen, Bruce E.: Econometrics, Käsikirjoitus, 2020. Teoksen verkkoversio (Arkistoitu – Internet Archive)
Lähteet
- Hansen, Bruce E.: Econometrics, s. 586. Käsikirjoitus, 2020. Teoksen verkkoversio. (Arkistoitu – Internet Archive)
- Angrist, Joshu & Pischke, Jörn-Steffen: Mostly Harmless Econometrics: An Empirist's Companion, s. 221. Princeton University Press, 2009.