Paneeliaineisto

Paneeliaineisto on tilastotieteessä ja erityisesti ekonometriassa käytetty termi aineistolle, jossa havaintoyksiköistä on useita havaintoja[1]. Havaintoyksiköt voivat olla esimerkiksi yrityksiä, yksilöitä, kaupunkeja tai maita. Paneeliaineistossa on useita havaintoja näistä yksiköistä, tyypillisesti eri ajan hetkiltä esimerkiksi vuosittain. Tällöin yksittäisen vuoden havainnot muodostavat poikkileikkausaineiston ja kustakin yksiköstä on aikasarja. Kyseessä voi olla rekisteriaineisto tai satunnaisotannalla poimittu joukko yksilöitä. Taloustieteen ulkopuolella käytetty nimitys paneeliaineistolle on pitkittäisaineisto[1].

Paneeliaineistoilla on useita etuja poikkileikkausaineistoihin nähden. Se mahdollistaa kausaalivaikutusten estimoinnin ilman instrumenttimuuttujia. Lisäksi paneeliaineistolla voi tutkia erilaisia dynaamisia vaikutuksia sekä mahdollistaa havaintoyksiköiden erilaisuus laajemmin.[1] Esimerkiksi kaksostutkimusten avulla voidaan tutkia ympäristön vaikutusta yksilöiden lopputulemiin (kuten koulutus tai tulot). Vertailemalla eri ympäristöissä kasvaneita kaksosia keskenään voidaan sulkea geneettiset vaikutukset näihin lopputulemiin. Tällöin erot kaksosten ympäristöissä voidaan tulkita aiheuttavan erot lopputulemissa.

Kiertävä paneeli on paneeliaineisto, jossa osa havaintoyksiköistä vaihtuu ajan kuluessa[1]. Näin ollen havaintoyksikön aikasarja on lyhyempi kuin aineiston koko aikaulottuvuusselvennä. Jos aineistossa on enemmän kuin kaksi ulottuvuutta, sanotaan aineistoa moniulotteiseksi paneeliksi.

Määritelmä

Paneeliainesto on koostuu havaintoyksiköistä joista on havaintoa. Yleisimmin on aikayksikkö, mutta havainnot voivat myös koostua ryhmistä. Havaintoyksiköt voivat olla esimerkiksi yrityksiä, joista on työntekijää eli havaintoa.

Jokaisella havainnolla on paneeliaineistossa siis kaksi indeksiä, yksikkö ja aika (tai ryhmä). Yksittäinen havainto voi koostua useammasta muuttujasta, jotka jaotellaan vaste- ja kontrollimuuttujiin: . Yksilöistä koostuvassa aineistossa muuttujat voivat esimerkiksi olla tulot, koulutus, sukupuoli ja ikä. Paneeliaineisto on tasapainoinen, jos jokaisesta yksiköstä on havainto jokaisella ajan hetkellä. Tällöin havaintoja on kaikille havaintoyksiköille ja havaintoja on yhteensä .

Esimerkki

Paneeliaineisto kolmen henkilön tuloista
Henkilö Vuosi Tulot (€) Työpaikka
1 2010 40 000 A
1 2011 45 000 B
2 2010 60 000 B
2 2011 68 000 A
3 2010 22 000 B
3 2011 20 000 B

Ylläolevassa esimerkissä on kolmen henkilön paneeliaineisto kahdelta vuodelta. Paneeli on tasapainoinen, sillä siinä on yhtä monta havaintoa jokaiselle ajan hetkelle. Paneelia voisi käyttää estimoimaan työpaikan vaikutusta palkkaan. Tällöin tulee olettaa, että työpaikan vaihdos ja vuosi ovat ainoat tekijät, jotka vaikuttavat yksilöiden palkkaan.

Analyysi

Paneeliaineistoja käytetään taloustieteessä tyypillisesti kausaalivaikutusten estimointiin. Eri menetelmissä on tavoitteena päästä eroon puuttuvan muuttujan harhasta valitsemalla yksiköille sopivat verrokkiryhmät. Tyypillisesti käytettäviä menetelmiä on:

Vaikutusten estimoimiseksi tutkijan on tehtävä oletuksia vaikutusten luonteesta. Tyypillinen malli paneeliregressiota varten on , missä on ajasta riippumaton vakiotermi yksikölle . Tässä yksinkertaisessa mallissa on jo oletettu vakiotermin olemassaolo sekä vaikutusten lineaarisuus ja additiivisuus.

Kirjallisuutta

  • Angrist, Joshua & Pischke, Jörn-Steffen: Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press, 2009.
  • Cunningham, Scott: Causal Inference: The Mixtape (v. 1.8). Käsikirjoitus, 2020. Teoksen verkkoversio (Arkistoitu – Internet Archive)
  • Hansen, Bruce E.: Econometrics, Käsikirjoitus, 2020. Teoksen verkkoversio (Arkistoitu – Internet Archive)

Lähteet

  1. Hansen, Bruce E.: Econometrics, s. 586. Käsikirjoitus, 2020. Teoksen verkkoversio. (Arkistoitu – Internet Archive)
  2. Angrist, Joshu & Pischke, Jörn-Steffen: Mostly Harmless Econometrics: An Empirist's Companion, s. 221. Princeton University Press, 2009.
    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.