CSV
CSV (engl. comma-separated values, suom. pilkuilla erotellut arvot) on tiedostomuoto, jolla tallennetaan yksinkertaista taulukkomuotoista tietoa tekstitiedostoon. Tiedostomuoto on ollut kauan käytössä, mutta vasta vuonna 2005 IETF julkaisu RFC 4180 määrittelyn muodolle sekä sen MIME-tyypin.[1]
Comma-separated values | |
---|---|
Tiedostopääte |
.csv |
Mediatyyppi |
text/csv |
Lyhenne | CSV |
Standardi(t) | RFC 4180 |
CSV on toteutukseltaan tekstitiedosto, jonka taulukkorakenteen eri kentät on eroteltu toisistaan pilkuilla ja rivinvaihdoilla. Jos jokin kenttä sisältää erikoismerkkejä, kyseinen kenttä ympäröidään suorilla lainausmerkeillä ("). Ensimmäisellä rivillä voi olla kenttien selitykset samassa muodossa kuin mitä itse tiedot ovat.
CSV on esimerkiksi XML:ään verrattuna yksinkertainen tiedostoformaatti, jonka mukaisia tiedostoja voidaan hyödyntää esimerkiksi datan tallentamisessa ja datan siirtämisessä toiseen tietokoneohjelmaan. CSV:tä voidaan käyttää esimerkiksi yksinkertaisena datan arkistointimuotona, CSV-tiedostoja voidaan tuottaa yksinkertaisesti tietokannan sisältämästä datasta ja CSV-tiedosto voidaan avata taulukkolaskentaohjelmassa.
Esimerkki
- CSV-muoto
Vuosi,Merkki,Malli,Pituus 1997,Ford,E350,"2,34" 2000,Mercury,Cougar,"2,38"
- Taulukkona
Vuosi | Merkki | Malli | Pituus |
1997 | Ford | E350 | 2,34 |
2000 | Mercury | Cougar | 2,38 |
Epästandardit muodot
Esimerkiksi Microsoft Excel hyväksyy asetuksissaan erotinmerkiksi myös muun kuin pilkun. Yleisimmät vaihtoehtoiset erottimet ovat puolipiste ja tabulaattori eli sarkain. Vaihtoehtoisia erotinmerkkejä käytetään, koska pilkkua käytetään desimaalierottimena luvuissa.
Esimerkki
- CSV-muoto
Vuosi;Merkki;Malli;Pituus 1997;Ford;E350;2,34 2000;Mercury;Cougar;2,38 2018;Peugeot;"807;Supercar";5