Digitaalinen pitkäaikaissäilytys
Digitaalisella pitkäaikaissäilytyksellä (engl. Digital preservation) tarkoitetaan digitaalisen informaation luotettavaa säilyttämistä useiden vuosikymmenien tai -satojen ajan.[1] Digitaalinen aineisto voi olla alkuperältään digitaalisesti tuotettua tai analogisesta aineistosta digitoitua. Säilytyksessä on otettava huomioon digitaalisen tallenteen käytettävyys ja vastaavuus alkuperäiseen aineistoon myös luku- ja tallennusjärjestelmien sekä tallennuslaitteiden kehittyessä ajan myötä.
Digitoinnin syitä
Digitoinnin tärkeimpiä syitä on uhka alkuperäisen aineiston tuhoutumisesta. Tavoitteena on parantaa säilytettävien aineistojen käytettävyyttä ja saatavuutta. Digitoinnin jälkeen aineistoa voi lukea altistamatta alkuperäistä, mahdollisesti haurasta dokumenttia kulumiselle. Kun aineisto on verkossa jaossa, fyysinen sijainti ei rajoita sen käyttöä. Digitointi myös mahdollistaa eri organisaatioiden väliset yhteiset arkistot. Tätä tavoitetta varten on Suomessa luotu kirjastojen, museoiden ja arkistojen yhteinen Kansallinen digitaalinen kirjasto -hanke. Laki kulttuuriaineistojen tallettamisesta ja säilyttämisestä (1433/2007)[2] velvoittaa esimerkiksi Kansalliskirjastoa, vapaakappalekirjastoja ja audiovisuaalista arkistoa säilyttämään kokoelmansa käyttökuntoisena myös tulevaisuudessa. Usein tämä on mahdollista vain digitoimalla aineistoa. Velvoite koskee myös ”Suomessa sijaitsevia palvelimilla olevia verkkoaineistoja, sekä muita verkkoaineistoja, jotka on tarkoitettu yleisön saataville Suomessa”, jolloin niiden alkuperäinen muoto on digitaalinen.
Arkistolaitos antaa sitovia määräyksiä ja suosituksia arkistojen asiakirjojen säilytyksen määräajoista. Sen hallinnassa on suuri määrä pysyvästi säilytettävää aineistoa, joka on käytettävyyden varmistamiseksi digitoitava.
Suuri osa nykyajan säilytettävistä dokumenteista tuotetaan sähköisesti. Liikkuva kuva, ääni ja hyperteksti täytyy säilyttää digitaalisena, sillä tulostettu paperituote tai muu analoginen säilytysmuoto hävittää alkuperäisen dokumentin sisältöä. Esimerkiksi hyperlinkit häviävät, kun tekstiä tulostetaan verkosta. Analogisessa muodossa ei voida tehdä automaattisia kokoteksti-indeksointeja eikä hakuja kuva- tai äänitallenteista.[3]
Metatiedot
Digitaaliseen dokumenttiin voi liittyä tai siihen voidaan liittää metatietoa. Metatieto voi olla dokumentin sisällön kuvailua, kuten asiasanoitusta, jonka perusteella dokumentista voidaan tehdä hakuja. Metatieto voi myös kertoa digitaalisen tallenteen teknisistä piirteistä, mikä helpottaa suunnitelmallisen pitkäaikaissäilytyksen toteuttamista. Valittu pitkäaikaissäilytyksen menetelmä vaikuttaa siihen, millaista tietoa dokumentin yhteydessä täytyy tallentaa.[3]
Haasteet
Digitaaliseen pitkäaikaissäilytykseen liittyy monia aineistoa vaarantavia uhkia. Laite-, sovellus- ja tiedonsiirtovirheet vahingoittavat aineistoa välittömästi. Sähköisten laitteiden käyttöikä ei ole loputon, ja ajallaan viat lisääntyvät. Laitteet, tallennusmediat ja sovellukset ikääntyvät. Tallennusmedioiden ongelmat voidaan ryhmitellä:
- Tallennusmedia haurastuu ikääntyessään ja muuttuu vähitellen käyttökelvottomaksi.
- Lukulaitteissa esiintyy liikaa vikoja tai ne jäävät pois käytöstä jostain muusta syystä.
Ulkoinen ja sisäinen hyökkäys tai luonnonkatastrofit luovat uhkia, jotka vaativat tietoturvapoliittista varautumista.[1] Elokuussa 2008 Warner Music Finlandin toimitilat kärsivät savuvahingoista, jolloin muun muassa sen ainutlaatuinen valokuva-arkisto joutui vaaraan. Vahinkoa kärsineet aineistot pystyttiin kuitenkin vielä puhdistamaan ja digitoimaan.[4]
Pitkäaikaissäilytyksen menetelmät
Kopiointi eli fyysinen migraatio
Kopiointi tarkoittaa tässä tapauksessa analogisten aineistojen muuntamista digitaalisen formaattiin. Analogiset tallennusvälineet, kuten magneettinauhat tai c- kasetit, käyvät vanhetessaan epäluotettaviksi, eikä niitä voi tallentaa uudestaan analogisesti ilman aineiston laadun heikkenemistä. Digitaalisessa tallenteessa on sen sijaan kyse bittien säilyttämisestä, joten esimerkiksi kuvan ja äänen laatu eivät kärsi ajan kuluessa. Bittijonot sellaisenaan eivät kuitenkaan aukea käyttäjälle, joten aineistojen kuvailu kopioinnin yhteydessä on tärkeää. Kuvailutietoihin pitäisi sisällyttää, millaisella tietokoneohjelmalla aineistoa voi tarkastella. Kopiointi aiheuttaa organisaatioille taloudellisen haasteen, sillä vanhojen ja mahdollisesti rikkinäisten tallennusvälineiden käsittely vaatii aina asiantuntevan työvoiman palkkaamista.[3]
Konvertointi eli looginen migraatio
Konvertointi on kopioinnin täydennys. Tarkoitus on tarvittaessa muuttaa tallennetut aineistot sellaiseen muotoon, jossa uudet laitteistot ja ohjelmistot voivat lukea niitä. Tätä varten täytyy olla tiedossa tallennetun aineiston formaatti ja versio. Konvertoinnissa dokumentti ei kaikissa tapauksissa säily täysin samanlaisena. Esimerkiksi taulukko voi hävitä tai vääristyä muutettaessa monipuolisemmasta formaatista yksinkertaisempaan. Konvertoinnissa pyritään usein vain intellektuaalisen sisällön säilyttämiseen, eli tehdään tietoisia muutoksia dokumentin muotoilutietoihin tai ulkoasuun. Audiovisuaalisten tiedostojen kohdalla voidaan poistaa muun muassa taustakohinaa. Tiettyihin aineistoihin, kuten juridista arvoa kantaviin asiakirjoihin, ei kuitenkaan saa tehdä mitään muutoksia, vaan niiden täytyy säilyä sellaisenaan konvertointiprosessista.
Kaikkia aineistoja ei voida lainkaan konvertoida, sillä tallennukseen käytetyn ohjelmiston muokkaaminen uuteen käyttöjärjestelmään sopivaksi on usein ylivoimainen tehtävä digitaalista arkistoa ylläpitävälle organisaatiolle. Suomessa kansallisarkisto voi lain nojalla määrätä luovutusvelvolliset lähettämään aineistonsa tietyssä standardoidussa muodossa, joka on tarpeen vaatiessa konvertoitavissa. Aineistojen käsittely on vaivattomampaa, kun arkisto koostuu vain tietyntyyppisistä dokumenteista. Kirjastot eivät voi toimia näin, vaan ne joutuvat vastaanottamaan kustantajilta paljon erityyppisiä aineistoja.[3]
Emulointi
Emulointi tarkoittaa dokumentin alkuperäisen, käytöstä poistetun käyttöympäristön jäljittelyä. Kun dokumentti emuloinnin jälkeen haetaan arkistosta, arkiston käyttöliittymälaitteelle rakennetaan sen tarvitsema käyttöympäristö. Jotta arkiston ylläpitäjien ja käyttäjien ei tarvitsisi opetella vanhojen sovellusten käyttöä, voidaan laatia tarkoitusta varten katseluohjelmia. Emulointia varten dokumentin metatiedoissa täytyy kuvailla dokumentin käyttöympäristö, jolla tarkoitetaan tarvittavaa käyttöjärjestelmää sekä prosessoria.[3]
Henkilökohtaisten tiedostojen pitkäaikaissäilytys
Omien tärkeiden digitaalisten aineistojen hallinta ja säilytys on osa henkilökohtaista tiedonhallintaa (engl. Personal information management, PIM). Tavalliselle käyttäjälle tärkein toimenpide on varmuuskopioiden luominen tiedostoista. Varmuuskopioita tulisi ottaa useita, mahdollisesti eri tallennusformaateille, ja niitä tulisi säilyttää eri paikoissa kuin alkuperäisiä tiedostoja. Kopioiden toiminta tulisi varmistaa säännöllisin väliajoin ja kopiointi uusia tarvittaessa. Tiedostot voivat säilyä tallennusmuodosta riippuen käyttökuntoisena hyvinkin pitkään, mutta huolimaton säilytys tai luonnollinen kuluminen saattavat tuhota kopion jo parissa vuodessa tai nopeammin.[5]
Katso myös
Lähteet
- Kansallinen digitaalinen kirjasto, PAS-jaoston loppuraportti (pdf) kdk2011.fi. 22.6.2010. Viitattu 31.1.2011. [vanhentunut linkki]
- Laki kulttuuriaineistojen säilyttämisestä (1433/2007) finlex.fi. 28.12.2007. Viitattu 31.1.2011.
- Hakala, Juha: Elektronisten aineistojen säilyttämisestä. Arkistoyhdistyksen julkaisuja, 2002, nro 8, s. 19–37. Arkistoyhdistys ry.
- Warner Musicin dokumentit turvaan Profiumin Sähköiseen arkistoon (php) profium.com. Viitattu 26.8.2014.
- Varmuuskopiointi (htm) cibernarium.tamk.fi. Arkistoitu 6.1.2010. Viitattu 31.1.2011.
Aiheesta muualla
- Kansallisarkiston digitointiprojekti (Arkistoitu – Internet Archive)
- Kansallinen digitaalinen kirjasto
- Digiwiki (Arkistoitu – Internet Archive)
- International Association of Sound and Audiovisual Archives IASA