Heritrix

Heritrix on pääasiassa Internet Archiven kehittämä hakurobotti verkkoaineistojen keräämiseen. Kehitystyössä on mukana myös muita IIPC:n jäseniä eli pääasiassa kansalliskirjastoja. Hakurobotti on toteutettu Javalla ja sisältää laajan valikoiman asetuksia, joilla erilaisia keruutoimintoja voidaan toteuttaa. Keruurobottia on käytetty onnistuneesti useissa hyvin laajoissa verkkoaineistojen haravointiprojekteissa ja sen tekninen toteutus osaa kiertää monet yleisesti keräyksissä vastaantulevat tekniset ongelmat.

Heritrixin logo

Heritrixiä käyttävät yleensä kansalliskirjastot tai muut toimijat, joiden tehtäviin kuuluu verkkoaineistojen kerääminen ja säilyttäminen jälkipolville. Heritrix:iä voidaan käyttää myös erilaisten vähemmän teknisten käyttöliittymien kautta kuten NetArchiveSuite tai Web Curator Tool.

Suomen Kansalliskirjasto kerää Suomea koskevia Internetin aineistoja kulttuuriaineistojen tallettamista ja säilyttämistä koskevan lain (28.12.2007/1433) mukaisesti. Myös muiden maiden kansalliskirjastojen toiminta perustuu samankaltaisiin lakeihin.

Heritrix on vapaata ohjelmistoa ja on julkaistu Apache License 2.0 -lisenssillä.

Katso myös

Aiheesta muualla

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.