úterý 27. května 2014

Pravěk digitální archivace - článek z roku 1985


Fox, Lisa L. (1985) "Archival Preservation in the Age of Technology," Provenance, Journal of the Society of Georgia Archivists: Vol. 3: Iss. 1, Article 4. 
Available at: http://digitalcommons.kennesaw.edu/provenance/vol3/iss1/4

"Preservation planning should anticipate that 
there will be changes in technology. While printed 
documents can be read without the devices that 
created them, others (such as sound recordings and 
computer tapes) are useless, without accompanying 
hardware. One university accepted an important 
collection of wire recordings that was frequently 
used by researchers; but when the player wore out and 
could not be replaced, the information on the 
recordings was lost. Having learned from such 
experiences, archivists should plan carefully to 
ensure continued access to the computer data 
in the future. 

Computer technology changes rapidly, rendering 
hardware obsolete within a decade, so archivists 
should anticipate the future obsolescence of some 
computer resources. It may now seem quite adequate 
to accept, process, and store safely a floppy disk 
created on, say, an IBM Personal Computer. But 
twenty years from now (or probably much sooner) IBM 
(assuming it still exists) may no longer make a PC 
nor the software to support it. How will the 
information on the well-preserved disks be accessed 
then? Just as the wire recordings could have been 
transferred to another medium before the player wore 
out, so can computer data be preserved in another 
media for security purposes. Of course, much 
computer data is of only short-term value, so its 
long-range preservation is not necessary. However, 
it might be worthwhile to establish one of two 
policies to ensure that machine-readable data remain 
usable in the long range. An archive might implement 
a policy requiring that machine-readable data which 
has archival value must, when transferred to the 
repository, be accompanied by a hard-copy version on 
permanent paper. Alternatively, schedules for the 
review and potential re-copying of machine-readable 
data should be established and consulted regularly
With the increased use of computers and 
microcomputers, archivists should expect to begin 
receiving a great deal of computer printout paper
not only from accounting departments and university 
registrars, but from the growing number of 
individuals who use computer technology to compose 
and communicate for business and personal purposes. 
As it becomes more widely used, this paper will pose 
some problems to preservation because of its size and 
acidity
..........
None of these comments is intended to imply that 
archives and manuscript repositories will suddenly be 
inundated by floppy disks, computer tape, and 
printout paper. However, as computer technology 
comes to play a more important role in education, 
government, research, and personal life, archivists 
should expect to notice the impact in the kinds of 
materials they receive. It is important, therefore, 
to begin now to plan the preservation response to 
these technologies."





čtvrtek 15. května 2014

SCOUT - preservation watch tool - nástroj na sledování rizik - finální report projektu a popis funkcionality

O nástroji SCOUT jsme již psali několikrát, poprvé v roce 2012 a také letos (viz http://digital-preservation-cz.blogspot.co.nz/2014/02/scape-scout-preservation-watch-system.html).

Tentokrát chceme upozornit na finální verzi reportu projektu SCAPE, v jehož rámci nástroj vznikl. Report popisuje funkcionalitu SCOUTu, možnosti jeho připojení a také testování na reálných příkladech (a datech) - jako např. dánský webový archiv apod.
Zpráva je dostupná zde http://www.scape-project.eu/wp-content/uploads/2014/05/SCAPE_D12.2_KEEPS_V1.0.pdf

SCOUT dokáže pracovat s různými zdroji informací, které poté používá k vyhodnocení rizik. Tyto zdroje jsou ke SCOUTu připojeny pomocí adaptérů. Několik základních adaptérů je dostupných, např. na PRONOM, C3PO nástroj. Ostatní je potřeba si dodělat. SCOUT je schopen tedy pracovat s profily repozitáře, tedy údaji o jeho obsahu - jaké formáty jsou uloženy (to zajišťuje nástroj C3PO), s registry formátů (PRONOM), se strategiemi a plány pokud jsou ve strojem čitelné podobě a s dalšími zdroji.

Nás v tomto kontextu mohou zajímat již hotové adaptéry na PRONOM a C3PO. C3PO je tedy teoreticky možné přes API připojit na jakýkoliv repozitář, tedy např. Fedora, DSpace nebo na LTP Archivematica nebo RODA (testováno). Vytvořit profil obsahu a ten pak použít jako input pro SCOUT, který tak vlastně nabízí těmto systémům další rozměr a přidává funkcionalitu dlouhodobé ochrany, kterou např. DSpace nebo Fedora nemají, Archivematicka a RODA pouze do jisté míry.

Co se stane, pokud SCOUT pošle varování, že konkrétní objekt nebo objekty v repozitáři jsou problematické? Je to vlastně první krok v procesu plánování ochranných akcí (preservation planning), který je možno provést dalším nástrojem - PLATO.
Všechny nástroje jsou v reportu linkované, takže je jednoduché je vyzkoušet.
SCOUT, C3PO byly testovány ve spojení s LTP systémem RODA, který je také volně dostupný.

Pokud se rozhodnete SCOUT nebo C3PO vyzkoušet, podělte se s námi o zkušenosti.

neděle 11. května 2014

OCLC Preservation Health Check: Monitorování rizik pro obsah vašeho digitálního repozitáře

OCLC a OPF (Open Planets Foundation) provádějí od roku 2012 tzv. Preservation Health Check, což je pilotní projekt na analýzu kvality ochranných (preservation) metadat vytvářených a využívaných v digitálních repozitářích a systémem na ukládání. Cílem je posoudit potenciál těchto metadat k vytváření odhadů o míře rizik hrozících uloženému digitálnímu obsahu.
OPF poskytuje datové sety, feedback, organizuje celý projekt včetně workshopů a publicity. OCLC má experty na ochranná metadata a tzv. risk assessment. Navrhuje metodologii, provádí samotný výzkum, poskytuje technickou podporu apod.
Všechny dosavadní výsledky naleznete tady http://www.oclc.org/research/activities/phc.html
Poslední zpráva shrnuje přínosy ochranných metadat, náklady na jejich vytváření. Soustředí se na standard PREMIS a jeho mapování do metodologie posuzování rizik SPOT (Simple Property-Oriented Threat - http://www.dlib.org/dlib/september12/vermaaten/09vermaaten.html). SPOT je využíván na posuzování toho, zda PREMIS a jeho využití opravdu přinášejí potřebné údaje v oblastech, na které se soustředí SPOT - to jsou dostupnost, identita, dlouhodobá odolnost, zobrazitelnost, srozumitelnost a autenticita (digitálního obsahu).