Pak se podívejte na záznam APARSEN webináře, který tato témata pokrývá. Data Seal of Approval, ISO 16363 (Barbara Sierman, KB), NESTOR (Sabine Schrimpf).
Dostupné na http://www.youtube.com/watch?v=ZNvBVUQDXWY
sobota 21. prosince 2013
pátek 20. prosince 2013
Další pokus o registr nástrojů a services - projekt DCH-RP
V rámci evropského projektu DCH-RP - Digital Cultural Heritage Roadmap for Preservation vzniká několik zajímavých věcí. Vedle analýz, které jsou dostupné tady http://www.dch-rp.eu/index.php?en/61/deliverables, se projekt chystá vytvořit registr nástrojů a služeb pro digital preservation. První představy o registru jsou popsány v reportu D3.3 Registry of services dostupném na tomto URL http://www.dch-rp.eu/getFile.php?id=166. Tento report již nyní obsahuje relativně dlouhý seznam nástrojů k různým aktivitám digital preservation - viz stránky 30-42 v příloze 1.
úterý 17. prosince 2013
LIBER workshop za humny: Keeping Data. The Process of Data Curation, Vídeň 19-20.5.2014
V květnu příštího roku se ve Vídni bude konat třetí LIBER workshop, tentokrát o digitální archivaci se zaměřením na akademické a výzkumné instituce a jejich data. Hlavní témata jsou:
- Jak mohou akademické instituce spravovat vědecké a administrativní procesy spojené s digitálními daty?
- Jaké reprezentace dat budou objektem ochrany?
- Jak mohou pomoci tzv. Plány data managementu v každodenní práci?
Takže pokud vás zajímají Plány data managementu, jejich přínos a použití, pokud vás zajímá co dělat s daty pocházejícími z vědeckých analýz, měření a pokusů, LIBER 2013 mohou být dobře investované peníze.
Registrace http://liber2014.univie.ac.at/registration/
Jakým formátům digitálních dat důvěřují knihovny ARL?
Výzkumníci z University of Illinois at Urbana-Champaign analyzovali formátové politiky 125 členů ARL. Zjistili v jakých formátech data ukládají ve svých repozitářích, a jak často jsou si jisti, že budou schopni objekty v jednotlivých formátech dlouhodobě uchovat.
Zjistili, že:
Zjistili, že:
- pouze 18 formátů je považováno za důvěryhodné
- za důvěryhodné jsou považovány především formáty dat vznikajících v digitalizaci nebo formáty dat vyměňovaných výzkumníky na webu
- u většiny formátů si instituce v ARL nejsou jisty, že jsou schopny zajistit jejich trvalé uchování
Poster je zde:
úterý 10. prosince 2013
Zpráva "Hodnocení modelů na odhad nákladů digital preservation, potřeby a analýza nedostatků" z projektu 4C ke komentáři
V listopadu jsme informovali o analýze nástrojů na odhad nákladů, kterou vytvořili kolegové v projektu APARSEN - viz http://digital-preservation-cz.blogspot.co.nz/2013/11/zprava-cost-parameters-for-digital.html.
Nyní podobnou analýzu vydal ke komentáři projekt 4C, který se zabývá odhadem nákladů na archivaci dat. Zpráva je dostupná zde http://www.4cproject.eu/community-resources/outputs-and-deliverables/d3-1-evaluation-of-cost-models-and-needs-gaps-analysis-ms12-draft. Obsahuje popis těchto nástrojů:
Nyní podobnou analýzu vydal ke komentáři projekt 4C, který se zabývá odhadem nákladů na archivaci dat. Zpráva je dostupná zde http://www.4cproject.eu/community-resources/outputs-and-deliverables/d3-1-evaluation-of-cost-models-and-needs-gaps-analysis-ms12-draft. Obsahuje popis těchto nástrojů:
- Test Bed Cost Model For Digital Preservation, T-CMDP
- NASA Cost Estimating Tool, NASA-CET
- LIFE3 Costing Model, LIFE3
- Keeping Research Data Safe, KRDS
- Cost Model For Digital Archiving, CMDA
- Cost Model For Digital Preservation, CMDP
- DP4LIB Cost Model, DP4LIB
- Prestoprime Cost Model For Digital Storage, PP-CMDS
- Total Cost Of Preservation, CDL-TCP
- Economic Model For Long-Term Storage, EMLTS
čtvrtek 5. prosince 2013
BitCurator: Vyzkoušejte nástroje pro forenzní analýzu obsahu celého serveru nebo file systemu
Project BitCuratot nabízí k vyzkoušení verzi 0.4.4. svého nástroje pro forenzní analýzu celého file systému. Nástroj je k dispozici jako Ubuntu instalace (ISO obraz nebo virtuální stroj pro virtualbox apod.)
Ke stažení zde:
http://wiki.bitcurator.net/index.php?title=Software
Pár slidů na začátek:
http://wiki.bitcurator.net/downloads/BitCurator-Quickstart-v0.4.4.pdf
Ke stažení zde:
http://wiki.bitcurator.net/index.php?title=Software
Pár slidů na začátek:
http://wiki.bitcurator.net/downloads/BitCurator-Quickstart-v0.4.4.pdf
středa 4. prosince 2013
Jak na ExifTool - online tutorial
AVpreserve zveřejnilo zajímavý video návod jak používat ExifTool. ExifTool je nástroj na práci s metadaty obrazových nebo video souborů - editace metadat apod. Často je používán na prohlížení metadat, což je základní funkcionalita. Tutorial ukazuje různé možnosti využití, různé příkazy atd.
http://www.avpreserve.com/exiftool-tutorial-series/
http://www.avpreserve.com/exiftool-tutorial-series/
pondělí 2. prosince 2013
Audit pomocí ISO 16363: Bakalářská práce
HRUŠKA, Zdeněk. Audit digitálních repozitářů. Duha [online]. 2013-11-18 (All day) [cit. 02.12.2013]. Dostupný z WWW: <http://duha.mzk.cz/clanky/audit-digitalnich-repozitaru>. ISSN 1804-4255.
Škoda, že k auditu není dostupná dokumentace MZK online...
středa 27. listopadu 2013
Bavorsko první spolkovou zemí využívající digital preservation as a service (DPaaS)
Bavorská státní knihovna, která od roku 2009 používá long-term preservation system Rosetta od firmy Ex Libris, bude poskytovat od roku 2014 služby a možnost využítí tohoto systému všem bavorským akademickým knihovnám. Celá tisková zpráva dostupná zde http://www.librarytechnology.org/ltg-displaytext.pl?RC=18636.
Po Finsku, Francii a Irsku tak půjde o další podobnou aktivitu v oblasti DPaaS. V Bavorsku s tím rozdílem, že od počátku budou nabízet aktivní (logickou) dlouhodobou ochranu dat - tedy nejen ochranu bitstreamu, ale logickou ochranu obsahu - tedy validace, risk assessment, identifikaci formátů, plánování ochrany a případné migrace apod.
DPaaS je ve stadiu plánování např. také na Novém Zélandu, kde národní knihovna z pověření ministerstva připravuje pro tuto aktivitu business plán. Také by šlo o využití již existující infrastruktury - tedy systému Rosetta.
http://www.exlibrisgroup.com/category/RosettaOverview
http://www.multidata.cz/produkty/rosetta
Po Finsku, Francii a Irsku tak půjde o další podobnou aktivitu v oblasti DPaaS. V Bavorsku s tím rozdílem, že od počátku budou nabízet aktivní (logickou) dlouhodobou ochranu dat - tedy nejen ochranu bitstreamu, ale logickou ochranu obsahu - tedy validace, risk assessment, identifikaci formátů, plánování ochrany a případné migrace apod.
DPaaS je ve stadiu plánování např. také na Novém Zélandu, kde národní knihovna z pověření ministerstva připravuje pro tuto aktivitu business plán. Také by šlo o využití již existující infrastruktury - tedy systému Rosetta.
http://www.exlibrisgroup.com/category/RosettaOverview
http://www.multidata.cz/produkty/rosetta
pondělí 25. listopadu 2013
APARSEN: webinář k certifikaci digitálních repozitářů
9. prosince, v 15 hodin pořádá projekt APARSEN webinář k certifikaci dlouhodobých digitálních repozitářů. Na programu jsou příspěvky o Data seal of approval i o ISO certifikaci:
1. Simon Lambert, APARSEN Coordinator: “How Certification fits the APARSEN project”
2. Ingrid Dillo, DANS-NL: “Self certification: “Data Seal of Approval approach”
3. Sabine Schrimpf, German National Library DNB: “DIN/Nestor approach for certification”
4. Barbara Sierman, Dutch Royal Library KB: “ISO approach for certification”
5. David Giaretta, APARSEN project Manager: “How APARSEN tries to make ISO, DIN and DSA work together”
2. Ingrid Dillo, DANS-NL: “Self certification: “Data Seal of Approval approach”
3. Sabine Schrimpf, German National Library DNB: “DIN/Nestor approach for certification”
4. Barbara Sierman, Dutch Royal Library KB: “ISO approach for certification”
5. David Giaretta, APARSEN project Manager: “How APARSEN tries to make ISO, DIN and DSA work together”
Informace jsou na:
neděle 24. listopadu 2013
Nový internetový časopis "Practical Technology for Archives"
Na webu se objevil nový časopis, který vypadá velmi slibně. Jde o recenzovaný zdroj, který se bude zaměřovat na praktické otázky digitální archivace. Držme autorům palce ať mají dostatek kvalitních článků a také čtenářů.
První číslo je dostupné tady http://practicaltechnologyforarchives.org/
První číslo je dostupné tady http://practicaltechnologyforarchives.org/
středa 20. listopadu 2013
Do seznamu nástrojů přidán COPTR - nový registr nástrojů pro digital preservation, digital curation
COPTR (http://coptr.digipres.org/Main_Page) je iniciativou několika organizací, mohl by tak mít větší naději na přežití, než podobné projekty vycházející od jednotlivců, z časově omezených projektů apod. V tuto chvíli je v registru již několik set nástrojů.
Více informací viz http://www.openplanetsfoundation.org/blogs/2013-11-14-coptr-tools-registry-beta-launch
Více informací viz http://www.openplanetsfoundation.org/blogs/2013-11-14-coptr-tools-registry-beta-launch
pondělí 18. listopadu 2013
Zuse Institute Berlin: Implementace OAIS archivu v prostředí muzeí a galerií
Pěkný příklad projektu dlouhodobé archivace v oblasti muzeí a galerií, který využívá open-source systém Archivematica v režimu služby, kterou poskytuje Centrum pro informační technologie v Berlíně (ZIB).
ZIB se zabývá nejen archivací tohoto typu dat, ale má také samostatné projekty na archivaci dat filmových nebo různých typů dat vědeckých. (http://www.zib.de/en/projects/current-projects/project-details/article/lfd.html).
Dealing with all the data – Participating in workflows to transform digital
data about cultural heritage objects within a digital long-term preservation infrastructure
Marco Klindt, Kilian Amrhein, Anja Müller, Wolfgang Peters-Kottig
Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)
ZIB-Report (Internet) ISSN 2192-7782
http://opus4.kobv.de/opus4-zib/frontdoor/index/index/docId/4302
ZIB se zabývá nejen archivací tohoto typu dat, ale má také samostatné projekty na archivaci dat filmových nebo různých typů dat vědeckých. (http://www.zib.de/en/projects/current-projects/project-details/article/lfd.html).
Dealing with all the data – Participating in workflows to transform digital
data about cultural heritage objects within a digital long-term preservation infrastructure
Marco Klindt, Kilian Amrhein, Anja Müller, Wolfgang Peters-Kottig
Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)
ZIB-Report (Internet) ISSN 2192-7782
http://opus4.kobv.de/opus4-zib/frontdoor/index/index/docId/4302
neděle 17. listopadu 2013
Zpráva "Cost parameters for digital repositories" z projektu APARSEN
Ještě se krátce vrátím ke zprávě projektu APARSEN o nástrojích na zjištění nákladů na digital preservation. Zpráva byla vydána v únoru 2013 (http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2013/03/APARSEN-REP-D32_1-01-1_0.pdf ), ale i skoro po roce je to zajímavé čtení. Může se hodit pro ty z vás, kteří uvažujete o využití jednoho z několika dostupných nástrojů. Text je vlastně jednoduchou analýzou těch nejznámnějších nástrojů. V úvodu je vysvětleno jak byly hodnoceny, jak probíhalo mapování nástrojů k funkcionalitám vyplývajícím z referenčního rámce OAIS. Hodnoceny byly:
- Lifecycle Information for E-Literature, LIFE3
- Cost Model for Digital Preservation, CMDP
- Keeping Research Data Safe 1 and 2, KRDS
- PrestoPRIME cost model for digital storage
- Cost Estimation Toolkit, CET
- Digital Preservation for libraries, DP4lib
- Activity based costing of archiving datasets, DANS
- Costing cloud based preservation systems, ENSURE
Každý z modelů se zaměřuje na jiné oblasti životního cyklu digitálního dokumentu, ty hlavní mají ovšem společné (náklady na infrastrukturu, rizika, zaměstnance, ingest apod.).
V příloze 3 zaujme přehledná tabulka relevantních částí normy ISO 16363 (Audit and certification
of trustworthy digital repositories), které byly použity pro hodnocení jednotlivých nástrojů.
čtvrtek 14. listopadu 2013
Srovnání nástrojů na validaci a konverzi do PDF/A
Už po několikáté na stejné téma, tentokrát upozornění na dva zajímavé články z Florida digital archive.
V paperu, který prezentovali na iPresu, popisují testování tří komerčních nástrojů na migraci do pdf/a validaci (pdfaPilot, 3-Heights, PDF/A Manager)
https://fclaweb.fcla.edu/uploads/iPRES_PAPER86_Abstract.docx
Na stejné téma pak je krátký článek
https://share.fcla.edu/FDAPublic/Affiliates/FDA_PDF-A_validation_conversion.pdf
kde už popisují zapojení vybraného SW do svých workflow.
V paperu, který prezentovali na iPresu, popisují testování tří komerčních nástrojů na migraci do pdf/a validaci (pdfaPilot, 3-Heights, PDF/A Manager)
https://fclaweb.fcla.edu/uploads/iPRES_PAPER86_Abstract.docx
Na stejné téma pak je krátký článek
https://share.fcla.edu/FDAPublic/Affiliates/FDA_PDF-A_validation_conversion.pdf
kde už popisují zapojení vybraného SW do svých workflow.
úterý 12. listopadu 2013
Tender na dodavatele v projektu Národní digitálni archiv zrušen
Výběrové řízení na dodavatele řešení pro dlouhodobou archivaci digitálních informací v projektu Národní digitální archiv bylo podruhé zrušeno. Protože projekt končí 30.6.2014, bylo to asi to jediné rozumné rozhodnutí, které mohl Národní archiv udělat po té, co se objevily další stížnosti na hodnocení živé ukázky systému.
Mezi stěžovateli byl i dodavatel řešení archivu pro projekt Národní digitální knihovny zastoupený firmou Telefonica, stížnost stojí za přečtení.
(http://web.nacr.cz/zakazky/20130218_NDA_IS/Namitky_Telefonica.pdf).
Národní archiv by už neměl ztrácet čas zbytečnými právními bitvami...dodavatelé neflexibilních systémů "na jedno použití" nemohou vyhovět jeho potřebám.
Mezi stěžovateli byl i dodavatel řešení archivu pro projekt Národní digitální knihovny zastoupený firmou Telefonica, stížnost stojí za přečtení.
(http://web.nacr.cz/zakazky/20130218_NDA_IS/Namitky_Telefonica.pdf).
Národní archiv by už neměl ztrácet čas zbytečnými právními bitvami...dodavatelé neflexibilních systémů "na jedno použití" nemohou vyhovět jeho potřebám.
Puls Londýna - jak také může vypadat prezentace digitálních dat koncovému uživateli
Tento příspěvek není přímo o digital preservation, ale o projektu digitalizace. Wellcome Library v Londýně zdigitalizovala lékařské zprávy od půlky 19. století do současnosti. Na tom by nebylo nic zvláštního, důvod proč o tom píšu je způsob prezentace. Web http://wellcomelibrary.org/ londons-pulse může sloužit jako příklad moderního prostředí pro uživatele, které nabízí veškerou funkcionalitu, kterou dnešní uživatel očekává.
To co uživatel vidí je JPG "servírovaný" image serverem, který jej on-the-fly vytváří z archivního JPEG 2000 souboru. JPEG 2000 používá Wellcome Library jako archivní formát ve svém LTP systému, a to pro všechny projekty digitalizace, které mají. Díky JPEG 2000 můžete krásně zoomovat. Wellcome Library používá svůj vlastní player na obrazy i videa. Je opravdu povedený.
Ze závěrečné zprávy (http://repository.jisc.ac.uk/ 5370/1/MOH_article_for_JISC_ v3_FINAL.docx) vybírám několik údajů:
Vše doprovází účet na Flickru se zajímavými obrázky z lékařkých zpráv
To co uživatel vidí je JPG "servírovaný" image serverem, který jej on-the-fly vytváří z archivního JPEG 2000 souboru. JPEG 2000 používá Wellcome Library jako archivní formát ve svém LTP systému, a to pro všechny projekty digitalizace, které mají. Díky JPEG 2000 můžete krásně zoomovat. Wellcome Library používá svůj vlastní player na obrazy i videa. Je opravdu povedený.
Ze závěrečné zprávy (http://repository.jisc.ac.uk/
- zdigitalizováno 4 miliony stran
- popis, katalogizace a konzervace trvala 12 měsíců
- použitý systém pro workflow digitalizace je GOOBI http://www.digiverso.com/en/
products/goobi, používaný pro masovou digitalizaci v mnoha institucích (uvažovalo se o něm i do NK ČR) - celý projekt trval 17 měsíců
- digitalizace probíhala externě (Contentra dělala kontroly kvality, OCR a převod do JPEG 2000; snímkování dělala nizozemská Microformat)
- tabulky statistické ze skenovaných dokumentů byly automaticky převáděny do XML, které odpovídá DTD americké národní lékařské knihovny; tabulky jsou ve formátu XHTML, který umožňuje je jednoduše zobrazit v HTML webové stránce;
- tým okolo projektu se soustředí na publicitu - zprávy do médií, online komunikační kampaň pro různé cílové skupiny, cílené příspěvky na relevantní online diskuze a profesionální mailing listy, plus Google Adwords kampaň. K tomu všemu plánují několik akcí pro místní komunity v Londýně a okolo, aby digitální knihovnu jako zdroj informací představili profesionálům, tedy doktorům, statistikům, historikům apod.
Vše doprovází účet na Flickru se zajímavými obrázky z lékařkých zpráv
Všechna data jsou open public - dostupná v CSV, XML, TXT, html - dostupné tady http://wellcomelibrary.org/ moh/about-the-reports/using- the-report-data/
Projektový plán pro zájemce je tady http://www.jisc.ac.uk/media/ documents/programmes/ digitisation/ mohprojectplandec2011.pdf
úterý 5. listopadu 2013
ProInflow ještě jednou - Pavla Švástová z MZK popisuje Aspekty digitalizace: pořadí čtení článků v digitalizovaných starých novinách
V posledním ProInflow by vám neměl uniknout ani článek Pavly Švástové, která popisuje digitalizaci novin, tvorbu metadat, OCR a ALTO metadat. Jak je možné, že naskenovaná stránka novin je rozdělená na jednotlivé články, jak digitální knihovna ví že článek A pokračuje na straně 5, jak ví co je nadpis? To se dočtete v článku na tomto URL: http://pro.inflow.cz/aspekty-digitalizace-poradi-cteni-clanku-v-digitalizovanych-starych-novinach
pondělí 4. listopadu 2013
Dva články na ProInflow
KVASNICA, Jaroslav; KREIBICH, Rudolf. Formátová analýza sklizených dat v rámci projektu WebArchiv NK ČR. ProInflow [online]. 31.10.2013 [cit. 04.11.2013]. Dostupný z WWW: <http://pro.inflow.cz/formatova-analyza-sklizenych-dat-v-ramci-projektu-webarchiv-nk-cr>. ISSN 1804–2406.
Zajímavý pokus s daty webarchivu. Pánové z Národní knihovny nad daty, která sklízí v projektu Webarchiv, použili Droid pro identifikaci formátů v kontejnerech ARC a WARC. Samozřejmě nejsou první, kdo se podobnou analýzou zabývá, podobné pokusy dělají i další členové IIPC konzorcia a také srovnávají výskyt jednotlivých formátů v různých částech svých sbírek. Pokud "hlavním cílem analýzy bylo zmapování možností retrospektivní identifikace formátů kompletního archivu webových stránek až do roku 2000" pak by stálo za to také nejprve analyzovat desitky publikací, které se stejným tématem zabývají. Také by bylo zajímavé vidět, jak se podíl zastoupených formátů mění v čase...
- KB.nl dělá analýzy formátů od roku 2007, http://www.kb.nl/sites/default/files/docs/IIPC-PWG-Webarchiving-JHove-DROID-test.pdf,
- k testům British Library existuje řada publikací http://arxiv.org/pdf/1210.1714.pdf, http://www.ifs.tuwien.ac.at/dp/ipres2010/papers/enders-70.pdf, http://www.openplanetsfoundation.org/blogs/2012-08-17-analysing-formats-uk-web-archive,
-stejně tak z BNF a další francouzské instituce, http://archivesic.ccsd.cnrs.fr/docs/00/76/90/91/PDF/FormatWebArchives_Oury_ipres2010.pdf, http://www.unesco.org/new/fileadmin/MULTIMEDIA/HQ/CI/CI/pdf/mow/VC_Holden_27_C_1610.pdf,
- další projekty v této oblasti:http://wiki.opf-labs.org/display/SP/File+Format+Identification+and+Characterisation+of+Web+Archives
Zarážející je, že ve svém pokusu nalezli pánové z NK jen 2% neidentifikovaných formátů, nerozlišují mezi formáty identifikovanými různými metodami (identifikace pomoci signature, koncovky, nebo předběžné identifikace), a v seznamu identifikovaných formátů se nevyskytuje oblíbený únik DROIDu "octet stream". Jak ukazuje analýza ze SCAPE (http://www.scape-project.eu/wp-content/uploads/2012/01/SCAPE_PC_WP1_identification21092011.pdf) Droid má problémy s identifikací především "text-based" formátů, XML formátů. Možná nějaká informace o neidentifikovaných souborech by byla zajímavá, stejně tak by bylo dobré vědět zhruba s jakým nastavením byla testovaná data posklízena (limity na velikosti souborů, sklízely se skripty, apod.)
2% neúspěšné identifikace jsou skutečně podezřele málo, v porovnání s daty, která zveřejňuje například na svém posteru C. Oury (http://netpreserve.org/sites/default/files/attachments/Poster_ipres2010_webarchivefileformats_oury(1).pdf) a podle mě článek toto číslo nedokladuje dostatečně.
DROID je skutečně jen nástroj pro identifikaci formátů, nikoli nástroj na jejich valiadaci. Spoléhat na to, že soubory, které označí DROID za formáty fmt/xy, jsou skutečně validní reprezentaci daného formátu, by bylo jistě krátkozraké. Jako strategie dlouhodobé ochrany je pouhá identifikace obsahu pomocí DROIDu jen částečným řešením...dříve či později je asi třeba se rozhodnout, zda budou nevalidní formáty migrovány do validních nebo zda se bude používat pro zpřístupnění dat z archivace webu výhradně a plně emulace.
KVAŠOVÁ, Zuzana; SVOBODA, Tomáš. Dlouhodobá ochrana elektronických publikací. ProInflow[online]. 31.10.2013 [cit. 04.11.2013]. Dostupný z WWW: <http://pro.inflow.cz/dlouhodoba-ochrana-elektronickych-publikaci>. ISSN 1804–2406.
Druhý článek o plánech na dlouhodobou archivaci e-knih v Národní knihovně. Shrnuje přehledně problematiku dlouhodobé archivace tohoto typu dokumentů. Jak bude v praxi vypadat předávání elektronických publikací do Národní knihovny se dozvíme možná na chystaném semináři.
Zajímavý pokus s daty webarchivu. Pánové z Národní knihovny nad daty, která sklízí v projektu Webarchiv, použili Droid pro identifikaci formátů v kontejnerech ARC a WARC. Samozřejmě nejsou první, kdo se podobnou analýzou zabývá, podobné pokusy dělají i další členové IIPC konzorcia a také srovnávají výskyt jednotlivých formátů v různých částech svých sbírek. Pokud "hlavním cílem analýzy bylo zmapování možností retrospektivní identifikace formátů kompletního archivu webových stránek až do roku 2000" pak by stálo za to také nejprve analyzovat desitky publikací, které se stejným tématem zabývají. Také by bylo zajímavé vidět, jak se podíl zastoupených formátů mění v čase...
- KB.nl dělá analýzy formátů od roku 2007, http://www.kb.nl/sites/default/files/docs/IIPC-PWG-Webarchiving-JHove-DROID-test.pdf,
- k testům British Library existuje řada publikací http://arxiv.org/pdf/1210.1714.pdf, http://www.ifs.tuwien.ac.at/dp/ipres2010/papers/enders-70.pdf, http://www.openplanetsfoundation.org/blogs/2012-08-17-analysing-formats-uk-web-archive,
-stejně tak z BNF a další francouzské instituce, http://archivesic.ccsd.cnrs.fr/docs/00/76/90/91/PDF/FormatWebArchives_Oury_ipres2010.pdf, http://www.unesco.org/new/fileadmin/MULTIMEDIA/HQ/CI/CI/pdf/mow/VC_Holden_27_C_1610.pdf,
- další projekty v této oblasti:http://wiki.opf-labs.org/display/SP/File+Format+Identification+and+Characterisation+of+Web+Archives
Zarážející je, že ve svém pokusu nalezli pánové z NK jen 2% neidentifikovaných formátů, nerozlišují mezi formáty identifikovanými různými metodami (identifikace pomoci signature, koncovky, nebo předběžné identifikace), a v seznamu identifikovaných formátů se nevyskytuje oblíbený únik DROIDu "octet stream". Jak ukazuje analýza ze SCAPE (http://www.scape-project.eu/wp-content/uploads/2012/01/SCAPE_PC_WP1_identification21092011.pdf) Droid má problémy s identifikací především "text-based" formátů, XML formátů. Možná nějaká informace o neidentifikovaných souborech by byla zajímavá, stejně tak by bylo dobré vědět zhruba s jakým nastavením byla testovaná data posklízena (limity na velikosti souborů, sklízely se skripty, apod.)
2% neúspěšné identifikace jsou skutečně podezřele málo, v porovnání s daty, která zveřejňuje například na svém posteru C. Oury (http://netpreserve.org/sites/default/files/attachments/Poster_ipres2010_webarchivefileformats_oury(1).pdf) a podle mě článek toto číslo nedokladuje dostatečně.
DROID je skutečně jen nástroj pro identifikaci formátů, nikoli nástroj na jejich valiadaci. Spoléhat na to, že soubory, které označí DROID za formáty fmt/xy, jsou skutečně validní reprezentaci daného formátu, by bylo jistě krátkozraké. Jako strategie dlouhodobé ochrany je pouhá identifikace obsahu pomocí DROIDu jen částečným řešením...dříve či později je asi třeba se rozhodnout, zda budou nevalidní formáty migrovány do validních nebo zda se bude používat pro zpřístupnění dat z archivace webu výhradně a plně emulace.
KVAŠOVÁ, Zuzana; SVOBODA, Tomáš. Dlouhodobá ochrana elektronických publikací. ProInflow[online]. 31.10.2013 [cit. 04.11.2013]. Dostupný z WWW: <http://pro.inflow.cz/dlouhodoba-ochrana-elektronickych-publikaci>. ISSN 1804–2406.
Druhý článek o plánech na dlouhodobou archivaci e-knih v Národní knihovně. Shrnuje přehledně problematiku dlouhodobé archivace tohoto typu dokumentů. Jak bude v praxi vypadat předávání elektronických publikací do Národní knihovny se dozvíme možná na chystaném semináři.
Sbírka historického SW od Internet Archive - emulované staré hry a aplikace
Internet Archive má přístupnou sbírku historického SW. Jde o největší sbírku historického SW na světě. Poskytuje okamžitý přístup k milionům programů, CD-ROM obrazů, dokumentaci a multimédiím. Sbírka obsahuje různý materiál, včetně sharewaru, freewaru, zpráv o novém SW, her, preview a reklam na počítačové hry a další. 5000 PC her, 37 přelomových her, tisíce sharewarových CD, emulátory s hrami a aplikacemi, linuxové distribuce, datasety ...
- Výběr toho nejlepšího naleznete na https://archive.org/details/software.
- 37 přelomových her https://archive.org/details/historicalsoftware
- Zahrajte si Pitfall!! na emulátoru přímo ve vašem prohlížeči https://archive.org/details/Pitfall_Activision_1982
- nebo třeba Karateku? https://archive.org/details/Karateka_1984_Broderbund
- nebo se povívejte na textový procesor WordStar 2.2 https://archive.org/stream/wordstar_2.26_osborne1_1981_micropro/os1wrdst.td0?module=osborne1&scale=2
pátek 1. listopadu 2013
Publikace CLIR - Born Digital: Guide for Donors, Dealers, and Archival Repositories
Council on Library and Information Resources vydala zajímavou publikaci "Born Digital: Guide for Donors, Dealers, and Archival Repositories" (ke stažení zde).
Obsahově pokrývá zejména tyto oblasti:
Obsahově pokrývá zejména tyto oblasti:
- prvotní revizi sbírek,
- soukromé a duševní vlastnictví,
- klíčové fáze při získávání digitálních materiálů a
- postakviziční revizi repozitáře.
Každá z uvedených oblastí uvádí doporučení jak pro dárce (donors) a obchodníky (dealers), tak pro samotné pracovníky repozitářů.
úterý 29. října 2013
Nové nástroje pro dlouhodobou ochranu z dílny AVPreserve
Při příležitosti UNESCO světového dne audiovizuálního dědictví přichází AVPreserve s dalšími dvěma nástroji pro dlouhodobou ochranu:
- Fixity (https://github.com/avpreserve/fixity) - zabezpečuje průběžnou kontrolu uchovaných souborů a
- MDQC - (https://github.com/avpreserve/mdqc) - odpovídá za detekci a kontrolu vnořených metadat (embedded metadata) vůči definovaným pravidlům.
Podrobnější informace lze najít na blogu AVPreserve. Jelikož nástroje vypadají zajímavě, o konkrétní práci s nimi bude pojednáno v některém z dalších příspěvků tohoto blogu.
pátek 25. října 2013
UNESCO světový den audiovizuálního dědictví
PrestoCenter a Presto4U připravily k 27.10. (UNESCO světový den audiovizuálního dědictví) soubor krátkých informačních videí:
https://www.prestocentre.org/world-day-2013
V České republice připomíná tento den pouze festival dokumentárních filmů v Jihlavě, a bio Ponrepo v Praze, v obou případech zcela prostě speciální filmovou projekcí.
https://www.prestocentre.org/world-day-2013
V České republice připomíná tento den pouze festival dokumentárních filmů v Jihlavě, a bio Ponrepo v Praze, v obou případech zcela prostě speciální filmovou projekcí.
Zajímá Vás jak bude vypadat nový PREMIS 3.0?
Pokud by jste rádi věděli, jak se bude lišit PREMIS verze 3 od současné 2.2, podívejte se na prezentaci Angely Dappert z letošního iPRES 2013. Tam proběhl PREMIS workshop, jak je již ostatně skoro tradicí.
Prezentace dostupná zde http://www.loc.gov/standards/premis/pif-presentations-2013/02PREMIS-Dappert-Data_Model_Changes.pdf
Hlavní změny:
Nová verze se chystá na počátek roku 2014 (i přesto, že v prezentaci se mluví o konci roku 2013).
Prezentace dostupná zde http://www.loc.gov/standards/premis/pif-presentations-2013/02PREMIS-Dappert-Data_Model_Changes.pdf
Hlavní změny:
- Intelektuální entita je nově brána jako rovná původním čtyřem Object Types (Object, Agent, Events a Rights)
- Environment bude samostatná entita - pravděpodobně další Object Type nebo jedna z variant Intelektuální entity; environment nebude již popisovat pouze HW/SW prostředí potřebné pro zobrazení souboru, ale bude více flexibilní - více viz prezentace
Nová verze se chystá na počátek roku 2014 (i přesto, že v prezentaci se mluví o konci roku 2013).
čtvrtek 24. října 2013
Preserving.exe - report z konference o dlouhodobé ochraně SW je dostupný online
V květnu 2013 proběhl summit pod názvem “Preserving.exe: Toward a National Strategy for Preserving Software”. Zaměřený byl na výzvy okolo vytváření sbírek a dlouhodobé ochrany softwaru. Tento problém pálí digital preservation komunitu už poměrně dlouho. Každý archiv nebo knihovna, které se digital preservation zabývají, většinou shromažďují staré SW aplikace všemožného druhu ve svých sbírkách, aby bylo možné jej v budoucnu využít. Využít pro zobrazení, převody starých souborů, pro které dnes SW neexistuje. SW by musel být samozřejmě emulován nebo spuštěn na dobovém počítači. Z těchto důvodů se myšlenka na centrální registr či archiv SW se tak čas od času objeví.
Jedním z výstupů Preserving.exe je i report, který si můžete přečíst zde - http://www.digitalpreservation.gov/multimedia/documents/PreservingEXE_report_final101813.pdf.
Doporučuji zvláště článek An Executable Past: The Case for a National Software Registry, který začíná na straně 12.
Prezentace jsou dostupné na tomto URL http://www.digitalpreservation.gov/meetings/preservingsoftware2013.html
středa 23. října 2013
AVA_net: Holandská síť institucí archivujících audiovizuální obsah
Zajímavý projekt - AVA_net - sdružuje osm institucí, které se archivací audiovizuálního obsahu v Nizozemí zabývají. Kromě sdílení informací a zkušeností s digitalizací, archivací atd. má také lobovat za audiovizuální archivy a instituce spravující audiovizuální kulturní dědictví.
http://www.avarchivering.nl/node/797
Možná by mělo smysl, aby i u nás NFA, ČT, ČRO, NA, CITEM, a další instituce spojily své síly:-)
http://www.avarchivering.nl/node/797
Možná by mělo smysl, aby i u nás NFA, ČT, ČRO, NA, CITEM, a další instituce spojily své síly:-)
pondělí 21. října 2013
Otevřený webinář - Interoperability and Intelligibility Strategies (APARSEN)
8. listopadu 2013 (v 15 hod. SEČ) proběhne otevřený webinář o interoperabilitě a srozumitelnosti (Interoperability And Intelligibility) v oblasti dlouhodobé ochrany. Webinář bude dostupný na
http://alliancepermanentaccess.megameeting.com/guest/#&id=36245 v megameeting (nutná instalace).
PROGRAM
1. Simon Lambert, APARSEN Coordinator: “The importance of interoperability and intelligibility in Digital Preservation”
2. Barbara Bazanella, University of Trento, APARSEN partner on services to support interoperability: “Interoperability Objectives and Approaches”
3. Yannis Tzitzikas, FORTH, leader of the APARSEN workpackage on interoperability: “Interoperability Strategies”
4. Johannes Reetz, Max Planck – Plasma Physics Munich, EUDAT: “How EUDAT faces interoperability”
5. David Giaretta: “Impact on APARSEN”.
PROGRAM
1. Simon Lambert, APARSEN Coordinator: “The importance of interoperability and intelligibility in Digital Preservation”
2. Barbara Bazanella, University of Trento, APARSEN partner on services to support interoperability: “Interoperability Objectives and Approaches”
3. Yannis Tzitzikas, FORTH, leader of the APARSEN workpackage on interoperability: “Interoperability Strategies”
4. Johannes Reetz, Max Planck – Plasma Physics Munich, EUDAT: “How EUDAT faces interoperability”
5. David Giaretta: “Impact on APARSEN”.
pátek 18. října 2013
Centrálny dátový archív: dokumenty k certifikaci důvěryhodného archivu online
Na stránkách slovenského Centrálniho dátového archívu, projektu financovaného z EU OPIS osa 2 postupně vzniká dokumentace k certifkaci důveryhodného digitálního repozitáře.
CDA by měl ukládat data všech digitalizačních projektů OPIS osa 2.
pondělí 14. října 2013
Co vše hraje roli v hodnocení/výběru formátů?
Komunita okolo dlouhodobé ochrany digitálních dat se často soustředí na formáty dat. Obecně se uvádí, že je vhodné vybírat pro dlouhodobé uložení open source formáty, formáty široce rozšířené, s podporou v mnoha aplikacích atd atd. Co ale doopravdy hraje roli ve výběru? Je to tak jednoduché? To se dozvíte v tomto článku (http://www.openplanetsfoundation.org/blogs/2013-09-30-assessing-file-format-risks-searching-bigfoot) Johana van der Knijffa z Královské knihovny v Haagu. Jeho post není přímo o tomto tématu, ale pěkně popisuje uvažování, které se odehrává při výběru vhodných formátů, i to jak se takový výběr může ukázat mnohem komplikovanější, než se zdálo.
Nezapomeňte si projít diskuzi pod článkem.
Nezapomeňte si projít diskuzi pod článkem.
neděle 13. října 2013
Dlouhodobá ochrana databází - nový nástroj (DB preservation toolkit) ke stažení a vyzkoušení
Database Digital Preservation, tedy dlouhodobá ochrana databází, se stává stále více aktuálním problémem. Různé instituce provádějí výzkum v této oblasti, protože se s databázemi setkávají a musí je dlouhodobě uchovat - resp. jejich obsah. Workpackage k této problematice mají a vlastní výzkum provádějí např. v NA Nového Zélandu; Queensland State Archive a New South Wales, Austrálie; apod. Ve Švýcarsku a Dánsku používají v ostrém provozu nástroj SIARD (vývoj NA Švýcarska), v Dánsku si jej ovšem lehce upravili a dodělali podle svých představ.
Nyní se jako samostatný nástroj objevuje DB preservation toolkit. Tento nástroj byl součástí portugalského open source preservation systému RODA a dal se tak použít do jisté míry samostatně, nově se jej ovšem tvůrci rozhodli i samostatně propagovat.
Ke stažení a vyzkoušení na github - http://keeps.github.io/db-preservation-toolkit/
Další informace k problematice ochrany databází např.
- Andrew Lyndley: Database Preservation Evaluation Report - SIARD vs. CHRONOS - PDF ke stažení tady http://tinyurl.com/q6cy3rd
- blog post Migrating Business Systems to the Digital Archives http://tinyurl.com/n8w5xs4
Seznam Digital Preservation Policies/Strategies
Objevil se další web, kde lze vidět seznam DP strategií nebo policies. Tentokrát jde o seznam budovaný v projektu SCAPE a hostovaný na Open Planets Foundation Wiki. Seznam policies archivů, knihoven a dalších institucí najdete zde http://wiki.opf-labs.org/display/SP/Published+Preservation+Policies.
Pokud máte DP policy/strategy publikovanou na webu, můžete ji poslat do projektu SCAPE a poté se objeví v uvedeném seznamu. Kontakt na Barbaru Sierman naleznete v tomto příspěvku na blogu OPF http://www.openplanetsfoundation.org/blogs/2013-10-07-published-preservation-policies
Pokud máte DP policy/strategy publikovanou na webu, můžete ji poslat do projektu SCAPE a poté se objeví v uvedeném seznamu. Kontakt na Barbaru Sierman naleznete v tomto příspěvku na blogu OPF http://www.openplanetsfoundation.org/blogs/2013-10-07-published-preservation-policies
úterý 8. října 2013
Zajímavost - online konverze formátů - ZAMZAR
Dnes jsem narazil na web ZAMZAR, kde je možné provádět online konverze z textových, obrazových, audio, video, CAD, komprimovaných formátů, a také mezi jednotlivými ebook formáty. Rozsah možností je opravdu obrovský. Vyzkoušeno na [doc] > [png] a [doc] > [jpg], konverze proběhla v pořádku. Seznam možných konverzí je tady http://www.zamzar.com/conversionTypes.php.
Po zaregistrování služba ukládá data 7 dní a jsou dostupná přes jednoduchý file manager. Bez registrace dostanete mailem URL, kde si můžete konvertovaný soubor stáhnout.
Důležité je, že služba podporuje i některé netradiční nebo zastaralé formáty. V případě, že máte pár souborů, je to ideální volba, namísto hledání SW, který by vám pomohl v konverzi.
Po zaregistrování služba ukládá data 7 dní a jsou dostupná přes jednoduchý file manager. Bez registrace dostanete mailem URL, kde si můžete konvertovaný soubor stáhnout.
Důležité je, že služba podporuje i některé netradiční nebo zastaralé formáty. V případě, že máte pár souborů, je to ideální volba, namísto hledání SW, který by vám pomohl v konverzi.
pondělí 30. září 2013
Velmi zajímavé prezentace z workshopu "Preservation at scale" při konferenci iPRES 2013
Po konferenci iPRES 2013 proběhlo několik workshopů. Z těch zajímavějších se chceme vrátit k tomu s názvem "Ochrana ve velkém měřítku", kde prezentovali své příspěvky zástupci institucí, které provádějí dlouhodobou digitální ochranu na velkých objemech dat. Většinou jde o národní knihovny nebo archivy, univerzity nebo výzkumné instituce. Prezentace jsou dostupné na google docs tady https://docs.google.com/document/d/1x-1e6SbgkULin3lJ6o0G26iBmjzzHj9v4Argy_-4eV0/edit?usp=sharing.
Za pozornost stojí prezentace Marcela Rase z Královské knihovny Nizozemí. Popisuje v ní přechod od long-term preservation systému DIAS na jejich nový LTP systém v letošním roce. Mluví také o tom, jak digital preservation ovlivňuje chod celé knihovny a její organizační strukturu. Doslova říká: "Digital preservation and permanent access has become the core of the library process". Přesně tomuto se české knihovny a archivy dle mého názoru stále brání a myslí si, že digital preservation je záležitostí jednoho oddělení nebo odboru. Není. Marcel Ras nakonec shrnuje:
• Preservation is not just ingest, storage and technique
• It demands for long-term organizational commitment
• It requires continuous research
• It requires substantial investments in infrastructure and up-to-date expertise and skills
• It brings organizational changes
• It asks for constant rethinking
• It demands for flexibility
• It demands maturity of the organisation
Z pohledu technického řešení long-term preservation systémů jsou zajímavé také prezentace Tobiase Steinkeho z NK Německa, který popisuje jejich nové workflow pro ingest. Podobně také prezentace, kterou přednesla Andrea Goethals z Harvardské univerzitní knihovny, která popisuje jejich long-term preservation systém, kterému říkají DRS.
pátek 27. září 2013
Seminář na téma archivace a zpřístupnění filmového materiálu
Seminář pořádají NA, NFA, a ČIS o.s.
Název: Problematika archivního uložení a zpřístupnění filmových záznamů
22. ŘÍJNA 2013 OD 9.30 HODIN
KINO SVĚTOZOR
Praha 1, Vodičkova 41
Na programu jsou i přednášky o digitalizaci a ukládání filmů.
http://www.nfa.cz/res/data/016/002073.pdf
Název: Problematika archivního uložení a zpřístupnění filmových záznamů
22. ŘÍJNA 2013 OD 9.30 HODIN
KINO SVĚTOZOR
Praha 1, Vodičkova 41
Na programu jsou i přednášky o digitalizaci a ukládání filmů.
http://www.nfa.cz/res/data/016/002073.pdf
čtvrtek 26. září 2013
Zájem o služby knihoven setrvale klesá
Omlouvám se za příspěvek, který se netýká dlouhodobé archivace.
Výsledky výzkumu čtení a čtenáři - prezentace je online na http://knihovnam.nkp.cz/docs/ctenari_2013/Cteni_Vyzkum_2013.pdf
Je to reprezentativní šetření na 1500 respondentech prováděné osobním rozhovorem.
Slide 17, který ukazuje jak klesá zájem populace o služby knihoven, jsem si dovolil připojit. K tomu komentář pana prof Trávníčka z prezentace v Olomouci, že "nejvíce přibývá těch, kdo do knihovny nikdy nešli, v nejmladších kategoriích..."
Během 6 let zmizela knihovnám 1/5 klientů. Další výzkum je plánován za 5 let, pokud bude pokles pokračovat stejně rychle, tak v té době může odpovědět "ano" možná méně než 25% respondentů a "ne, nikdy" odpoví téměř 50% respondentů.
Předpokládám, že v kontextu tohoto výzkumu formulace "veřejná knihovna" znamená jakoukoli knihovnu otevřenou veřejnosti v protikladu knihovně soukromé, jako je ta naše doma. U nás doma počet vypůjčených knih stoupá. Nevedeme průkazky, poplatky, a nebuzerujeme čtenáře, že knihu počmárali nebo zničili:-)
Výsledky výzkumu čtení a čtenáři - prezentace je online na http://knihovnam.nkp.cz/docs/ctenari_2013/Cteni_Vyzkum_2013.pdf
Je to reprezentativní šetření na 1500 respondentech prováděné osobním rozhovorem.
Slide 17, který ukazuje jak klesá zájem populace o služby knihoven, jsem si dovolil připojit. K tomu komentář pana prof Trávníčka z prezentace v Olomouci, že "nejvíce přibývá těch, kdo do knihovny nikdy nešli, v nejmladších kategoriích..."
Během 6 let zmizela knihovnám 1/5 klientů. Další výzkum je plánován za 5 let, pokud bude pokles pokračovat stejně rychle, tak v té době může odpovědět "ano" možná méně než 25% respondentů a "ne, nikdy" odpoví téměř 50% respondentů.
Předpokládám, že v kontextu tohoto výzkumu formulace "veřejná knihovna" znamená jakoukoli knihovnu otevřenou veřejnosti v protikladu knihovně soukromé, jako je ta naše doma. U nás doma počet vypůjčených knih stoupá. Nevedeme průkazky, poplatky, a nebuzerujeme čtenáře, že knihu počmárali nebo zničili:-)
pondělí 23. září 2013
Konference CNZ 2013: Důvěra a archivace ve státní správě
Program konference CNZ je k dispozici na
http://www.enforum.cz/akce/cnz-konference
http://www.enforum.cz/data/files/Event_Ckedit/2_1_Detailn%C3%AD%20program%20konference%20CNZ%202013.pdf
Hlavním speakerem je Natalie Harrower z Digital Respository of Ireland, což je instituce financovaná irskou Higher Education Authority, jejímž cílem je vybudovat důvěryhodné digitální úložiště pro "humanities and social sciences." Tedy z instituce, která je provozována univerzitami a vědeckými institucemi sdruženými v konzorciu DRI a financovaná z rozpočtů na vysoké školství. Více o DRI v nedávném příspěvku z konference iPRES 2013 naleznete tady http://tinyurl.com/o2sr9yt. Paradoxně tohle bude jediná přednáška podobného typu, zbytek konference bude jako vždy zaměřen na problematiku e-governementu a archivace ve státní správě.
Program konference má stejnou strukturu jako v minulých letech a končí představením řešení firem Gordic, ICZ, IBM, Fujitsu atd. a příspěvkem pana Bernase o současném stavu projektu Národní digitální archiv. Letos se možná už dozvíme, která z prezentujících firem bude systémovým integrátorem tohoto projektu a z jakých komponent bude dodané řešení vytvořeno...
http://www.enforum.cz/akce/cnz-konference
http://www.enforum.cz/data/files/Event_Ckedit/2_1_Detailn%C3%AD%20program%20konference%20CNZ%202013.pdf
Hlavním speakerem je Natalie Harrower z Digital Respository of Ireland, což je instituce financovaná irskou Higher Education Authority, jejímž cílem je vybudovat důvěryhodné digitální úložiště pro "humanities and social sciences." Tedy z instituce, která je provozována univerzitami a vědeckými institucemi sdruženými v konzorciu DRI a financovaná z rozpočtů na vysoké školství. Více o DRI v nedávném příspěvku z konference iPRES 2013 naleznete tady http://tinyurl.com/o2sr9yt. Paradoxně tohle bude jediná přednáška podobného typu, zbytek konference bude jako vždy zaměřen na problematiku e-governementu a archivace ve státní správě.
Program konference má stejnou strukturu jako v minulých letech a končí představením řešení firem Gordic, ICZ, IBM, Fujitsu atd. a příspěvkem pana Bernase o současném stavu projektu Národní digitální archiv. Letos se možná už dozvíme, která z prezentujících firem bude systémovým integrátorem tohoto projektu a z jakých komponent bude dodané řešení vytvořeno...
pondělí 16. září 2013
Národní digitální knihovna - propagační video CGI
Už nemusíme mít strach, že bychom ztratili moudrost obsaženou v našich knihách, říká ředitel Národní knihovny.
Data z digitalizace v projektu NDK jsou "continuously nurtured by an OAIS compliant long-term preservation system...."
Data z digitalizace v projektu NDK jsou "continuously nurtured by an OAIS compliant long-term preservation system...."
iPres 2013, příspěvky jsou online
http://purl.pt/24107/1/
K některým příspěvkům se na tomhle blogu určitě ještě vrátíme.
Příspěvky k paralelní akci DC:
http://dcevents.dublincore.org/index.php/IntConf/dc-2013/schedConf/presentations
K některým příspěvkům se na tomhle blogu určitě ještě vrátíme.
Příspěvky k paralelní akci DC:
http://dcevents.dublincore.org/index.php/IntConf/dc-2013/schedConf/presentations
pátek 13. září 2013
Bakalářská práce k problematice dlouhodobé archivace blatantně opsaná z materiálů projektu NDK
UHLÍŘ, P. Zálohování dat a datová úložiště. Brno: Vysoké učení technické v
Brně, Fakulta podnikatelská, 2013. 54 s. Vedoucí bakalářské práce Ing. Jiří Kříž, Ph.D.
Opravdu nechápu, jak může být taková práce "úspěšně obhájena" když z 80% procent opisuje volně dostupné materiály projektu NDK? Kde je ten slavný brněnský anti-plagiátorský systém?
Pro VUT v Brně to není moc hezká vizitka.
Plný text je k dispozici online zde:
čtvrtek 5. září 2013
VUT Brno, nový partner v projektu SCAPE
V jednom z největších projektů v oblasti dlouhodobé archivace financovaném ze Strukturálních fondů došlo teď těsně před koncem projektu k zajímavé změně: mezi partnery SCAPE se objevila moravská univerzita - VUT Brno.
Po Národní knihovně (DigitalPreservationEurope, Liwa) a Ciantu (CASPAR) je to další instituce z ČR, která je partnerem v projektu zabývajícím se dlouhodobou archivací v programu ICT.
Jak přesně se asi VUT Brno na projektu SCAPE podílí?
Po Národní knihovně (DigitalPreservationEurope, Liwa) a Ciantu (CASPAR) je to další instituce z ČR, která je partnerem v projektu zabývajícím se dlouhodobou archivací v programu ICT.
Jak přesně se asi VUT Brno na projektu SCAPE podílí?
úterý 3. září 2013
OAIS v češtině?
Národní knihovna připravuje pro Úřad pro technickou normalizaci, metrologii a státní zkušebnictví (ÚNMZ) překlad normy ISO 16472:2012, tzv. referenčního modelu OAIS.
Normu překládají L. Cubr a L. Jansová (Skolková), oba absolventi UISK FF UK.
Překlad normy OAIS byl vydán v loňském roce v Německu (http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:0008-2012051101) a tam se vytvoření smysluplné a použitelné terminologie věnovala pracovní skupina NESTORu složená ze zástupců archivů, knihoven a univerzit z Německa a Švýcarska.
Doufejme, že i v ČR bude mít komunita zabývající dlouhodobou archivací možnost se k navržené terminologii vyjádřit. Bylo by pěkné, kdyby se česká terminologie ujala i v archivech, muzeích a firmách, a kdyby překlad nebyl jen akademickým cvičením. Konečně nejstarší překlady týkající se dlouhodobé archivace pocházejí z pera archivářů (např. v překladu "Strategie digitálního archivování" od A. Browna se museli pánové Wanner a Macek s rodící se OAIS terminologií v češtině nějak popasovat už v roce 2003).
pondělí 26. srpna 2013
Nová Národní digitální knihovna Polska - POLONA - jak se vám líbí?
Omluva za ne zcela "digital preservation" příspěvek.
Já se přiznám, mně se POLONA líbí a Polákům lehce závidím. Digitální knihovna má moderní rozhraní, prohlížení je snadné, filtrování podle typů dokumentů, jazyka, autora, roku atd.; zoomování, stažení metadat v XML/RDF; plná integrace na Facebook, Twitter, Google + na sdílení a zalogování pomocí těchto služeb; tvorba vlastních poznámek a sbírek jsou samozřejmostí. POLONA výborně funguje i na mobilních zařízeních, na které je přizpůsobena - vyzkoušeno na ipadu a na tabletu s androidem.
Knihovnu naleznete na http://polona.pl/ - stojí za vyzkoušení.
Trošku technického povídání tady http://www.theeuropeanlibrary.org/tel4/newsitem/2554
A tak si říkám, bude rozhraní české Národní digitální knihovny (http://www.ndk.cz/narodni-dk) příští rok vypadat podobně?
Necháte si podle obsahu NDK udělat "kérku" (viz konec videa níže).
Já se přiznám, mně se POLONA líbí a Polákům lehce závidím. Digitální knihovna má moderní rozhraní, prohlížení je snadné, filtrování podle typů dokumentů, jazyka, autora, roku atd.; zoomování, stažení metadat v XML/RDF; plná integrace na Facebook, Twitter, Google + na sdílení a zalogování pomocí těchto služeb; tvorba vlastních poznámek a sbírek jsou samozřejmostí. POLONA výborně funguje i na mobilních zařízeních, na které je přizpůsobena - vyzkoušeno na ipadu a na tabletu s androidem.
Knihovnu naleznete na http://polona.pl/ - stojí za vyzkoušení.
Trošku technického povídání tady http://www.theeuropeanlibrary.org/tel4/newsitem/2554
A tak si říkám, bude rozhraní české Národní digitální knihovny (http://www.ndk.cz/narodni-dk) příští rok vypadat podobně?
Necháte si podle obsahu NDK udělat "kérku" (viz konec videa níže).
čtvrtek 22. srpna 2013
Preservica: nový web
Nový web ke cloudovému systému Preservica, Tessella.
http://go.preservica.com/active-preservation/
http://go.preservica.com/active-preservation/
středa 21. srpna 2013
Optimalizace archivních JP2 souborů pro vytváření JP2 uživatelských kopií
Johan van der Knijff z Královské knihovny Nizozemí publikoval zajímavý článek o tom, jak nastavit a jak přistupovat k vytváření uživatelských JP2 kopií z JP2 archivních obrazů. V článku je podrobně rozebráno nastavení různých JP2 nástrojů, které lze využít.
http://www.openplanetsfoundation.org/blogs/2013-08-19-optimising-archival-jp2s-derivation-access-copies
http://www.openplanetsfoundation.org/blogs/2013-08-19-optimising-archival-jp2s-derivation-access-copies
středa 14. srpna 2013
Digital Preservation Business Case Toolkit
Na webu DPC byl zveřejněn Digital Preservation Business Case Toolkit - sada textů určených k tomu, aby správce digitálních sbírek provedly jednotlivými fázemi tvorby dokumentu, který má klíčové osoby přesvědčit o tom, že dlouhodobou ochranu je třeba financovat. Toolkit je zaměřen přímo na digitální ochranu a obsahuje tedy i doporučení specifických nástrojů např. pro analýzu rizik. Jedná se zatím o první verzi toolkitu, která bude (doufejme) dále doplňována.
Nová analýza 33 existujících strategií dlouhodobé ochrany digitálních dat
Madeline Sheldon publikovala analýzu 33 existujících strategií dlouhodobé ochrany publikovaných knihovnami, archivy a muzei po celém světě. Pokud tedy vytváříte vlastní strategii, můžete se inspirovat, linky jsou součástí zprávy. Shrnutí naleznete na blogu Knihovny Kongresu tady http://blogs.loc.gov/digitalpreservation/2013/08/analysis-of-current-digital-preservation-policies-archives-libraries-and-museums/?loclr=twdig.
Kompletní zprávu pak jako PDF zde http://www.digitalpreservation.gov/documents/Analysis%20of%20Current%20Digital%20Preservation%20Policies.pdf.
Zajímavé je použití taxonomie na popis obsahu jednotlivých strategií, co která obsahuje. Viz poslední stránka s tabulkou. Strategie nejčastěji mluví o způsobu ochrany (procesy), zpřístupnění, spolupráci, rolích a odpovědnosti. Nejméně pak o plánování ochrany, auditu, ingestu a právech.
Pozn. - je zajímavé si všimnout, že pokud nemáte strategii publikovanou v angličtině, pro okolní svět neexistuje. Autorka pracuje pouze s těmi, které jsou dostupné v angličtině.
Kompletní zprávu pak jako PDF zde http://www.digitalpreservation.gov/documents/Analysis%20of%20Current%20Digital%20Preservation%20Policies.pdf.
Zajímavé je použití taxonomie na popis obsahu jednotlivých strategií, co která obsahuje. Viz poslední stránka s tabulkou. Strategie nejčastěji mluví o způsobu ochrany (procesy), zpřístupnění, spolupráci, rolích a odpovědnosti. Nejméně pak o plánování ochrany, auditu, ingestu a právech.
Pozn. - je zajímavé si všimnout, že pokud nemáte strategii publikovanou v angličtině, pro okolní svět neexistuje. Autorka pracuje pouze s těmi, které jsou dostupné v angličtině.
Co vlastně je digital preservation neboli dlouhodobá ochrana digitálních dat? Informační video a Prezi prezentace.
V uplynulých dnes se objevily dva zdroje, které zjednodušenou formou vysvětlují problémy digital preservation a jejich možná řešení. Prvním je krátké video společnosti Tessella o jejich produktu Preservica. Preservica je vlastně long-term preservation systém umístěný v cloudu, který může zákazník využívat formou předplatného, nepotřebuje ani HW infrastrukturu (IaaS), digital preservation je poskytována jako služba (DPaaS). Tento přístup by mohl být řešením i pro mnoho českých (nejen paměťových) institucí. Video je dostupné tady - https://www.youtube.com/watch?v=GH19MwjYLwI.
Druhým zdrojem je Prezi prezentace "Digital Preservation - Why, What and How" Nira Sherwintera z firmy Ex Libris. Prezentace je pěkně srozumitelným úvodem do problematiky digital preservation. Ke shlédnutí, sdílení atd. je tady http://prezi.com/fcgsodjqhbry/digital-preservation-why-what-and-how/#%21.
Z obou uvedených zdrojů je jasné, že pouhé uložení a správa původních (originálních) souborů není dlouhodobá ochrana digitálních dat, je to jen její předpoklad. Uchování bit streamu nezajistí použitelnost, vyhledatelnost, srozumitelnost souborů a jejich obsahu v budoucnu.
Druhým zdrojem je Prezi prezentace "Digital Preservation - Why, What and How" Nira Sherwintera z firmy Ex Libris. Prezentace je pěkně srozumitelným úvodem do problematiky digital preservation. Ke shlédnutí, sdílení atd. je tady http://prezi.com/fcgsodjqhbry/digital-preservation-why-what-and-how/#%21.
Z obou uvedených zdrojů je jasné, že pouhé uložení a správa původních (originálních) souborů není dlouhodobá ochrana digitálních dat, je to jen její předpoklad. Uchování bit streamu nezajistí použitelnost, vyhledatelnost, srozumitelnost souborů a jejich obsahu v budoucnu.
pátek 9. srpna 2013
Jak archivovat video: návod nejen pro aktivisty
Aktivisté bojující za lidská práva mají web s metodikou jak vytvářet, popisovat a archivovat videozáznamy.
Veřejně relevantní videozáznamy z našich mobilů, tabletů a dalších přístrojů mají potenciál se stát zajímavým kulturně-historickým materiálem - pokud ovšem přežijí přístroje, na kterých vznikají...
Škoda, že jsme tyhle přístroje neměli po ruce v roce 1989, to by byl tenhle web http://www.europeana1989.eu/en/ asi bohatší. (z ČR se účastní Ústav pro soudobé dějiny a Národní muzeum - pěkná aplikace, ale data skoro žádná...)
Za zmínku také stojí vznik zájmové skupiny W3C.org pro digitální publikování: http://www.w3.org/dpub/IG/
Škoda, že jsme tyhle přístroje neměli po ruce v roce 1989, to by byl tenhle web http://www.europeana1989.eu/en/ asi bohatší. (z ČR se účastní Ústav pro soudobé dějiny a Národní muzeum - pěkná aplikace, ale data skoro žádná...)
Za zmínku také stojí vznik zájmové skupiny W3C.org pro digitální publikování: http://www.w3.org/dpub/IG/
pátek 26. července 2013
Rizika formátu PDF pro dlouhodobou ochranu: pokračování pokusů Johana van der Knijffa
Johan na svém blogu na openplanetsfoundation zveřejnil informace o další části svých pokusů s PDF. Tentokrát použil testovací data zveřejněná na Acrobat Engineering Website.
Testoval výkon Apache Preflight 2.0.0, Adobe Acrobat 10.14, Acrobat Preflight 10.1.3 (090)
Testoval dvě skupiny dat, která měla řadu riskantních vlastností (PDF cabinet of horrors:-) jako kryptování, nevložené fonty, multimediální obsah, javascript.
Ze závěrů asi stojí za to zmínit:
- Apache Preflight 2.0.0 neindentifikuje korektně kryptované soubory a soubory chráněné heslem
- při kontrole vložených fontů pomocí Apache Preflight považovat všechny chyby spojené s fonty za potenciální riziko
- multimediální obsah v PDF je pro Apache Preflight přiliš velké sousto - u většiny testovaných souborů nebyl schopen identifikovat specifické vlastnosti související s multimediálním obsahem, javascriptem, vloženými fonty. To by podle Johana nebyl velký problém, pokud bychom chtěli Apache Preflight používat pouze pro testování převoditelnosti PDF do PDF/A. Pokud bychom ale pomocí Apache Preflight chtěli hledat potenciální preservační rizika ve velmi heterogenní sbírce PDF, takt to problém bude.
Testoval výkon Apache Preflight 2.0.0, Adobe Acrobat 10.14, Acrobat Preflight 10.1.3 (090)
Testoval dvě skupiny dat, která měla řadu riskantních vlastností (PDF cabinet of horrors:-) jako kryptování, nevložené fonty, multimediální obsah, javascript.
Ze závěrů asi stojí za to zmínit:
- Apache Preflight 2.0.0 neindentifikuje korektně kryptované soubory a soubory chráněné heslem
- při kontrole vložených fontů pomocí Apache Preflight považovat všechny chyby spojené s fonty za potenciální riziko
- multimediální obsah v PDF je pro Apache Preflight přiliš velké sousto - u většiny testovaných souborů nebyl schopen identifikovat specifické vlastnosti související s multimediálním obsahem, javascriptem, vloženými fonty. To by podle Johana nebyl velký problém, pokud bychom chtěli Apache Preflight používat pouze pro testování převoditelnosti PDF do PDF/A. Pokud bychom ale pomocí Apache Preflight chtěli hledat potenciální preservační rizika ve velmi heterogenní sbírce PDF, takt to problém bude.
středa 24. července 2013
Další zpráva DPC: Preserving Computer-Aided Design (CAD)
Přinejmenším stejně zajímavý jako report zmíněný v předešlém příspěvku je další dokument z DPC týkající se dlouhodobé archivace CAD modelů a objektů:
- Popisuje specifické vlastnosti tohoto typu digitálního materiálu
- Shrnuje výzkumné a archivační aktivity jednotlivých výzkumných projektů v této oblasti (LOTAR, STEP atp.) a také průmyslových sdružení a paměťových institucí, které formáty typu CAD používají.
Report je ke stažení zde: http://dx.doi.org/10.7207/ twr13-02
- Popisuje specifické vlastnosti tohoto typu digitálního materiálu
- Shrnuje výzkumné a archivační aktivity jednotlivých výzkumných projektů v této oblasti (LOTAR, STEP atp.) a také průmyslových sdružení a paměťových institucí, které formáty typu CAD používají.
Report je ke stažení zde: http://dx.doi.org/10.7207/
středa 17. července 2013
Publikována zpráva DPC o ochranných metadatech (DPC Technology Watch Report "Preservation metadata")
Britská organizace Digital Preservation Coalition (DPC) zpřístupnila text druhé aktualizované verze reportu "Preservation metadata" - http://dx.doi.org/10.7207/twr13-03. První edice vyšla v roce 2005 a text již bylo potřeba podstatně předělat. Od roku 2005 se jedná o jednu z nejstahovanějších zpráv celé série Technology Watch (http://www.dpconline.org/advice/technology-watch-reports).
Nová verze obšírně popisuje různé aspekty ochranných metadat, zvláště ve vztahu ke standardu PREMIS. V textu naleznete definice ochranných metadat, vývoj pohledu na ně, způsoby využívání v různých institucích, způsob použití PREMIS ve schématu METS, přehled užitečných nástrojů k tvorbě ochranných metadat aj.
Text tak je velmi užitečný pro instituce, které s ochrannými metadaty chtějí začít, ale i pro ty, které je již využívají. Popsána je aktuální situace ve využívání ochranných metadat ve světě, což může být inspirací.
Nová verze obšírně popisuje různé aspekty ochranných metadat, zvláště ve vztahu ke standardu PREMIS. V textu naleznete definice ochranných metadat, vývoj pohledu na ně, způsoby využívání v různých institucích, způsob použití PREMIS ve schématu METS, přehled užitečných nástrojů k tvorbě ochranných metadat aj.
Text tak je velmi užitečný pro instituce, které s ochrannými metadaty chtějí začít, ale i pro ty, které je již využívají. Popsána je aktuální situace ve využívání ochranných metadat ve světě, což může být inspirací.
čtvrtek 11. července 2013
5D paměť využívající křemíkový krystal
Vědci na Univerzitě v Southamptonu oznámili průlom ve vývoji optických paměťových médií.
Demonstrovaná technologie využívá ultra rychlý laser, který data ukládá do "samouspořádné nanostruktury" v taveném křemeni. Data jsou uložena ve třech vrstvách v nanostrukturovaných bodech, které jsou od sebe vzdáleny pět mikrometrů.
Tato technologie, poprvé navržená již v roce 1996, by mohla zajistit uložení obrovských objemů dat miliony let. Oznámení mluví o 360TB na disk a odolnosti proti teplotám až 1000°C.
Podrobněji v abstraktu a na webu univerzity:
http://www.orc.soton.ac.uk/5dopticalstore.html
http://www.orc.soton.ac.uk/fileadmin/downloads/5D_Data_Storage_by_Ultrafast_Laser_Nanostructuring_in_Glass.pdf
Ještě ohledně tech 5D: jako čtvrtý a pátý rozměr se používají dva "dvojlomové" parametry: "pomalá orientace osy" a "síla retardace":-)
Demonstrovaná technologie využívá ultra rychlý laser, který data ukládá do "samouspořádné nanostruktury" v taveném křemeni. Data jsou uložena ve třech vrstvách v nanostrukturovaných bodech, které jsou od sebe vzdáleny pět mikrometrů.
Tato technologie, poprvé navržená již v roce 1996, by mohla zajistit uložení obrovských objemů dat miliony let. Oznámení mluví o 360TB na disk a odolnosti proti teplotám až 1000°C.
Podrobněji v abstraktu a na webu univerzity:
http://www.orc.soton.ac.uk/5dopticalstore.html
http://www.orc.soton.ac.uk/fileadmin/downloads/5D_Data_Storage_by_Ultrafast_Laser_Nanostructuring_in_Glass.pdf
Ještě ohledně tech 5D: jako čtvrtý a pátý rozměr se používají dva "dvojlomové" parametry: "pomalá orientace osy" a "síla retardace":-)
čtvrtek 4. července 2013
FileFormat.Info přidán do sekce Tools/Nástroje
Web FileFormat.Info (http://www.fileformat.info/index.htm) je vynikajícím zdrojem informací o formátech, nástrojích na migraci, extrakci metadat, validaci, identifikaci apod. Web mj. obsahuje databázi fyzických nosičů, formátů, přípon formátů, MIME types, linky na relevantní zdroje atd atd. U formátů jsou někde i ukázkové soubory.
Užitečné mohou být také online nástroje, které web poskytuje (http://www.fileformat.info/tool/index.dir) - je mezi nimi mj. UNIX FILE, nástroje na hashování, UUID generátor aj.
V sekci Convert (http://www.fileformat.info/convert/image/) najdete mj. i online ImageMagick metadata extractor/viewer a jiné online konverzní nástroje.
Celý web FileFormat.Info stojí za podrobné prozkoumání.
Užitečné mohou být také online nástroje, které web poskytuje (http://www.fileformat.info/tool/index.dir) - je mezi nimi mj. UNIX FILE, nástroje na hashování, UUID generátor aj.
V sekci Convert (http://www.fileformat.info/convert/image/) najdete mj. i online ImageMagick metadata extractor/viewer a jiné online konverzní nástroje.
Celý web FileFormat.Info stojí za podrobné prozkoumání.
ICC profily v JPEG 2000 - změna standardu
JPEG 2000 je obrazový formát využívaný pro svou pokročilou kompresi a zachování kvality obrazu. Ti z vás, kteří jej využívají vědí, že jednou z jeho nevýhod je velmi limitované využití ICC profilů.
Johan van der Knijff nyní na webu OPF zveřejnil update svého staršího textu, který se těmto problémům věnoval. Nově uvádí, že specifikace JPEG 2000 byla na začátku roku 2013 upravena a to následujícím způsobem: Restricted ICC profil nyní nově dovoluje využití "display" profilu (předtím pouze "input" profil). To dává větší možnosti využití standardu JPEG 2000. Dobrou zprávou je také, že nástroje na tvorbu JPEG 2000 obrazů od předních výrobců (Kakadu, Aware aj.) tuto změnu podporují. Některé již dlouhodobě (mimo standard), některé byly upraveny.
Další podrobnosti viz v detailnějším Johanově článku - http://www.openplanetsfoundation.org/blogs/2013-07-01-icc-profiles-and-resolution-jp2-update-2011-d-lib-paper
Johan van der Knijff nyní na webu OPF zveřejnil update svého staršího textu, který se těmto problémům věnoval. Nově uvádí, že specifikace JPEG 2000 byla na začátku roku 2013 upravena a to následujícím způsobem: Restricted ICC profil nyní nově dovoluje využití "display" profilu (předtím pouze "input" profil). To dává větší možnosti využití standardu JPEG 2000. Dobrou zprávou je také, že nástroje na tvorbu JPEG 2000 obrazů od předních výrobců (Kakadu, Aware aj.) tuto změnu podporují. Některé již dlouhodobě (mimo standard), některé byly upraveny.
Další podrobnosti viz v detailnějším Johanově článku - http://www.openplanetsfoundation.org/blogs/2013-07-01-icc-profiles-and-resolution-jp2-update-2011-d-lib-paper
pondělí 1. července 2013
ANADP II - nové výstupy plánovány na letošní podzim
Od roku 2011 fungující aktivita Aligning National Approaches to Digital Preservation uspořádá 18-20. listopadu 2013 své třetí zasedání/konferenci. Předchozí dvě byly velmi úspěšné. Tentokrát má zasedání v podtitulu slovo "akční" a během těchto tří dnů budou představeny některé výstupy. Budou se konat také "akční sekce", které by měly naznačit řešení pro následující oblasti:
- vytvoření komunitou spravovaného registru relevantních nástrojů pro DP
- aplikace OAIS na distribuovanou dlouhodobou ochranu digitálních dat (DP)
- case studies a kvantitativní data z projektu 4C
- vytvoření registru pro výuku a školení o DP aj.
úterý 25. června 2013
Na kávu do Lisabonu: iPRES 2013
Postupně se ujasňuje co bude k vidění a slyšení na letošním výročním desátém iPRESu.
Týden v zářijovém Lisabonu si můžete osladit nejen výbornou portugalskou kávou (uma bica) a dortíkem Pastéis de nata (foto z wikipedie vlevo), ale také řadou workshopů a tutoriálů.
Především nás zaujaly například následující workshopy:
Týden v zářijovém Lisabonu si můžete osladit nejen výbornou portugalskou kávou (uma bica) a dortíkem Pastéis de nata (foto z wikipedie vlevo), ale také řadou workshopů a tutoriálů.
Především nás zaujaly například následující workshopy:
- iPREShack: SPRUCE, CURATEcamp and OPF Hackathon
- Digital Preservation Capabilities - How to assess and improve capabilities in digital preservation?
- Cost of Curation
Na tutoriálech se můžete dozvědět jak začít s webarchivací, jaké nástroje používat pro analýzu rizik v repozitáři, jak archivovat výzkumná data a vědecké procesy a mnoho dalšího. iPres letos probíhá společně s konferencí DC 2013, a účastníci mohou mezi konferencemi volně přecházet.
V programu je také oznámen příspěvek kolegy Hutaře o tom, jak se na Novém Zélandu zbavovali repozitáře Fedora Commons: Archives New Zealand Migration from Fedora Commons to the Rosetta Digital Preservation System - Jan Hutar
Letošní iPRES bude určitě zajímavější než minulé dva ročníky.
Letošní iPRES bude určitě zajímavější než minulé dva ročníky.
pondělí 24. června 2013
Vydán DROID 6.1.2 - plně funkční i pro JAVA 1.7!
Ti z vás, kteří měli od letošního jara problémy s nefunkčním nástrojem DROID, jistě uvítají novou verzi, která funguje se starou verzí Javy 1.6 i s verzí novou 1.7. Starší verze DROIDu nefungovala na počítačích, kde byla Java 1.7, nyní je vše v pořádku.
Stahujte odsud http://www.nationalarchives.gov.uk/information-management/projects-and-work/droid.htm
Stahujte odsud http://www.nationalarchives.gov.uk/information-management/projects-and-work/droid.htm
středa 12. června 2013
Debata o dlouhodobé archivaci dat na ABC Linuxu
http://www.abclinuxu.cz/poradna/hardware/show/378574
Téma Personal digital archiving v českém kontextu ještě není na konferenci, ale tu a tam se taková debata objeví...
Kongresová knihovna má k tématu archivace soukromých dat speciální stránku a letos publikovala volně dostupnou publikaci....
web: http://www.digitalpreservation.gov/personalarchiving/
PersPectives on Personal Digital archiving, NDIIPP, 2013
http://www.digitalpreservation.gov/documents/ebookpdf_march18.pdf
Toto téma bude mít také samostatný tutorial na zářijové konferenci iPRES v Lisabonu. Více informací zde http://ipres2013.ist.utl.pt/t1-5.pdf, konference iPRES http://ipres2013.ist.utl.pt/index.html. Podobný tutorial proběhl na iPRESu již v roce 2010.
Téma Personal digital archiving v českém kontextu ještě není na konferenci, ale tu a tam se taková debata objeví...
Kongresová knihovna má k tématu archivace soukromých dat speciální stránku a letos publikovala volně dostupnou publikaci....
web: http://www.digitalpreservation.gov/personalarchiving/
PersPectives on Personal Digital archiving, NDIIPP, 2013
http://www.digitalpreservation.gov/documents/ebookpdf_march18.pdf
Toto téma bude mít také samostatný tutorial na zářijové konferenci iPRES v Lisabonu. Více informací zde http://ipres2013.ist.utl.pt/t1-5.pdf, konference iPRES http://ipres2013.ist.utl.pt/index.html. Podobný tutorial proběhl na iPRESu již v roce 2010.
pondělí 10. června 2013
Nový seznam nástrojů na digital preservation - tentokrát na webu Kongresové knihovny
Kongresová knihovna zveřejnila nový seznam nástrojů, které vám mohou pomoci při různých problémech v oblasti digital preservation. Seznam obsahuje nástroje malé až po celé LTP systémy. Doufejme, že se seznam bude dále rozrůstat.
http://www.digitalpreservation.gov/tools/
Link byl také přidán do sekce "Nástroje/Tools" tohoto blogu.
http://www.digitalpreservation.gov/tools/
Link byl také přidán do sekce "Nástroje/Tools" tohoto blogu.
úterý 4. června 2013
Preservica jako služba v G-Cloud
Systém pro dlouhodobou archivaci od firmy Tessella, využívající Amazon cloud storage, byl zařazen mezi služby G-Cloudu, což je britský program na podporu využívaní cloudových služeb ve veřejném sektoru.
Informace o programu Cloud Store: http://govstore.service.gov.uk/cloudstore/
Preservica na Cloud Store: http://govstore.service.gov.uk/cloudstore/preservica
Tisková zpráva: http://www.prweb.com/releases/2013/6/prweb10784989.htm
Podrobnosti o nabízené službě obsahují také informaci o cenách:
http://assets-production.govstore.service.gov.uk/Giii%20Attachments/TESSELLA%20Limited/Bids/Service%20Definition%20for%20Preservica.pdf
Informace o programu Cloud Store: http://govstore.service.gov.uk/cloudstore/
Preservica na Cloud Store: http://govstore.service.gov.uk/cloudstore/preservica
Tisková zpráva: http://www.prweb.com/releases/2013/6/prweb10784989.htm
Podrobnosti o nabízené službě obsahují také informaci o cenách:
http://assets-production.govstore.service.gov.uk/Giii%20Attachments/TESSELLA%20Limited/Bids/Service%20Definition%20for%20Preservica.pdf
středa 29. května 2013
Ztrátový (matematicky) JPEG2000 pro archivní mastery?
Zajímavá studie Roberta Buckleyho pro Kongresovou knihovnu "Using Lossy JPEG2000 Compression For Archival Master Files" doporučuje matematicky ztrátovou kompresi (2-10:1) pro ukládání archivních masterů z digitalizace. Taková komprese neznamená žádnou ztrátu vizuální informace při další redukci velikosti souboru.
http://www.digitizationguidelines.gov/still-image/documents/JP2LossyCompression.pdf
Studie také rozebírá možnosti kódování JPEG2000 "by size" nebo "by quality". Každý způsob řízení kodování do JPEG2000 se hodí pro jiný typ obrázků a jiná workflow.
V tomto kontextu stojí za zmínku také dokument Mezinárodní telekomunikační unie, http://www.itu.int/rec/T-REC-T.803-200211-I/en, který podrobně a s příklady ukazuje jak testovat konformanci nástrojů na generování a dekodování JPEG2000 s ISO/IEC 15444-1:2004.
http://www.digitizationguidelines.gov/still-image/documents/JP2LossyCompression.pdf
Studie také rozebírá možnosti kódování JPEG2000 "by size" nebo "by quality". Každý způsob řízení kodování do JPEG2000 se hodí pro jiný typ obrázků a jiná workflow.
V tomto kontextu stojí za zmínku také dokument Mezinárodní telekomunikační unie, http://www.itu.int/rec/T-REC-T.803-200211-I/en, který podrobně a s příklady ukazuje jak testovat konformanci nástrojů na generování a dekodování JPEG2000 s ISO/IEC 15444-1:2004.
neděle 26. května 2013
EPUB jako archivní formát - update 2013
Johan van der Knijff z NK Nizozemí publikoval minulý rok obsáhlou zprávu o vhodnosti formátu EPUB pro dlouhodobou archivaci. Letos se k tématu vrátil a text aktualizoval. Od minulého roku došlo k dalšímu vývoji tohoto formátu, EPUB3 má podporu ve čtečkách a SW aplikacích (iBooks, Sony etc.). Update zároveň upozorňuje na nové nástroje na charakterizaci, které s EPUBem pracují.
Vše na Johanově příspěvku na OPF tady http://www.openplanetsfoundation.org/blogs/2013-05-23-epub-archival-preservation-updatehttp://www.openplanetsfoundation.org/blogs/2013-05-23-epub-archival-preservation-update
Vše na Johanově příspěvku na OPF tady http://www.openplanetsfoundation.org/blogs/2013-05-23-epub-archival-preservation-updatehttp://www.openplanetsfoundation.org/blogs/2013-05-23-epub-archival-preservation-update
pátek 24. května 2013
Akce v Praze: 1st Workshop on Archives in the Digital Age: standards, policies and tools
V rámci konference "3rd International Conference on Integrated Information", která se koná v Praze 5.-9. září 2013 proběhne workshop zaměřený na digitální data v archivech.
a) the use and evaluation of standards, metadata schemas and content description rules implemented by the Archives in order to describe, disseminate and preserve their material in the digital world,
b) the implementation of principles, policies, guidelines and best practices as part of the digitally manipulated archival tasks, and
c) the use and evaluation of archival information systems,
d) the implementation of Semantic Web technologies in Archives, and
e) the use of Social Media in Archives.
Právě byla zveřejněna výzva na podávání příspěvků:
Otevřená témata jsou:
a) the use and evaluation of standards, metadata schemas and content description rules implemented by the Archives in order to describe, disseminate and preserve their material in the digital world,
b) the implementation of principles, policies, guidelines and best practices as part of the digitally manipulated archival tasks, and
c) the use and evaluation of archival information systems,
d) the implementation of Semantic Web technologies in Archives, and
e) the use of Social Media in Archives.
Příspěvky budou publikovány v Procedia Social and Behavioral Sciences.
Nová verze nástroje JHOVE publikována k testování
Gary McGath vydal novou verzi JHOVE, 1.10b1 k testování. Hlavní změnou je vyřešení problému s PDF a JPEG formáty, který v určitých případech u poškozených souborů vedl ke spotřebování veškeré dostupné paměti systému, který JHOVE používal.
Kdo chcete testujte, pro ostatní je poslední verze stabilní 1.9.https://sourceforge.net/projects/jhove/files/jhove/JHOVE%201.10b1/
úterý 14. května 2013
DigCCurr - Curate Thyself: Druhé místo pro DIFFER
B. Vychodil z NK ČR a dokktorand na FF UK získal ocenění na sympoziu DigCCurr - Curate Thyself.
Komise, složená z renomovaných profesorů amerických, kanadských a britských univerzit z oblasti knihovnictví a správy digitálních dat, digital curation, ocenila jeho poster o projektu DIFFER (http://differ.nkp.cz/) druhým místem.
Více informací zde: http://m.sils.unc.edu/news/2013/curate-thyself-digccurr-ending
Komise, složená z renomovaných profesorů amerických, kanadských a britských univerzit z oblasti knihovnictví a správy digitálních dat, digital curation, ocenila jeho poster o projektu DIFFER (http://differ.nkp.cz/) druhým místem.
Více informací zde: http://m.sils.unc.edu/news/2013/curate-thyself-digccurr-ending
Best practices for a digital storage infrastructure for the long-term preservation of digital files
V projektu "Digitizing Contemporary Art" vznikla moc pěkná přehledová studie o technologiích ukládání dat a médiích.
http://www.digitisingcontemporaryart.eu/images/uploads/banners/DCA_D62_Best_practices_for_a_digital_storage_infrastructure_20130506_Version1.pdf
Vysvětluje vždy stručně principy fungování jednotlivých technologií a shrnuje doporučení při používání každé z nich, rozebírá výhody a nevýhody každé technologie. V závěru je i cenové srovnání a doporučený, jak storage technologii vybírat...
http://www.digitisingcontemporaryart.eu/images/uploads/banners/DCA_D62_Best_practices_for_a_digital_storage_infrastructure_20130506_Version1.pdf
Vysvětluje vždy stručně principy fungování jednotlivých technologií a shrnuje doporučení při používání každé z nich, rozebírá výhody a nevýhody každé technologie. V závěru je i cenové srovnání a doporučený, jak storage technologii vybírat...
čtvrtek 9. května 2013
Vyšla zajímavá publikace od Adriana Browna - Practical Digital Preservation
Adrian Brown: Practical Digital Preservation, obsah a první kapitola k nahlédnutí jsou tady http://www.facetpublishing.co.uk/title.php?id=7555
středa 8. května 2013
Digitalizace a dlouhodobá ochrana audio vizuálních dokumentů v Kongresové knihovně - video
Kongresová knihovna zveřejnila velmi zajímavé video ze své laboratoře pro audio vizuální dokumenty. Video je zde hhttp://digitalpreservation.gov/multimedia/videos/packard-campus.html
úterý 7. května 2013
Dánský národní archiv zveřejnil novou verzi své strategie dlouhodobé ochrany
Dánský národní archiv zveřejnil anglickou verzi nové strategie dlouhodobé ochrany digitálních archiválií "Strategy for archiving digital records
at the Danish National Archives". Jde o velmi zajímavé čtení. Národní archiv Dánska má velmi omezený počet formátů, které od původců akceptuje. Původci musí provést migraci dat do těchto formátů a do metadat podle standardu. Transfer digitálních dat probíhá každých 5 let a to i v případě, že se jedná o neuzavřené (tedy živé) fondy. Digitální archiválie jsou pak na obou místech, u původce i v archivu. Archiv tak vlastně dělá snapshoty - více ve vlastním dokumentu. Zároveň každý digitální archiv původce musí projít auditem, zda odpovídá standardům stanoveným národním archivem.
Situace tedy do jisté míry podobná té české, alespoň pokud se jedná o předepsanou množinu formátů, které archiv přijímá.
at the Danish National Archives". Jde o velmi zajímavé čtení. Národní archiv Dánska má velmi omezený počet formátů, které od původců akceptuje. Původci musí provést migraci dat do těchto formátů a do metadat podle standardu. Transfer digitálních dat probíhá každých 5 let a to i v případě, že se jedná o neuzavřené (tedy živé) fondy. Digitální archiválie jsou pak na obou místech, u původce i v archivu. Archiv tak vlastně dělá snapshoty - více ve vlastním dokumentu. Zároveň každý digitální archiv původce musí projít auditem, zda odpovídá standardům stanoveným národním archivem.
Situace tedy do jisté míry podobná té české, alespoň pokud se jedná o předepsanou množinu formátů, které archiv přijímá.
středa 1. května 2013
Nástroj FITS v nové a podstatně vylepšené verzi
Gary McGath strávil celý duben úpravami nástroje FITS, který obsahuje balík jiných nástrojů jako jsou JHOVE, DROID, NZME a dokáže poskytnout jeden výstup v XML s výsledky, které tyto nástroje dávají pro konkrétní soubor.
V nové verzi, která je dostupná na GitHub (https://github.com/gmcgath/fits-mcgath) byly aktualizovány nástroje DROID, JHOVE, a hlavně byla přidána Tika. FITS je teď také schopný dát výsledky (tj. extrahovat vlastnosti) z video souborů, k čemuž využívá elementy např. z MediaInfo, PBcore a popis z Archivematiky.
Rozhodně stojí za vyzkoušení!
Podrobnosti viz zde http://www.openplanetsfoundation.org/blogs/2013-04-30-getting-fits-shape
V nové verzi, která je dostupná na GitHub (https://github.com/gmcgath/fits-mcgath) byly aktualizovány nástroje DROID, JHOVE, a hlavně byla přidána Tika. FITS je teď také schopný dát výsledky (tj. extrahovat vlastnosti) z video souborů, k čemuž využívá elementy např. z MediaInfo, PBcore a popis z Archivematiky.
Rozhodně stojí za vyzkoušení!
Podrobnosti viz zde http://www.openplanetsfoundation.org/blogs/2013-04-30-getting-fits-shape
Zajímavý post o ISO 16363 a ISO 16919 - Audit důvěryhodných digitálních repozitářů
Na blogu texaského státního archivu a knihovny se objevil zajímavý příspěvek (https://www.tsl.state.tx.us/slrm/blog/?p=4812) o stavu norem ISO 16363 a především ISO 16919, která je normou upravující organizace, které mohou provádět audit podle ISO 16363. Norma je zdá se před dokončením.
Zajímavé jsou také informace o testovacích auditech, které proběhly v USA a v Evropě, kde ani jeden repozitář neprošel, většinou kvůli neexistenci tzv. preservation policies nebo psané kodifikaci procesů.
Vytvořit takovouto dokumentaci může trvat velmi velmi dlouho, instituce která by se ráda ucházela o ISO 16363 by proto měla být připravena daleko před auditem.
V textu se také skrývá malé varování: "ISO 16919 is getting closer and closer to finalizing. However, until this standard is completed, you cannot conduct any official ISO 16363 audits, which means that there is no such thing as ISO 16363 compliance. If a vendor tells you that they can do an ISO 16363 audit for you, they are either misinformed or outright lying, so hold on to your wallet!"
pondělí 29. dubna 2013
Signsrch - signature scanner
Na webových fórech se komentáře k tomuhle nástroji obvykle začínají slovem "awesome", ne nadarmo. Pokud vás zajímá, jaká komprese nebo algoritmus byl využit pro vytvoření binárních nebo cryptovaných souborů, které máte před sebou, je signsrch přesně pro vás.
- Signsrch je nástroj pro reverse engeneering binárních souborů, vytvořil ho Luigi Auriemma (http://aluigi.altervista.org/mytoolz.htm#signsrch)
- Seznam signatures, které má v současnosti ve své databázi (poslední verze z dubna 2013 je k vidění například tady: http://fwhacking.blogspot.cz/2011/03/signsrch-signature-scanner.html
- používá se i v dalších sw (http://www.autistici.org/ratsoul/iss.html, http://www.macromonkey.com/bb/viewtopic.php?f=65&t=886)
pondělí 22. dubna 2013
Předělaný web o digital preservation stáního archivu a knihovny Severní Karoliny
Státní archiv a knihovna Severní Karolíny už delší dobu spolupracují na společném webu věnovaném problematice digital preservation. Cílem je pomoci začátečníkům, knihovníkům, archivářům i tvůrcům digitálních informací. Nyní jejich web prošel omlazením a je přehlednější. Podívejte se na http://digitalpreservation.ncdcr.gov/index.html. Pokud kliknete na Policies and Guidelines, dostanete se k volně dostupným dokumentům, které mohou být velmi zajímavé i pro české publikum, a to jak archiváře, tak knihovníky. Dostupné jsou např. dokumenty o preferovaných formátech pro digitální repozitář, archivaci emailů, metadat apod.
pátek 12. dubna 2013
Digitalizace a zpřístupnění dokumentů s texturou v Národním archivu UK
Tento příspěvek ne zcela patří na blog o digital preservation, ale zdá se nám zajímavý.
Na blogu TNA se objevil velmi zajímavý příspěvek o digitalizaci dokumentů, které obsahují texturu a uživatelé je požadují. http://blog.nationalarchives.gov.uk/blog/capturing-and-exploring-texture/
TNA ukládá velké množství takových dokumentů, mezi které patří např. pečeti (klasické, oplatkové pod papírem aj.), textil, různé typy papírů ale i historické tapety a různé koberce. U těchto "archiválií" je důležité aby byla vidět textura.
Pracovníci TNA se proto spojili s Univerzitou v Southamptonu a začali používat nový způsob digitalizace a následného zpracování, který umožňuje osvětlovat objekt z různých úhlů apod.
SW k tomuto potřebný je volně ke stažení tady http://culturalheritageimaging.org/What_We_Offer/Downloads/View/index.html
Při načítání příspěvku na blogu buďte trpěliví, kvůli velikosti ukázek to může trvat i déle než minutu.
Na blogu TNA se objevil velmi zajímavý příspěvek o digitalizaci dokumentů, které obsahují texturu a uživatelé je požadují. http://blog.nationalarchives.gov.uk/blog/capturing-and-exploring-texture/
TNA ukládá velké množství takových dokumentů, mezi které patří např. pečeti (klasické, oplatkové pod papírem aj.), textil, různé typy papírů ale i historické tapety a různé koberce. U těchto "archiválií" je důležité aby byla vidět textura.
Pracovníci TNA se proto spojili s Univerzitou v Southamptonu a začali používat nový způsob digitalizace a následného zpracování, který umožňuje osvětlovat objekt z různých úhlů apod.
SW k tomuto potřebný je volně ke stažení tady http://culturalheritageimaging.org/What_We_Offer/Downloads/View/index.html
Při načítání příspěvku na blogu buďte trpěliví, kvůli velikosti ukázek to může trvat i déle než minutu.
středa 10. dubna 2013
Zajímavých 30 let osobních počítačů v Československu
Povedená akce na FEL ČVUT z tohoto pondělí.
http://www.zive.cz/clanky/zajimavych-30-let-osobnich-pocitacu-v-ceskoslovensku/sc-3-a-168386/default.aspx
Pokud vám něco říkají PMD 85, Commodore 64, Atari, IQ 151 a pod. tak nejste sami. Oficiální instituce, které mají archivaci v popisu práce, se u nás emulací prostředí nebo her z téhle doby nevěnují, moc grantových prostředků se na tuhle oblast také nevydává:-)
A tak programování emulátorů a jejich udržování je obvykle dílem nadšenců, kteří mají také dostatek volného času. Díky nim je k dispozici neuvěřitelné množství nástrojů, jen namátkou:
Emulátor PMD 85: http://pmd85.borik.net/wiki/Emul%C3%A1tor
Informace o IQ 151: http://www.iq151.net/download.htm , http://iq151.8bit-era.cz/
Sinclair: http://www.spectaculator.com/
Atari: http://www.atariportal.cz/static_emulace.php, http://jpecher.sweb.cz/emulator.htm, http://karelik.wz.cz/atari.php, http://raster.infos.cz/atari/a800.htm
Commodore: http://www.c64.cz/index.php, http://www.ccs64.com/, http://www.zzap64.co.uk/c64/c64emulators.html
Amiga: http://www.amigaportal.cz/, http://www.amiga.cz , http://amiga.lukysoft.cz/
Další zajímavé odkazy: http://osmi.tarbik.com/cssr/consul2717.html,
Pěkná stránka s hrami - Retrogames.cz: http://www.retrogames.cz/play_124-Atari2600.php
Takže si můžete zahrát třeba zrovna Montezumovu pomstu:
http://www.zive.cz/clanky/zajimavych-30-let-osobnich-pocitacu-v-ceskoslovensku/sc-3-a-168386/default.aspx
Pokud vám něco říkají PMD 85, Commodore 64, Atari, IQ 151 a pod. tak nejste sami. Oficiální instituce, které mají archivaci v popisu práce, se u nás emulací prostředí nebo her z téhle doby nevěnují, moc grantových prostředků se na tuhle oblast také nevydává:-)
A tak programování emulátorů a jejich udržování je obvykle dílem nadšenců, kteří mají také dostatek volného času. Díky nim je k dispozici neuvěřitelné množství nástrojů, jen namátkou:
Emulátor PMD 85: http://pmd85.borik.net/wiki/Emul%C3%A1tor
Informace o IQ 151: http://www.iq151.net/download.htm , http://iq151.8bit-era.cz/
Sinclair: http://www.spectaculator.com/
Atari: http://www.atariportal.cz/static_emulace.php, http://jpecher.sweb.cz/emulator.htm, http://karelik.wz.cz/atari.php, http://raster.infos.cz/atari/a800.htm
Commodore: http://www.c64.cz/index.php, http://www.ccs64.com/, http://www.zzap64.co.uk/c64/c64emulators.html
Amiga: http://www.amigaportal.cz/, http://www.amiga.cz , http://amiga.lukysoft.cz/
Další zajímavé odkazy: http://osmi.tarbik.com/cssr/consul2717.html,
Pěkná stránka s hrami - Retrogames.cz: http://www.retrogames.cz/play_124-Atari2600.php
Takže si můžete zahrát třeba zrovna Montezumovu pomstu:
Newslettery: LOC.gov a APARSEN
1. Library of Congress, Digital Preservation Newsletter na duben
http://www.digitalpreservation.gov/news/newsletter/201304.pdf
Upozorňuje mimo jiné na ilustrovanou pohádku o princezně "Snow byte" (Snow White = sněhurka) a sedmi formátech.
2. APARSEN daily: http://paper.li/apadirector/1311184653
Další novinky taky zde: http://www.alliancepermanentaccess.org/index.php/community/updates/
Mimo jiné informace o tom, že si Kentucky Department for Libraries and Archives vybrala pro dlouhodobou archivaci systém Preservica (Cloud SDB) od firmy Tessella.
pátek 5. dubna 2013
Dvě novinky: Blog o DP + aplikace na kontrolu archivovatelnosti vašeho webu
Dnes dvě nesouvisející novinky:
1. Digital preservation matters, blog http://preservationmatters.blogspot.cz/, který od roku 2005 udržuje Chris z Brigham Young University Library. Vyplatí se sledovat.
2. Moc pěkná aplikace od řeckého developera krásným jménem Vangelis Banos. Aplikace zkontroluje různé vlastnosti vašeho webu, zhodnotí jak je připravený pro archivaci. Možná to ani nevíte, ale váš web zcela jistě také někdo archivuje...
http://archiveready.com/
1. Digital preservation matters, blog http://preservationmatters.blogspot.cz/, který od roku 2005 udržuje Chris z Brigham Young University Library. Vyplatí se sledovat.
2. Moc pěkná aplikace od řeckého developera krásným jménem Vangelis Banos. Aplikace zkontroluje různé vlastnosti vašeho webu, zhodnotí jak je připravený pro archivaci. Možná to ani nevíte, ale váš web zcela jistě také někdo archivuje...
http://archiveready.com/
čtvrtek 4. dubna 2013
Nový blog na relevantní téma
Blogosféra je od března bohatší o dalšího zájemce o témata související s dlouhodobou ochranou digitálních informací:
http://digitalniknihovnik.wordpress.com
http://digitalniknihovnik.wordpress.com
středa 3. dubna 2013
Data Seal of Approval v Bavoské státní knihovně
Bavorská státní knihovna zveřejnila svoje odpovědi na požadavky Data Seal of Approval (DSA) a zároveň při té příležitosti aktualizovala svůj web zabývající se dlouhodobou archivací.
https://assessment.datasealofapproval.org/assessment_72/seal/html/
V letošním roce je tak dalším z německých archivů, které DSA vyhověli (dále jsou na seznamu nově repoizitáře univerzit v Saarsku a Stuttgartu, http://fedora.clarin-d.uni-saarland.de/, http://clarin04.ims.uni-stuttgart.de/fedora/describe/, a holandský archiv 3TU datacentrum)
Kromě toho BSB zveřejnila nástroj pro vyhledávání obrázků ze svých sbírek. Je možné i nahrát obrázek a vyzkoušet si, jak jejich algoritmus rozeznání podobných obrázků funguje.
https://assessment.datasealofapproval.org/assessment_72/seal/html/
V letošním roce je tak dalším z německých archivů, které DSA vyhověli (dále jsou na seznamu nově repoizitáře univerzit v Saarsku a Stuttgartu, http://fedora.clarin-d.uni-saarland.de/, http://clarin04.ims.uni-stuttgart.de/fedora/describe/, a holandský archiv 3TU datacentrum)
Kromě toho BSB zveřejnila nástroj pro vyhledávání obrázků ze svých sbírek. Je možné i nahrát obrázek a vyzkoušet si, jak jejich algoritmus rozeznání podobných obrázků funguje.
středa 27. března 2013
DIFFER - Determinator of Image File Format propERties
úterý 26. března 2013
4C Project – the Collaboration to Clarify the Costs of Curation.
Nový projekt 4C financovaný ze sedmého rámcového programu. Jeho cílem je zhodnotit metody odhadování nákladů na "digital curation", správu a dlouhodobou ochranu digitálního informačního obsahu.
http://4cproject.net
Projektu se účastní JISC, DCC, DPC, Dánský národní archiv a dánská Královská knihovna, Německá národní knihovna, HATII Glasgow, DANS, Národní knihovna Estonska, a několik dalších institucí a firem.
Projekt navazuje na předcházející aktivity, které tvořily zárodky modelů pro odhadování
nákladů na dlouhodobou archivaci, jako byl dánsky projekt CMDP, nebo projekt LIFE
http://4cproject.net
Projektu se účastní JISC, DCC, DPC, Dánský národní archiv a dánská Královská knihovna, Německá národní knihovna, HATII Glasgow, DANS, Národní knihovna Estonska, a několik dalších institucí a firem.
Projekt navazuje na předcházející aktivity, které tvořily zárodky modelů pro odhadování
nákladů na dlouhodobou archivaci, jako byl dánsky projekt CMDP, nebo projekt LIFE
pondělí 25. března 2013
Archivematica - testování v MZK
MZK v programu semináře SDRUK zveřejnila svůj záměr testovat Archivematicu, open source řešení pro dlouhodobou archivaci digitálních informací navržené s cílem vyhovět referenčnímu rámci OAIS.
Těšíme se na zkušenosti!
Těšíme se na zkušenosti!
sobota 23. března 2013
Ohlédnutí za druhým rokem projektu SCAPE na blogu Open Planets Foundation
Na blogu OPF byl před pár dny publikován souhrn nejdůležitějších aktivit a nástrojů projektu SCAPE, které spatřily světlo světa v poslením roce. Byl vydán první Release platformy na dlouhodobou ochranu a provádění ochranných akcí na různě velkých množinách dat. Platforma obsahuje různé nástroje, které se mohou k provádění různých procesů velmi hodit. Popis Platformy SCAPE naleznete tady http://www.scape-project.eu/publication/an-architectural-overview-of-the-scape-preservation-platform.
Vznikly také další nástroje, např. PageLyzer na porovnávání webových stránek. Novou a zásadně vylepšenou verzi má také online nástroj na preservation planning PLATO, nyní ve verzi 4. Plato je vyvíjeno již několik let a směřuje k integraci a reálné spolupráci s různými systémy, jako např. EPrints, které využívá v PLATO nástroji vytvořené plány na ochranu ke spuštění procesů migrací apod. Podobně i portugalský open-source LTP systém RODA.
Vznikly také další nástroje, např. PageLyzer na porovnávání webových stránek. Novou a zásadně vylepšenou verzi má také online nástroj na preservation planning PLATO, nyní ve verzi 4. Plato je vyvíjeno již několik let a směřuje k integraci a reálné spolupráci s různými systémy, jako např. EPrints, které využívá v PLATO nástroji vytvořené plány na ochranu ke spuštění procesů migrací apod. Podobně i portugalský open-source LTP systém RODA.
čtvrtek 21. března 2013
Informační zdroje
Stránky Presto Center obsahují velmi pěkně udělaný seznam informačních zdrojů k problematice dlouhodobé archivace digitálních informací.
https://prestocentre.org/library/resources
Samozřejmě, vzhledem k zaměření Presto Center, řada zdrojů se týká dlouhodobé archivace audiovizuálního materiálu.
Na stránku Nástroje/Tools tohoto blogu jsme také přidali odkaz na seznam nástrojů na webu Presto Center.
https://prestocentre.org/library/resources
Samozřejmě, vzhledem k zaměření Presto Center, řada zdrojů se týká dlouhodobé archivace audiovizuálního materiálu.
Na stránku Nástroje/Tools tohoto blogu jsme také přidali odkaz na seznam nástrojů na webu Presto Center.
úterý 19. března 2013
Open source pro dlouhodobou ochranu digitálních informací
Na blogu "The Signal Digital Preservation" Kongresové knihovny jsou přehledové články o systémech Archivematica a Islandora. Články jsou psány formou rozhovoru s tvůrci systémů.
Oba tyto systémy jsou navrženy s cílem naplnit požadavky modelu OAIS (ISO 14721) a využívají komponenty dostupné jako svobodný software.
Archivematica je systém, který vznikl spoluprací firmy Artefactual a Vancouverského archivu, podporuje standardy METS, PREMIS, DC a další standardní metadata. Vývoj směřuje k integraci s běžně používanými systémy pro správu digitálního obsahu jako jsou DSpace, ContentDM.
http://blogs.loc.gov/digitalpreservation/2012/10/archivematica-and-the-open-source-mindset-for-digital-preservation-systems/
Islandora používá jádro Fedora Commons repozitáře, CMS Drupal a řadu dalších komponent, například Taverna workflows. Podobně jako Archivematica do workflow zapojuje další nástroje a služby pro validaci a identifikaci formátů, extrakci technických metadat.
http://blogs.loc.gov/digitalpreservation/2013/03/islandoras-open-source-ecosystem-and-digital-preservation-an-interview-with-mark-leggott/
Aby byl seznam open source systémů usilujících o kompletní naplnění požadavků OAIS úplný, měli bychom doplnit ještě systém RODA , případně i DATISS, XENA, HOPPLA, Mopseus.
Kompletní seznam open source nástrojů užitečných pro dlouhodobou archivaci digitálních informací je na webu Open Planets Foundation: http://wiki.opf-labs.org/display/TR/Digital+Preservation+Tool+Registry
Oba tyto systémy jsou navrženy s cílem naplnit požadavky modelu OAIS (ISO 14721) a využívají komponenty dostupné jako svobodný software.
Archivematica je systém, který vznikl spoluprací firmy Artefactual a Vancouverského archivu, podporuje standardy METS, PREMIS, DC a další standardní metadata. Vývoj směřuje k integraci s běžně používanými systémy pro správu digitálního obsahu jako jsou DSpace, ContentDM.
http://blogs.loc.gov/digitalpreservation/2012/10/archivematica-and-the-open-source-mindset-for-digital-preservation-systems/
Islandora používá jádro Fedora Commons repozitáře, CMS Drupal a řadu dalších komponent, například Taverna workflows. Podobně jako Archivematica do workflow zapojuje další nástroje a služby pro validaci a identifikaci formátů, extrakci technických metadat.
http://blogs.loc.gov/digitalpreservation/2013/03/islandoras-open-source-ecosystem-and-digital-preservation-an-interview-with-mark-leggott/
Aby byl seznam open source systémů usilujících o kompletní naplnění požadavků OAIS úplný, měli bychom doplnit ještě systém RODA , případně i DATISS, XENA, HOPPLA, Mopseus.
Kompletní seznam open source nástrojů užitečných pro dlouhodobou archivaci digitálních informací je na webu Open Planets Foundation: http://wiki.opf-labs.org/display/TR/Digital+Preservation+Tool+Registry
JHOVE2 verze 2.1.0
Byla zveřejněna nová verze JHOVE2:
1. Novinkou je možnost vybrat si nástroj pro identifikaci formátů, dnes má uživatel na výběr mezi DROIDem a unixovým programem File.
2. Byl přidán modul pro zobrazení výsledků, tj, nyní je možné výstup snáze konvertovat pomocí XSLT.
3. Přibyly tři formátové moduly: ARC, WARC, a GZIP
1. Novinkou je možnost vybrat si nástroj pro identifikaci formátů, dnes má uživatel na výběr mezi DROIDem a unixovým programem File.
2. Byl přidán modul pro zobrazení výsledků, tj, nyní je možné výstup snáze konvertovat pomocí XSLT.
3. Přibyly tři formátové moduly: ARC, WARC, a GZIP
čtvrtek 14. března 2013
Dlouhodobá archivace v paměťových institucích na východ od nás
Ruský výbor UNESCO "Informace pro všechny" zpřístupnil na svém webu sborník s příspěvky z konference Preservation of Digital Information in the Information Society, která se konala v Moskvě, v říjnu 2011.
Další konference na stejné téma se konala v Moskvě v roce 2012 pod názvem "Ochrana digitálních informací: Výzva k akci."
Dlouhodobá archivace digitálních informací je skutečně globální téma.
Dlouhodobá archivace digitálních informací je skutečně globální téma.
Ochranná metadata: aneb vše co jste kdy chtěli vědět o PREMISu a METSu, ale báli jste se zeptat
Britské DPC pořádá 23. dubna 2013 v Londýně workshop, který by měl přiblížit reálné implementace PREMIS a METS v různých institucích, systémech digitálních knihoven a LTP systémech. Součástí bude samozřejmě úvod o obou standardech, aktuální vývoj apod.
Podrobné info a registrace viz http://www.dpconline.org/events/details/57-premis-and-mets?xref=62
Podrobné info a registrace viz http://www.dpconline.org/events/details/57-premis-and-mets?xref=62
úterý 12. března 2013
DigCurV: Framing the digital curation curriculum
Program konference DigCurV, Florencie, 5-6 května 2013
http://www.digcur-education.org/eng/International-Conference/Programme?goback=%2Egde_3764755_member_221535946
http://www.digcur-education.org/eng/International-Conference/Programme?goback=%2Egde_3764755_member_221535946
DigCCurr PhD Symposium v UNC s českou účastí
DigCCurr PhD Symposium: Curate Thyself: Defining and Cultivating an Academic Trajectory in Digital Curation
http://www.ils.unc.edu/digccurr/curatethyself.html
Bedřich Vychodil bude prezentovat svůj doktorandský výzkum. Nápady a projekty doktorandů budou komentovat profesoři jako Seamus Ross, Helen Tibbo, Ross Harvey, a mnoho mnoho dalších.
Nová Google diskuzní skupina PRONOM
Máte nějaký dotaz k databázi formátů PRONOM? Zeptejte se přímo kolegů z Digital Preservation týmu Národního archivu Velké Británie v nové Google Skupině https://groups.google.com/forum/#!forum/pronom
sobota 9. března 2013
Nové dokumenty z projektu APARSEN
Projekt 7. rámcového programu EU Alliance for Permanent Access to the Records of Science Network (APARSEN) se zdá produktivní a zásobil nás zajímavým čtivem na stále ještě dlouhé, resp. pro některé z nás prodlužující se, večery:
- Report on cost parameters for digital repositories
- Interoperability objectives and approaches
- Report on testing environments
- Software repository
- Overview of preservation services
- Description of a set of added value services for Persistent Identifier Interoperability Network
- Storage solutions summary of inputs
- Report on existing initiatives and curricula regarding digital long term preservation (včetně Dodatku)
úterý 5. března 2013
Patent Henry Gladney: Method and System for Preparing Digital Information for Long-Term Preservation
Henry Gladney, autor monografie Preserving digital information, patentuje svůj koncept důvěryhodného digitalniho objektu.
http://www.freepatentsonline.com/y2013/0054607.html
http://www.freepatentsonline.com/y2013/0054607.html
pondělí 25. února 2013
The Library of Congress National Recording Preservation Plan
http://www.loc.gov/today/pr/2013/files/pub156.pdf
Doporučení Kongresové knihovny ohledně dlouhodobé archivace zvukových záznamů.
Doporučení Kongresové knihovny ohledně dlouhodobé archivace zvukových záznamů.
pátek 22. února 2013
úterý 19. února 2013
Dokumentace důvěryhodného dlouhodobého repozitáře
Každý repozitář, který chce usilovat o důvěryhodnost ve smyslu ISO 16363, TRACu nebo NESTORu musí připravit poměrně hodně dokumentace. Pěkná ukázka toho, jak ji lze zorganizovat pomocí jednoduché wiki stránky je
resp.
Panové v Ontario Univerzity zjevně vědí, že důvěryhodnost se dá budovat jen pomocí transparentní dokumentace....
Tento archiv právě úspěšně prošel certifikací a Scholar Portal Ontarion Council of University Libraries je prvním kanadským archivem certifikovaným CRL podle TRACu! http://www.ocul.on.ca/node/1637
Webináře zdarma: Introduction to Digital Preservation
Americká asociace Association of Southeastern Research Libraries nabízí zdarma serii webinářů s úvodem do dlouhodobé archivace digitálních informací.
ASERL Webinar: Intro to Digital Preservation #1: Identifying & Selecting Content from John Burger on Vimeo.
Témata jednotlivých prezentací jsou velmi zajímavá:
- Preservation Planning and Overview of PREMIS for Beginners (2. dubna 2013)
- Forbearing the Digital Dark Age: Capturing Metadata for Digital Object (9. dubna 2013)
- Management of Incoming Born-Digital Special Collections (16. dubna 2013)
- Using FITS to Identify File Formats and Extract Metadata (30. dubna 2013)
Prezentovat budou experti z amerických paměťových institucí a univerzit.
- Forbearing the Digital Dark Age: Capturing Metadata for Digital Object (9. dubna 2013)
- Management of Incoming Born-Digital Special Collections (16. dubna 2013)
- Using FITS to Identify File Formats and Extract Metadata (30. dubna 2013)
Prezentovat budou experti z amerických paměťových institucí a univerzit.
A ochutnávka, online volně dostupná prezentace z loňského roku ze stejné serie (na Vimeo jsou celkem 3):
ASERL Webinar: Intro to Digital Preservation #1: Identifying & Selecting Content from John Burger on Vimeo.
Přihlásit se k odběru:
Příspěvky (Atom)