Una arquitectura basada en software libre para archivos web
Abstract
Los archivos web son sistemas de información que se han venido desarrollando desde finales de los años 90 para llevar a cabo la preservación histórica del patrimonio web como parte del patrimonio digital de la humanidad. Tales archivos han tenido que afrontar ciertos desafíos propios de los recursos web, como son el tamaño de la web y su naturaleza cambiante, las tecnologías asociadas a la web, la web superficial y la web profunda, la organización de la web en dominios, entre otros. Debido a ello, se ha hecho necesario proponer arquitecturas, técnicas, herramientas y estándares para las diferentes funcionalidades de un archivo web que permitan afrontar de manera eficaz dichos desafíos. Este trabajo tiene como objetivo establecer una arquitectura basada en software libre para un prototipo de archivo web. Para ello se hace una revisión detallada del dominio de archivo web, de sus funciones y de los enfoques usados hasta el momento para llevarlas a cabo. Se presenta un estudio comparativo entre diferentes iniciativas de preservación web a nivel mundial y se establecen los componentes para un sistema para la preservación web basada en software libre.