Preservación digital: manteniendo viva la web

404 error

Imagen: 404 error por Gustavo da Cunha en Flickr. Licencia CC BY SA.

Desde hace algunos días estamos trabajando en el mantenimiento de posts viejos del blog de Ártica. A lo largo de 6 años publicamos más de 360 posts, muchos de los cuales consideramos que son valiosos para nuestra comunidad y por eso estamos revisando que la información se pueda visualizar de manera correcta y se mantenga vigente. A lo largo del trabajo, aprendimos algunas lecciones que entendemos que pueden ser útiles para todo el mundo. A continuación les presentamos 5 tips para la preservación de los contenidos de un sitio web.

1. Reparar los links rotos usando The Wayback Machine

Los links rotos son uno de los principales problemas de la web. Se calcula que, por término medio, en 10 años la mitad de los links de un sitio web van a estar rotos. Por esa razón es tan importante revisar periódicamente si nuestra web tiene links rotos y repararlos. Para quienes usan WordPress, recomendamos el plugin Broken Link Checker, que ayuda a detectar los links rotos y a gestionar su reemplazo. Una vez encontrados los links rotos, la mejor opción para repararlos es buscarlos en The Wayback Machine, el servicio de Internet Archive que tiene en su archivo miles de millones de páginas web, desde la década de 1990. Es altamente probable que el link que estemos buscando se encuentre archivado en The Wayback Machine. Sin embargo, en los casos en que no esté archivado allí, podemos realizar búsquedas en Google u otro buscador, colocando el título del post o página en cuestión, para ver si tenemos suerte y encontramos el contenido publicado en otro sitio web, o en el mismo sitio web con un enlace diferente.

2. No incrustar imágenes de sitios de terceros

La incrustación de imágenes desde sitios de terceros es una práctica que suele ser mal vista, dado que se usan los recursos de los servidores de la otra persona para ilustrar un contenido en el blog o sitio propio. Por otra parte, la disponibilidad de la imagen pasa a depender de que siga en línea en el servidor de la otra persona. Mucho mejor que incrustar la imagen es descargarla y volverla a subir al sitio propio, citando al autor y la web de donde se ha obtenido. Por supuesto, siempre que utilicemos imágenes de terceros deben tener licencias Creative Commons, que permiten la reutilización.

3. Evitar la publicación de contenidos en formatos que no sean estándar

Es muy común encontrarse con páginas web antiguas (y no tan antiguas) cuyos contenidos no se pueden visualizar o requieren plugins obsoletos para ello. Así, muchos videos y contenidos interactivos del más diverso tipo ya no se pueden ver dado que los plugins que permitían visualizarlos no están soportados por los navegadores actuales. Recomendamos, por lo tanto, publicar los contenidos utilizando formatos abiertos y estándar, como HTML para las páginas web y PDF para documentos. En el caso de los audios y videos, es recomendable usar las etiquetas correspondientes de HTML5 y evitar la publicación de contenidos en Flash o en otros formatos que requieran plugins especiales. También, si usamos WordPress, es conveniente evitar el uso de shortcodes en las entradas que publiquemos, dado que suelen depender de temas y plugins que pueden quedar desactualizados, volviendo inaccesible el contenido.

4. Tener precaución con los videos de YouTube

Si vamos a usar videos de YouTube, debemos tener en cuenta que es posible que estos sean removidos de la plataforma. No está de más descargarlos para tener un backup de ellos en caso de que sean dados de baja. También es conveniente hacer periódicamente una revisión de los videos posteados, para verificar que sigan en línea.

5. Evitar la incrustación de contenidos desde plataformas 2.0

Siempre que sea posible, debemos preferir alojar los contenidos en el servidor propio. Las plataformas 2.0 suelen ser compradas, vendidas o discontinuadas más frecuentemente de lo que pensamos, perdiéndose muchas veces los contenidos. Pero incluso cuando los contenidos no se pierden, muchas veces las plataformas varían los códigos de incrustación o el diseño con que muestran los materiales, haciendo que estos se vean de manera defectuosa o queden rotos en nuestro sitio. Por estas razones, cuando queremos publicar documentos, infografías, líneas de tiempo, audios, presentaciones y otros tipos de contenidos, es preferible, siempre que sea posible, mostrarlos desde el servidor propio en lugar de incrustarlos desde servicios 2.0. En ocasiones, estas plataformas permiten descargar los contenidos, lo cual nos facilitará la tarea.

Publicado por Jorge Gemetto

Deja una respuesta

Avísame por correo electrónico si aparecen nuevos comentarios. También puedes suscribirte sin comentar.