Archivo de la web española

La recolección de páginas web es la principal forma de llevar a cabo el depósito legal de las publicaciones en línea. Se lleva a cabo con robots rastreadores que van recorriendo las URL seleccionadas previamente y guardando todo lo que tienen enlazado con la frecuencia, profundidad y tamaño que se determine. El resultado de estas recolecciones web son los archivos web.

A día de hoy es imposible aspirar a la exhaustividad en el archivado web, por lo que en la Biblioteca Nacional de España se ha optado por un modelo mixto que combina recolecciones masivas y selectivas:

  1. Las recolecciones masivas recogen el mayor número de dominios posible con una profundidad pequeña en los niveles de navegación y están vinculadas al dominio .es. Se hacen una vez al año.
  2. Las recolecciones selectivas se hacen para completar las recolecciones masivas, ya que recogen con mayor profundidad y frecuencia una muestra más pequeña de sitios web seleccionados por su relevancia para la historia, la sociedad y la cultura. Se realizan varias veces al año en colaboración con los centros de conservación de las comunidades autónomas y de otras instituciones especializadas. Estas recolecciones selectivas pueden ser de tres tipos:
    1. Temáticas: Cada Departamento de la Biblioteca Nacional y cada comunidad autónoma mantiene sus colecciones temáticas con los recursos en línea que consideren necesario conservar como parte del depósito legal. Por ejemplo: Música y Audiovisuales, Revistas electrónicas andaluzas, Instituciones de la Comunidad Valenciana, etc.
    2. De evento: sobre acontecimientos de especial relevancia.
    3. De emergencia, en el caso de sitios web en peligro de extinción.

Más información: Archivo de la web en BNE

DATOS Y FORMATOS DISPONIBLES:

 

Recolecciones masivas
OpenWayBack HTML (*Sólo accesible en el edificio de la BNE)
Recolecciones temáticas
Bellas Artes y Cartografía CSV, JSON, ODS, TXT, XLS, XML
Cervantes CSV, JSON, ODS, TXT, XLS, XML
Feminismo CSV, JSON, ODS, TXT, XLS, XML
Fondo Antiguo CSV, JSON, ODS, TXT, XLS, XML
Gastronomía CSV, JSON, ODS, TXT, XLS, XML
La BNE CSV, JSON, ODS, TXT, XLS, XML
Medioambiente y Cambio climático CSV, JSON, ODS, TXT, XLS, XML
Música y Audiovisuales CSV, JSON, ODS, TXT, XLS, XML
Organismos Públicos CSV, JSON, ODS, TXT, XLS, XML
Prensa y Televisión Autonómicas CSV, JSON, ODS, TXT, XLS, XML
Prensa y Televisión Nacional CSV, JSON, ODS, TXT, XLS, XML
Política catalana CSV, JSON, ODS, TXT, XLS, XML
Política nacional CSV, JSON, ODS, TXT, XLS, XML
Tradiciones CSV, JSON, ODS, TXT, XLS, XML
Universidades Españolas CSV, JSON, ODS, TXT, XLS, XML
Recolecciones de Comunidades Autónomas
Andalucía CSV, JSON, ODS, TXT, XLS, XML
Aragón CSV, JSON, ODS, TXT, XLS, XML
Asturias CSV, JSON, ODS, TXT, XLS, XML
Canarias CSV, JSON, ODS, TXT, XLS, XML
Cantabria CSV, JSON, ODS, TXT, XLS, XML
Castilla-La Mancha CSV, JSON, ODS, TXT, XLS, XML
Castilla y León CSV, JSON, ODS, TXT, XLS, XML
Comunidad de Madrid CSV, JSON, ODS, TXT, XLS, XML
Comunidad Foral de Navarra CSV, JSON, ODS, TXT, XLS, XML
Comunidad Valenciana CSV, JSON, ODS, TXT, XLS, XML
Extremadura CSV, JSON, ODS, TXT, XLS, XML
Galicia CSV, JSON, ODS, TXT, XLS, XML
La Rioja CSV, JSON, ODS, TXT, XLS, XML
Murcia CSV, JSON, ODS, TXT, XLS, XML
País Vasco CSV, JSON, ODS, TXT, XLS, XML
Recolecciones de evento
Abdicación de Juan Carlos I y Proclamación de Felipe VI CSV, JSON, ODS, TXT, XLS, XML
Muerte de Adolfo Suárez CSV, JSON, ODS, TXT, XLS, XML
Consulta catalana del 9 de noviembre de 2014 CSV, JSON, ODS, TXT, XLS, XML
Elecciones generales 2015-2016 CSV, JSON, ODS, TXT, XLS, XML
Elecciones gallegas 2016 CSV, JSON, ODS, TXT, XLS, XML
Elecciones vascas 2016  CSV, JSON, ODS, TXT, XLS, XML
Elecciones al Parlamento Europeo 2014 CSV, JSON, ODS, TXT, XLS, XML
El desarme de ETA  CSV, JSON, ODS, TXT, XLS, XML
Atentados terroristas en Cataluña CSV, JSON, ODS, TXT, XLS, XML
Elecciones catalanas 2017 CSV, JSON, ODS, TXT, XLS, XML
Elecciones andaluzas 2018 CSV, JSON, ODS, TXT, XLS, XML
Elecciones generales 2019 CSV, JSON, ODS, TXT, XLS, XML
Elecciones al Parlamento Europeo 2019 CSV, JSON, ODS, TXT, XLS, XML
Elecciones locales y autonómicas 2019 CSV, JSON, ODS, TXT, XLS, XML
Coronavirus (COVID-19) CSV, JSON, ODS, TXT, XLS, XML
Orgullo LGTBI CSV, JSON, ODS, TXT, XLS, XML
Elecciones vascas 2020 CSV, JSON, ODS, TXT, XLS, XML
Elecciones gallegas 2020 CSV, JSON, ODS, TXT, XLS, XML
Recolecciones de riesgo
Wikispaces  CSV, JSON, ODS, TXT, XLS, XML
Sitios web en riesgo de desaparición  CSV, JSON, ODS, TXT, XLS, XML