De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La Internet Memory Foundation (anteriormente European Archive Foundation ) era una fundación sin fines de lucro cuyo propósito era archivar contenido de la World Wide Web . Apoyó proyectos e investigaciones que incluían la preservación y protección del contenido de los medios digitales en diversas formas para formar una biblioteca digital de contenido cultural. Se extinguió a partir de agosto de 2018.

Historia [ editar ]

La institución sin fines de lucro European Archive Foundation se incorporó en 2004 en Ámsterdam . [1] Un anuncio en la inauguración de la Cross Media Week en Amsterdam durante septiembre de 2006 incluyó una cita de Brewster Kahle , quien fundó Internet Archive . [2] Julien Masanès fue su primer director. [3] Operando desde Ámsterdam y París , dijo que crearía colecciones de dominio público y archivos web de libre acceso . Masanès, anteriormente en la Bibliothèque nationale de France , editó un libro sobre archivo web en 2007 [4].La organización de París se llama Internet Memory Research, que opera un servicio conocido como ArchiveTheNet. [5]

En diciembre de 2010, la Fundación cambió su nombre a Internet Memory Foundation para expresar su objetivo de preservar el contenido de Internet para las generaciones actuales y futuras. [6]

La fundación tenía muchos socios, incluidas instituciones culturales e instituciones de investigación, que colaboraban en sus proyectos de archivo web. Estos socios incluyeron los Archivos Nacionales del Reino Unido , [7] el Instituto Max Planck , la Technische Universität Berlin , la Universidad de Southampton y el Institut Mines-Télécom . La fundación también fue miembro del Consorcio Internacional para la Preservación de Internet . [8]

Investigación [ editar ]

La fundación participó en proyectos de investigación para mejorar las tecnologías de rastreo web , extracción de datos , minería de texto y preservación para respaldar el crecimiento y uso de archivos web. Sus proyectos fueron financiados por la Comisión Europea a través del Séptimo Programa Marco de Investigación .

  • Ambientes de preservación escalables (SCAPE, proyecto n.º 270137) se ejecutó desde febrero de 2011 hasta julio de 2014. [9] Estaba desarrollando una plataforma de preservación escalable y de código abierto.
  • La minería de tendencias multilingüe a gran escala y el resumen de flujos de medios en tiempo real (TrendMiner, proyecto núm. 287863) se llevaron a cabo desde noviembre de 2011 hasta octubre de 2014. [10] Su objetivo era desarrollar herramientas para minar las redes sociales, especialmente en varios idiomas. .
  • Collect-All ARchives to COmmunity MEMories (ARCOMEM, Proyecto No. 270239) se desarrolló desde enero de 2011 hasta diciembre de 2013. [11] Estudió la preservación de información web efímera, como la utilizada en sitios de redes sociales.
  • La encuesta Web Archiving in Europe se realizó en diciembre de 2010. Evaluó el estado de los proyectos de archivo web en diferentes instituciones europeas. [12]
  • Análisis longitudinal de datos de archivos web (LAWA, Proyecto No. 258105) se desarrolló desde septiembre de 2010 hasta agosto de 2013. [13] El proyecto experimentó con análisis de datos a gran escala para su uso en el proyecto Future Internet Research and Experimentation .
  • LivingKnowledge (Proyecto No. 231126) se desarrolló desde febrero de 2009 hasta enero de 2012. [14] El objetivo era mejorar la navegación y la búsqueda en grandes conjuntos de datos multimodales.
  • Living Web Archives (LiWA, Proyecto No. 216267) se ejecutó desde febrero de 2008 hasta enero de 2011. [15] LiWA desarrolló métodos y herramientas de archivo web que tenían como objetivo capturar un archivo web más preciso y "vivo". [16] [17]

Colecciones [ editar ]

Audio y video [ editar ]

Antes de centrarse en el archivo web, la European Archive Foundation había recopilado una de las mayores colecciones de música clásica gratuitas en línea (más de 800 piezas, desde Mozart hasta Dvorak) y películas de información pública del gobierno británico, realizada en colaboración con el Instituto de Sonido de los Países Bajos. y Vision y los Archivos Nacionales del Reino Unido.

Colección web selectiva [ editar ]

La fundación archivó una instantánea del dominio web italiano, realizada en colaboración con la Biblioteca Nacional de Italia, un archivo de sitios web políticos de los 25 estados miembros de la UE capturados durante el debate constitucional europeo, y archivos (entre otros):

  • Archivos Nacionales (Reino Unido) [18]
  • Biblioteca Nacional de Irlanda
  • CERN , Organisation européenne pour la recherche nucléaire (Suiza)
  • Parlamento del Reino Unido
  • Oficina de registro público de Irlanda del Norte

El rastreador web utilizado por el proyecto fue Heritrix versión 3. Heritrix genera recursos almacenados en un formato de "contenedor" de archivo estandarizado, el archivo ARC (.arc). El archivo ARC se amplió al formato de archivo Web ARChive (.warc), que fue aprobado como estándar internacional en junio de 2009 (edición actual ISO 28500: 2017). [19]

Ver también [ editar ]

  • Lista de iniciativas de archivo web
  • Archivo de Internet

Referencias [ editar ]

  1. ^ Mia Consalvo; Charles Ess, eds. (2011). El manual de estudios de Internet . John Wiley e hijos. pag. 31. ISBN 9781444342383.
  2. ^ Masanès, Julian (28 de septiembre de 2006). "Lanzamiento oficial de la European Archive Foundation" (Nota de prensa) .
  3. ^ "Lanzamiento oficial de la European Archive Foundation" . Comunicado de prensa . 28 de septiembre de 2006 . Consultado el 7 de octubre de 2013 .
  4. ^ Julien Masanès, ed. (2007). Archivo web . Saltador. ISBN 9783540463320.
  5. ^ "À propos: memoria de Internet" . Sitio web de ArchiveThe.net . Consultado el 7 de octubre de 2013 . (en francés)
  6. ^ "Fundación de la memoria de Internet" . Consorcio Internacional para la Preservación de Internet. Archivado desde el original el 9 de abril de 2014 . Consultado el 8 de abril de 2014 .
  7. ^ Diana Maynard ; Mark A. Greenwood (16 de mayo de 2012). "Anotación semántica a gran escala, indexación y búsqueda en los archivos nacionales" (PDF) . Congreso Internacional sobre Evaluación y Recursos Lingüísticos .
  8. ^ Miembros (Consorcio Internacional para la Preservación de Internet)
  9. ^ "Ambientes de preservación escalables" . Sitio web del Servicio de Información de Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
  10. ^ "Minería de tendencias a gran escala, multilingüe y resumen de flujos de medios en tiempo real" . Servicio de Información sobre Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 25 de abril de 2016 .
  11. ^ "MEMORIAS DE COMUNIDADES ARCHIVO" . Sitio web del Servicio de Información de Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
  12. ^ "Archivo web en Europa: una encuesta proporcionada por la Internet Memory Foundation, 2010" (PDF) . 22 de marzo de 2011 . Consultado el 8 de abril de 2014 .
  13. ^ "Análisis longitudinal de datos de archivo web" . Sitio web del Servicio de Información de Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
  14. ^ "Hechos, opiniones y sesgos de LivingKnowledge en el tiempo" . Sitio web del Servicio de Información de Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
  15. ^ "Archivos web vivos" . Sitio web del Servicio de Información de Investigación y Desarrollo Comunitario . Unión Europea . Consultado el 7 de octubre de 2013 .
  16. ^ "Informe sobre" Tecnologías para archivos vivos de la Web " " (PDF) . Informe entregable . 10 de febrero de 2011 . Consultado el 7 de octubre de 2013 .
  17. ^ Dimitar Denev, Arturas Mazeika, Marc Spaniol y Gerhard Weikum (abril de 2011). "El marco SHARC para la calidad de los datos en el archivo web" . Revista internacional sobre bases de datos muy grandes . Springer-Verlag. 20 (2): 183–207. doi : 10.1007 / s00778-011-0219-9 .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
  18. ^ Adrian Brown (2006). Archivado de sitios web: una guía práctica para los profesionales de la gestión de la información . Publicación de facetas. pp.  17 -18. ISBN 9781856045537.
  19. ^ "Iso 28500: 2017" .

Enlaces externos [ editar ]

  • Página web oficial
  • Proyectos de investigación financiados por la CE :
  • Conocimiento vivo
  • LAWA , Análisis longitudinal de datos de archivos web
  • ARCOMEM , Archivos, museos y bibliotecas europeos en la era de la web social
  • SCAPE , entornos de preservación escalables
  • LiWA , Archivos web vivos