Internet Archive es una biblioteca digital estadounidense con la misión declarada de "acceso universal a todo el conocimiento". [notas 2] [notas 3] Brinda acceso público gratuito a colecciones de materiales digitalizados, incluidos sitios web, aplicaciones de software/juegos, música, películas/videos, imágenes en movimiento y millones de libros. Además de su función de archivo, el Archivo es una organización activista que aboga por una Internet libre y abierta. A partir de diciembre de 2021, Internet Archive contiene más de 34 millones de libros y textos, 7,4 millones de películas, videos y programas de televisión, 797 000 programas de software, 13 991 923 archivos de audio, 4,1 millones de imágenes y 640 000 millones de páginas web en Wayback Machine .
Internet Archive permite que el público cargue y descargue material digital en su grupo de datos, pero la mayor parte de sus datos es recopilada automáticamente por sus rastreadores web , que trabajan para preservar la mayor cantidad posible de la web pública. Su archivo web , Wayback Machine, contiene cientos de miles de millones de capturas web. [notas 4] [3] El Archivo también supervisa uno de los proyectos de digitalización de libros más grandes del mundo.
Brewster Kahle fundó Archive en mayo de 1996, casi al mismo tiempo que comenzó la empresa de rastreo web con fines de lucro Alexa Internet . [notas 5] En octubre de 1996, Internet Archive había comenzado a archivar y preservar la World Wide Web en grandes cantidades, [notas 6] aunque salvó las primeras páginas en mayo de 1996. [4] [5] El contenido archivado primero se convirtió en disponible para el público en general en 2001, cuando desarrolló la Wayback Machine .
A fines de 1999, el Archivo amplió sus colecciones más allá del archivo Web, comenzando con los Archivos Prelinger . Ahora Internet Archive incluye textos, audio, imágenes en movimiento y software. Alberga una serie de otros proyectos: el archivo de imágenes de la NASA , el servicio de rastreo de contratos Archive-It y el catálogo de biblioteca editable en wiki y el sitio de información de libros Open Library . Poco después, el Archivo comenzó a trabajar para brindar servicios especializados relacionados con las necesidades de acceso a la información de las personas con problemas de lectura; los libros de acceso público se pusieron a disposición en un formato protegido de Sistema de Información Accesible Digital (DAISY). [notas 7]
La mayoría de las sociedades dan importancia a la preservación de los artefactos de su cultura y patrimonio. Sin tales artefactos, la civilización no tiene memoria ni mecanismo para aprender de sus éxitos y fracasos. Nuestra cultura ahora produce más y más artefactos en forma digital. La misión del Archivo es ayudar a preservar esos artefactos y crear una biblioteca en Internet para investigadores, historiadores y académicos.
En agosto de 2012, Archive anunció [6] que había agregado BitTorrent a sus opciones de descarga de archivos para más de 1,3 millones de archivos existentes y todos los archivos cargados recientemente. [7] [8] Este método es el medio más rápido para descargar medios del Archivo, ya que los archivos se sirven desde dos centros de datos del Archivo, además de otros clientes de torrent que han descargado y continúan sirviendo los archivos. [7] [notas 9] El 6 de noviembre de 2013, la sede de Internet Archive en el distrito de Richmond de San Francisco se incendió, [9] destruyendo equipos y dañando algunos apartamentos cercanos. [10]Según el Archivo, perdió un edificio lateral que albergaba uno de los 30 de sus centros de escaneo; cámaras, luces y equipos de escaneo por valor de cientos de miles de dólares; y "tal vez 20 cajas de libros y películas, algunas irremplazables, la mayoría ya digitalizadas y algunas reemplazables". [11] El Archivo sin fines de lucro buscó donaciones para cubrir los daños estimados en $600,000. [12]