Wikipedia ofrece copias gratuitas de todo el contenido disponible a los usuarios interesados. Estas bases de datos se pueden utilizar para duplicación , uso personal, copias de seguridad informales, uso fuera de línea o consultas de bases de datos (como Wikipedia: Mantenimiento ). Todo el contenido de texto tiene licencia múltiple bajo la licencia Creative Commons Attribution-ShareAlike 3.0 (CC-BY-SA) y la licencia de documentación libre GNU (GFDL). Las imágenes y otros archivos están disponibles bajo diferentes términos , como se detalla en sus páginas de descripción. Para obtener nuestros consejos sobre el cumplimiento de estas licencias, consulte Wikipedia: derechos de autor .
Lectores de Wikipedia sin conexión
Algunas de las muchas formas de leer Wikipedia sin conexión:
- XOWA : ( § XOWA )
- Kiwix : ( § Kiwix )
- WikiTaxi: § WikiTaxi (para Windows)
- aarddict: § Diccionario Aard
- BzReader: § BzReader y MzReader (para Windows)
- Artículos seleccionados de Wikipedia como PDF, OpenDocument, etc . : Wikipedia: Libros
- Artículos seleccionados de Wikipedia como libro impreso: Ayuda: Libros / Libros impresos
- Wiki como libro electrónico : § Libro electrónico
- WikiFilter: § WikiFilter
- Wikipedia en rockbox: § Wikiviewer para Rockbox
Algunas de ellas son aplicaciones móviles; consulte la " lista de aplicaciones móviles de Wikipedia ".
¿Dónde lo consigo?
Wikipedia en inglés
- Volcados de cualquier proyecto de la Fundación Wikimedia: volcados
.wikimedia .org y el Archivo de Internet - Volcados de Wikipedia en inglés en SQL y XML: volcados
.wikimedia .org / enwiki / e Internet Archive - Descargue el volcado de datos utilizando un cliente BitTorrent (descargar torrents tiene muchos beneficios y reduce la carga del servidor, lo que ahorra costos de ancho de banda).
- pages-articles-multistream.xml.bz2: solo revisiones actuales, sin páginas de conversación ni de usuario; esto es probablemente lo que desea, y tiene aproximadamente 18 GB comprimidos (se expande a más de 78 GB cuando se descomprime).
- pages-meta-current.xml.bz2 - Solo revisiones actuales, todas las páginas (incluida la charla)
- abstract.xml.gz - resúmenes de página
- all-title-in-ns0.gz: solo títulos de artículos (con redireccionamientos)
- Los archivos SQL para las páginas y los enlaces también están disponibles.
- Todas las revisiones, todas las páginas: estos archivos se expanden a varios terabytes de texto. Descárguelos únicamente si sabe que puede hacer frente a esta cantidad de datos. Vaya a Latest Dumps y busque todos los archivos que tengan 'pages-meta-history' en su nombre.
- Para descargar un subconjunto de la base de datos en formato XML, como una categoría específica o una lista de artículos, consulte: Especial: Exportación , cuyo uso se describe en Ayuda: Exportación .
- Software de interfaz de usuario Wiki: MediaWiki [1] .
- Software backend de base de datos: MySQL .
- Volcados de imágenes: ver más abajo.
¿Debería tener multisecuencia?
TL; DR : ¡ OBTENGA LA VERSIÓN MULTISTREAM! (y el archivo de índice correspondiente, pages-articles-multistream-index.txt.bz2 )
pages-articles.xml.bz2 y pages-articles-multistream.xml.bz2 contienen el mismo contenido xml . Entonces, si descomprime cualquiera de los dos, obtendrá los mismos datos. Pero con la transmisión múltiple, es posible obtener un artículo del archivo sin descomprimirlo todo. Su lector debe manejar esto por usted, si su lector no lo admite, funcionará de todos modos, ya que multisecuencia y no multisecuencia contienen el mismo xml . El único inconveniente de la transmisión múltiple es que es un poco más grande. Es posible que tenga la tentación de obtener el archivo más pequeño que no sea de múltiples secuencias, pero esto será inútil si no lo descomprime. Y se descomprimirá a ~ 5-10 veces su tamaño original. Penny sabio, libra estúpido. Obtenga multisecuencia.
TENGA EN CUENTA QUE el archivo de volcado multisecuencia contiene múltiples 'flujos' bz2 (encabezado, cuerpo, pie de página de bz2) concatenados en un solo archivo, en contraste con el archivo vanilla que contiene un flujo. Cada 'flujo' (o realmente, archivo) separado en el volcado multisecuencia contiene 100 páginas, excepto posiblemente la última.
¿Cómo utilizar multisecuencia?
Para multisecuencia, puede obtener un archivo de índice, pages-articles-multistream-index.txt.bz2 . El primer campo de este índice es el número de bytes para buscar en el archivo comprimido pages-articles-multistream.xml.bz2 , el segundo es el ID del artículo, el tercero el título del artículo.
Corte una pequeña parte del archivo con dd usando el desplazamiento de bytes que se encuentra en el índice. A continuación, puede descomprimirlo con bzip2 o usar bzip2recover y buscar el ID del artículo en el primer archivo.
Consulte https://docs.python.org/3/library/bz2.html#bz2.BZ2Decompressor para obtener información sobre dichos archivos multisecuencia y sobre cómo descomprimirlos con Python; ver también https://gerrit.wikimedia.org/r/plugins/gitiles/operations/dumps/+/ariel/toys/bz2multistream/README.txt y archivos relacionados para un viejo juguete de trabajo.
Otros idiomas
En el directorio dumps
¿Dónde están los archivos cargados (imagen, audio, video, etc.)?
Las imágenes y otros medios cargados están disponibles en réplicas, además de ser servidos directamente desde los servidores de Wikimedia. La descarga masiva está disponible (a partir de septiembre de 2013) desde réplicas, pero no se ofrece directamente desde los servidores de Wikimedia. Consulte la lista de espejos actuales . Debería rsync desde el espejo, luego complete las imágenes que faltan de upload.wikimedia.org ; al descargar desde upload.wikimedia.org
, debe limitarse a 1 error de caché por segundo (puede verificar los encabezados en una respuesta para ver si fue un acierto o error y luego retroceder cuando tenga un error) y no debe usar más de uno o dos conexiones HTTP simultáneas. En cualquier caso, asegúrese de tener una cadena de agente de usuario precisa con información de contacto (dirección de correo electrónico) para que las operaciones puedan comunicarse con usted si hay un problema. Debería obtener sumas de comprobación de la API de mediawiki y verificarlas. La página de etiqueta de API contiene algunas pautas, aunque no todas se aplican (por ejemplo, porque upload.wikimedia.org no es MediaWiki, no hay ningún maxlag
parámetro).
A diferencia de la mayoría de los textos de los artículos, las imágenes no necesariamente tienen licencia de GFDL y CC-BY-SA-3.0. Pueden estar bajo una de las muchas licencias gratuitas , de dominio público , que se cree que son de uso legítimo o incluso infracciones de derechos de autor (que deben eliminarse ). En particular, el uso de imágenes de uso legítimo fuera del contexto de Wikipedia o trabajos similares puede ser ilegal. Las imágenes bajo la mayoría de las licencias requieren un crédito y posiblemente otra información de derechos de autor adjunta. Esta información se incluye en las páginas de descripción de imágenes, que forman parte de los volcados de texto disponibles en dumps.wikimedia.org . En conclusión, descargue estas imágenes bajo su propio riesgo ( Legal )
Tratar con archivos comprimidos
Los archivos de volcado comprimidos se comprimen significativamente, por lo que después de descomprimirse ocuparán grandes cantidades de espacio en el disco. Se describe una gran lista de programas de descompresión en Comparación de archivadores de archivos . Los siguientes programas en particular se pueden utilizar para descomprimir archivos bzip2 .bz2 .zip y .7z .
A partir de Windows XP , un programa de descompresión básico permite la descompresión de archivos zip. [1] [2] Entre otros, se puede utilizar lo siguiente para descomprimir archivos bzip2.
- bzip2 (línea de comandos) (desde aquí ) está disponible de forma gratuita bajo una licencia BSD.
- 7-Zip está disponible de forma gratuita con una licencia LGPL .
- WinRAR
- WinZip
- Macintosh (Mac)
- OS X se envía con la herramienta bzip2 de línea de comandos.
- GNU / Linux
- La mayoría de las distribuciones GNU / Linux se envían con la herramienta bzip2 de línea de comandos.
- Algunos sistemas BSD se envían con la herramienta bzip2 de línea de comandos como parte del sistema operativo. Otros, como OpenBSD , lo proporcionan como un paquete que primero debe instalarse.
- Notas
- Es posible que algunas versiones anteriores de bzip2 no puedan manejar archivos de más de 2 GB, así que asegúrese de tener la última versión si tiene algún problema.
- Algunos archivos antiguos están comprimidos con gzip, que es compatible con PKZIP (el formato de Windows más común).
Tratar con archivos grandes
A medida que los archivos aumentan de tamaño, también aumenta la probabilidad de que excedan algún límite de un dispositivo informático. Cada sistema operativo, sistema de archivos, dispositivo de almacenamiento duro y software (aplicación) tiene un límite máximo de tamaño de archivo. Es probable que cada uno de estos tenga un máximo diferente, y el límite más bajo de todos ellos se convertirá en el límite de tamaño de archivo para un dispositivo de almacenamiento.
Cuanto más antiguo sea el software en un dispositivo informático, es más probable que tenga un límite de archivo de 2 GB en algún lugar del sistema. Esto se debe a que el software más antiguo usa enteros de 32 bits para la indexación de archivos, lo que limita el tamaño de los archivos a 2 ^ 31 bytes (2 GB) (para enteros con signo) o 2 ^ 32 (4 GB) (para enteros sin signo). Las bibliotecas de programación C más antiguas tienen este límite de 2 o 4 GB, pero las bibliotecas de archivos más nuevas se han convertido a enteros de 64 bits, por lo que admiten tamaños de archivo de hasta 2 ^ 63 o 2 ^ 64 bytes (8 o 16 EB ).
Antes de iniciar la descarga de un archivo grande, verifique el dispositivo de almacenamiento para asegurarse de que su sistema de archivos pueda admitir archivos de un tamaño tan grande y verifique la cantidad de espacio libre para asegurarse de que pueda contener el archivo descargado.
Límites del sistema de archivos
Hay dos límites para un sistema de archivos: el límite de tamaño del sistema de archivos y el límite del sistema de archivos. En general, dado que el límite de tamaño del archivo es menor que el límite del sistema de archivos, los límites más grandes del sistema de archivos son un punto discutible. Un gran porcentaje de usuarios asume que pueden crear archivos hasta del tamaño de su dispositivo de almacenamiento, pero se equivocan en su suposición. Por ejemplo, un dispositivo de almacenamiento de 16 GB formateado como sistema de archivos FAT32 tiene un límite de archivo de 4 GB para un solo archivo. La siguiente es una lista de los sistemas de archivos más comunes y consulte Comparación de sistemas de archivos para obtener información detallada adicional.
- FAT16 admite archivos de hasta 4 GB . FAT16 es el formato de fábrica de las unidades USB más pequeñas y todas las tarjetas SD de 2 GB o menos.
- FAT32 admite archivos de hasta 4 GB. FAT32 es el formato de fábrica de las unidades USB más grandes y todas las tarjetas SDHC de 4 GB o más.
- exFAT admite archivos de hasta 127 PB . exFAT es el formato de fábrica de todas las tarjetas SDXC , pero es incompatible con la mayoría de versiones de UNIX debido a problemas de licencia.
- NTFS admite archivos de hasta 16 TB . NTFS es el sistema de archivos predeterminado para las computadoras modernas con Windows , incluidos Windows 2000, Windows XP y todos sus sucesores hasta la fecha. Las versiones posteriores a Windows 8 pueden admitir archivos más grandes si el sistema de archivos está formateado con un tamaño de clúster mayor.
- ReFS admite archivos de hasta 16 EB .
- Macintosh (Mac)
- HFS Plus (HFS +) admite archivos de hasta 8 EB en Mac OS X 10.2+ e iOS . HFS + era el sistema de archivos predeterminado para las computadoras OS X antes de macOS High Sierra en 2017 cuando fue reemplazado por defecto con Apple File System , APFS .
- Linux
- ext2 y ext3 admiten archivos de hasta 16 GB, pero hasta 2 TB con tamaños de bloque más grandes. Consulte https://users.suse.com/~aj/linux_lfs.html para obtener más información.
- ext4 admite archivos de hasta 16 TB, con un tamaño de bloque de 4 KB. ( límite eliminado en e2fsprogs-1.42 (2012) )
- XFS admite archivos de hasta 8 EB.
- ReiserFS admite archivos de hasta 1 EB, 8 TB en sistemas de 32 bits.
- JFS admite archivos de hasta 4 PB.
- Btrfs admite archivos de hasta 16 EB.
- NILFS admite archivos de hasta 8 EB.
- YAFFS 2 admite archivos de hasta 2 GB
- FreeBSD
- ZFS admite archivos de hasta 16 EB.
- FreeBSD y otros BSD
- El sistema de archivos Unix (UFS) admite archivos de hasta 8 ZiB.
Límites del sistema operativo
Cada sistema operativo tiene límites de sistema de archivos internos para el tamaño del archivo y el tamaño de la unidad, que es independiente del sistema de archivos o del medio físico. Si el sistema operativo tiene límites más bajos que el sistema de archivos o los medios físicos, entonces los límites del sistema operativo serán el límite real.
- Ventanas
- Windows 95, 98, ME tienen un límite de 4 GB para todos los tamaños de archivo.
- Windows XP tiene un límite de 16 TB para todos los tamaños de archivo.
- Windows 7 tiene un límite de 16 TB para todos los tamaños de archivo.
- Windows 8, 10 y Server 2012 tienen un límite de 256 TB para todos los tamaños de archivo.
- Linux
- Los sistemas kernel 2.4.x de 32 bits tienen un límite de 2 TB para todos los sistemas de archivos.
- Los sistemas kernel 2.4.x de 64 bits tienen un límite de 8 EB para todos los sistemas de archivos.
- Los sistemas kernel 2.6.x de 32 bits sin la opción CONFIG_LBD tienen un límite de 2 TB para todos los sistemas de archivos.
- Los sistemas kernel 2.6.x de 32 bits con la opción CONFIG_LBD y todos los sistemas kernel 2.6.x de 64 bits tienen un límite de 8 ZB para todos los sistemas de archivos. [3]
- Google Android
Google Android se basa en Linux, que determina sus límites básicos.
- Almacenamiento interno:
- Android 2.3 y versiones posteriores utilizan el sistema de archivos ext4 . [4]
- Android 2.2 y versiones anteriores utilizan el sistema de archivos YAFFS 2.
- Ranuras de almacenamiento externo:
- Todos los dispositivos Android deben admitir los sistemas de archivos FAT16, FAT32, ext2.
- Android 2.3 y versiones posteriores son compatibles con el sistema de archivos ext4.
- Apple iOS (consulte la Lista de dispositivos iOS )
- Todos los dispositivos admiten HFS Plus (HFS +) para almacenamiento interno. Ningún dispositivo tiene ranuras de almacenamiento externo. Los dispositivos con la versión 10.3 o posterior ejecutan el sistema de archivos Apple y admiten un tamaño de archivo máximo de 8 EB.
Consejos
Detectar archivos corruptos
Es útil verificar las sumas MD5 (provistas en un archivo en el directorio de descarga) para asegurarse de que la descarga fue completa y precisa. Esto se puede verificar ejecutando el comando "md5sum" en los archivos descargados. Dados sus tamaños, esto puede llevar algún tiempo calcular. Debido a los detalles técnicos de cómo se almacenan los archivos , los tamaños de los archivos pueden informarse de manera diferente en diferentes sistemas de archivos y, por lo tanto, no son necesariamente confiables. Además, es posible que se hayan producido daños durante la descarga, aunque es poco probable.
Reformateo de unidades USB externas
Si planea descargar archivos de volcado de Wikipedia en una computadora y usa una unidad flash USB externa o un disco duro para copiarlos a otras computadoras, entonces se encontrará con el límite de tamaño de archivo FAT32 de 4 GB. Para evitar este límite, vuelva a formatear la unidad USB> 4 GB a un sistema de archivos que admita archivos de mayor tamaño. Si trabaja exclusivamente con computadoras con Windows XP-Vista-7, vuelva a formatear la unidad USB al sistema de archivos NTFS.
Linux y Unix
Si parece que está llegando al límite de 2 GB, intente usar wget versión 1.10 o superior, cURL versión 7.11.1-1 o superior, o una versión reciente de lynx (usando -dump). Además, puede reanudar las descargas (por ejemplo, wget -c).
¿Por qué no simplemente recuperar datos de wikipedia.org en tiempo de ejecución?
Suponga que está creando un software que en ciertos puntos muestra información que proviene de Wikipedia. Si desea que su programa muestre la información de una manera diferente a la que se puede ver en la versión en vivo, probablemente necesitará el código wik que se usa para ingresarlo, en lugar del HTML terminado.
Además, si desea obtener todos los datos, probablemente desee transferirlos de la manera más eficiente posible. Los servidores de wikipedia.org necesitan hacer bastante trabajo para convertir el wikicode en HTML. Eso consume mucho tiempo tanto para usted como para los servidores de wikipedia.org, por lo que el simple hecho de utilizar arañas en todas las páginas no es el camino a seguir.
Para acceder a cualquier artículo en XML, uno a la vez, acceda a Especial: Exportar / Título del artículo .
Lea más sobre esto en Especial: Exportación .
Tenga en cuenta que los espejos en vivo de Wikipedia que se cargan dinámicamente desde los servidores de Wikimedia están prohibidos. Consulte Wikipedia: espejos y horquillas .
No utilice un rastreador web.
No utilice un rastreador web para descargar una gran cantidad de artículos. El rastreo agresivo del servidor puede causar una ralentización dramática de Wikipedia.
Ejemplo de correo electrónico de rastreador bloqueado
- La dirección IP nnn.nnn.nnn.nnn recuperaba hasta 50 páginas por segundo de las direcciones de wikipedia.org. Algo así como al menos un segundo retraso entre solicitudes es razonable. Por favor respete esa configuración. Si debe excederlo un poco, hágalo solo durante las horas menos ocupadas que se muestran en los gráficos de carga de nuestro sitio en stats .wikimedia .org / EN / ChartsWikipediaZZ .htm . Vale la pena señalar que rastrear todo el sitio a una velocidad por segundo llevará varias semanas. La IP de origen ahora está bloqueada o lo estará en breve. Por favor contáctenos si desea desbloquearlo. No intente eludirlo, solo bloquearemos todo su rango de IP.
- Si desea información sobre cómo obtener nuestro contenido de manera más eficiente, ofrecemos una variedad de métodos, incluidos volcados de base de datos semanales que puede cargar en MySQL y rastrear localmente a la velocidad que considere conveniente. También hay herramientas disponibles que lo harán por usted con la frecuencia que desee una vez que tenga la infraestructura en su lugar.
- En lugar de una respuesta por correo electrónico, es posible que prefiera visitar #mediawiki connect en irc.libera.net para discutir sus opciones con nuestro equipo.
Realización de consultas SQL en el volcado de la base de datos actual
Puede realizar consultas SQL en el volcado de la base de datos actual utilizando Quarry (como reemplazo de la página Special: Asksql deshabilitada ).
Esquema de base de datos
Esquema SQL
Ver también: mw: Manual: Diseño de base de datos
El archivo sql utilizado para inicializar una base de datos MediaWiki se puede encontrar aquí .
Esquema XML
El esquema XML para cada volcado se define en la parte superior del archivo. Y también se describe en la página de ayuda de exportación de MediaWiki .
Ayuda para analizar volcados para su uso en scripts
- Wikipedia: Computer help desk / ParseMediaWikiDump describe la biblioteca Perl Parse :: MediaWikiDump, que puede analizar volcados XML.
- El preprocesador de Wikipedia (wikiprep.pl) es un script de Perl que preprocesa los volcados XML sin procesar y crea tablas de enlaces, jerarquías de categorías, recopila texto de anclaje para cada artículo, etc.
- El analizador de volcado de Wikipedia SQL es una biblioteca .NET para leer volcados de MySQL sin la necesidad de utilizar la base de datos MySQL
- WikiDumpParser : una biblioteca de .NET Core para analizar los volcados de la base de datos.
- Dictionary Builder es un programa de Rust que puede analizar volcados XML y extraer entradas en archivos
- Scripts para analizar volcados de Wikipedia : scripts basados en Python para analizar archivos sql.gz de volcados de wikipedia.
- parse-mediawiki-sql : una biblioteca de Rust para analizar rápidamente los archivos de volcado de SQL con una asignación de memoria mínima
Haciendo Hadoop MapReduce en el volcado de la base de datos actual de Wikipedia
Puede realizar consultas de Hadoop MapReduce en el volcado de la base de datos actual, pero necesitará una extensión para InputRecordFormat para que cada
Ayuda para importar volcados a MySQL
Ver:
- mw: Manual: Importación de volcados XML
- m: volcados de datos
Volcados de árbol HTML estáticos para duplicación o distribución de CD
MediaWiki 1.5 incluye rutinas para volcar un wiki en HTML, renderizando el HTML con el mismo analizador utilizado en un wiki en vivo. Como se indica en la página siguiente, poner uno de estos vertederos en la web sin modificar constituirá una infracción de marca registrada. Están pensados para visualización privada en una intranet o instalación de escritorio.
- Si desea crear un borrador de un sitio web tradicional en Mediawiki y volcarlo en formato HTML, es posible que desee probar mw2html por Usuario: Connelly .
- Si desea ayudar a desarrollar herramientas HTML de volcado a estático, envíenos una nota a la lista de correo de los desarrolladores .
- Los volcados de HTML estático ahora están disponibles aquí , pero no están actualizados.
Ver también:
- mw: los analizadores alternativos enumeran algunas otras opciones que no funcionan para obtener volcados de HTML estático
- Wikipedia: instantáneas
- Wikipedia: base de datos TomeRaider
Kiwix
Kiwix es, con mucho, la distribución sin conexión más grande de Wikipedia hasta la fecha. Como lector sin conexión, Kiwix trabaja con una biblioteca de contenidos que son archivos zim: puede elegir cualquier proyecto de Wikimedia (Wikipedia en cualquier idioma, Wiktionary , Wikisource , etc.), así como TED Talks , PhET Interactive Maths & Physics simulaciones , Proyecto Gutenberg , etc.
Es gratuito y de código abierto, y actualmente está disponible para descargar en:
- Androide
- iOS
- Mac OS
- Windows y Windows 10 (UWP)
- GNU / Linux
... así como extensiones para navegadores Chrome y Firefox , soluciones de servidor, etc. Consulte el sitio web oficial para ver la cartera completa de Kiwix.
Diccionario Aard
Aard Dictionary es un lector de Wikipedia sin conexión. Sin imágenes. Multiplataforma para Windows, Mac, Linux, Android, Maemo. Se ejecuta en lectores de libros electrónicos Nook y Sony PRS-T1 rooteados. https://github.com/aarddict
Libro electronico
La tienda wiki-as-ebook ofrece libros electrónicos creados a partir de un gran conjunto de artículos de Wikipedia con imágenes en escala de grises para lectores de libros electrónicos (2013).
Wikiviewer para Rockbox
El complemento wikiviewer para rockbox permite ver volcados de Wikipedia convertidos en muchos dispositivos Rockbox . Necesita una compilación y conversión personalizadas de los volcados de wiki utilizando las instrucciones disponibles en http://www.rockbox.org/tracker/4755 . La conversión recomprime el archivo y lo divide en archivos de 1 GB y un archivo de índice que deben estar en la misma carpeta en el dispositivo o en la tarjeta micro sd.
Viejos vertederos
- La versión estática de Wikipedia creada por Wikimedia: http://static.wikipedia.org/ 11 de febrero de 2013 - Aparentemente, ahora está fuera de línea. No hubo contenido.
- Wiki2static (sitio inactivo a partir de octubre de 2005[actualizar]) fue un programa experimental creado por el Usuario: Alfio para generar volcados html, incluyendo imágenes, función de búsqueda e índice alfabético. En el sitio vinculado, se pueden descargar los volcados experimentales y el propio script. Como ejemplo, se utilizó para generar estas copias de WikiPedia en inglés 24 de abril de 2004 , WikiPedia simple 1 de mayo de 2004 ( base de datos antigua) y WikiPedia en inglés 24 de julio de 2004 WikiPedia simple 24 de julio de 2004 , WikiPedia Francais 27 Juillet 2004 (nuevo formato). BozMo usa una versión para generar copias estáticas periódicas en una referencia fija (sitio inactivo a partir de octubre de 2017).
Generación de HTML dinámico a partir de un volcado de base de datos XML local
En lugar de convertir un archivo de volcado de base de datos en muchas piezas de HTML estático, también se puede utilizar un generador de HTML dinámico. Navegar por una página wiki es como navegar por un sitio Wiki, pero el contenido se obtiene y se convierte de un archivo de volcado local a pedido del navegador.
XOWA
XOWA es una aplicación gratuita de código abierto que ayuda a descargar Wikipedia en una computadora. Accede a toda Wikipedia sin conexión, ¡sin conexión a Internet! Actualmente se encuentra en la etapa beta de desarrollo, pero es funcional. Está disponible para descargar aquí .
Características
- Muestra todos los artículos de Wikipedia sin conexión a Internet.
- Descargue una copia reciente y completa de Wikipedia en inglés.
- Muestra más de 5,2 millones de artículos en formato HTML completo.
- Muestre imágenes dentro de un artículo. Acceda a más de 3,7 millones de imágenes utilizando las bases de datos de imágenes sin conexión.
- Funciona con cualquier wiki de Wikimedia, incluidos Wikipedia, Wiktionary, Wikisource, Wikiquote, Wikivoyage (también algunos volcados que no son de wmf)
- Funciona con cualquier wiki en un idioma que no sea inglés, como Wikipedia en francés, Wikisource en alemán, Wikivoyage en holandés, etc.
- Funciona con otros wikis especializados como Wikidata, Wikimedia Commons, Wikispecies o cualquier otro volcado generado por MediaWiki
- Configure más de 660 wikis más, entre los que se incluyen:
- Wikcionario en ingles
- Wikisource en inglés
- Wikiquote en inglés
- Wikivoyage en inglés
- Wikis que no están en inglés, como Wikcionario en francés, Wikisource en alemán, Wikivoyage en holandés
- Wikidata
- Wikimedia Commons
- Wikiespecies
- ... ¡y muchos más!
- Actualice su wiki cuando lo desee, utilizando las copias de seguridad de la base de datos de Wikimedia.
- Navega entre wikis sin conexión. Haga clic en "Buscar esta palabra en Wiktionary" y vea instantáneamente la página en Wiktionary.
- Edite artículos para eliminar el vandalismo o los errores.
- Instálelo en una tarjeta de memoria flash para transportarlo a otras máquinas.
- Ejecutar en Windows, Linux y Mac OS X.
- Vea el HTML de cualquier página wiki.
- Busque cualquier página por título utilizando un cuadro de búsqueda similar a Wikipedia.
- Navegue por las páginas por orden alfabético usando Special: AllPages.
- Encuentra una palabra en una página.
- Accede a un historial de páginas visitadas.
- Marque sus páginas favoritas.
- Descarga imágenes y otros archivos a pedido (cuando está conectado a Internet)
- Configura Wikipedia simple en menos de 5 minutos
- Se puede personalizar en muchos niveles: desde atajos de teclado hasta diseños HTML y opciones internas.
Principales características
- Búsqueda muy rápida
- Búsqueda basada en palabras clave (en realidad, palabras de título)
- La búsqueda produce múltiples artículos posibles: puede elegir entre ellos
- Representación basada en LaTeX para fórmulas matemáticas
- Requisitos mínimos de espacio: el archivo .bz2 original más el índice
- Instalación muy rápida (cuestión de horas) en comparación con cargar el volcado en MySQL
WikiFilter
WikiFilter es un programa que le permite explorar más de 100 archivos de volcado sin visitar un sitio Wiki.
Requisitos del sistema WikiFilter
- Una versión reciente de Windows (WinXP está bien; Win98 y WinME no funcionarán porque no tienen soporte NTFS)
- Un poco de espacio en el disco duro (para instalar, necesitará entre 12 y 15 Gigabytes; luego, solo necesitará unos 10 Gigabytes)
Cómo configurar WikiFilter
- Comience a descargar un archivo de volcado de la base de datos de Wikipedia, como un volcado de Wikipedia en inglés . Es mejor usar un administrador de descargas como GetRight para que pueda reanudar la descarga del archivo incluso si su computadora falla o se apaga durante la descarga.
- Descargue XAMPPLITE desde [2] (debe obtener la versión 1.5.0 para que funcione). Asegúrese de elegir el archivo cuyo nombre de archivo termina con .exe
- Instálelo / extráigalo en C: \ XAMPPLITE.
- Descargue WikiFilter 2.3 desde este sitio: http://sourceforge.net/projects/wikifilter . Tendrá una opción de archivos para descargar, así que asegúrese de elegir la versión 2.3. Extraerlo a C: \ WIKIFILTER.
- Copie el WikiFilter.so en su carpeta C: \ XAMPPLITE \ apache \ modules.
- Edite su archivo C: \ xampplite \ apache \ conf \ httpd.conf y agregue la siguiente línea:
- LoadModule WikiFilter_module "C: /XAMPPLITE/apache/modules/WikiFilter.so"
- Cuando su archivo de Wikipedia haya terminado de descargarse, descomprímalo en su carpeta C: \ WIKIFILTER. (Usé la versión de demostración de WinRAR http://www.rarlab.com/ ; BitZipper http://www.bitzipper.com/winrar.html también funciona bien).
- Ejecute WikiFilter (WikiIndex.exe), vaya a su carpeta C: \ WIKIFILTER, arrastre y suelte el archivo XML en la ventana, haga clic en Cargar y luego en Iniciar.
- Una vez que termine, salga de la ventana y vaya a su carpeta C: \ XAMPPLITE. Ejecute el archivo setup_xampp.bat para configurar xampp.
- Cuando termine con eso, ejecute el archivo Xampp-Control.exe e inicie Apache.
- Vaya a http: // localhost / wiki y vea si funciona
- Si no funciona, consulte los foros .
WikiTaxi (para Windows)
WikiTaxi es un lector sin conexión de wikis en formato MediaWiki. Permite a los usuarios buscar y explorar wikis populares como Wikipedia, Wikiquote o WikiNews, sin estar conectados a Internet. WikiTaxi funciona bien con diferentes idiomas como inglés, alemán, turco y otros, pero tiene problemas con las escrituras de derecha a izquierda. WikiTaxi no muestra imágenes.
Requisitos del sistema WikiTaxi
- Cualquier versión de Windows a partir de Windows 95 o posterior. Soporte de archivos grandes (más de 4 GB que requiere un sistema de archivos exFAT) para los wikis enormes (solo en inglés en el momento de escribir este artículo).
- También funciona en Linux con Wine .
- 16 MB de RAM como mínimo para el lector WikiTaxi, se recomiendan 128 MB para el importador (más por velocidad).
- Espacio de almacenamiento para la base de datos WikiTaxi. Esto requiere alrededor de 11,7 GiB para Wikipedia en inglés (a partir del 5 de abril de 2011), 2 GB para alemán, menos para otras wikis. Es probable que estas cifras aumenten en el futuro.
Uso de WikiTaxi
- Descargue WikiTaxi y extráigalo en una carpeta vacía. De lo contrario, no se requiere instalación.
- Descargue el volcado de la base de datos XML (* .xml.bz2) de su wiki favorito.
- Ejecute WikiTaxi_Importer.exe para importar el volcado de la base de datos a una base de datos WikiTaxi. El importador se encarga de descomprimir el volcado a medida que importa, así que asegúrese de ahorrar espacio en el disco y no lo descomprima de antemano.
- Cuando finalice la importación, inicie WikiTaxi.exe y abra el archivo de base de datos generado. Puede comenzar a buscar, navegar y leer de inmediato.
- Después de una importación exitosa, el archivo de volcado XML ya no es necesario y se puede eliminar para recuperar espacio en disco.
- Para actualizar un Wiki sin conexión para WikiTaxi, descargue e importe un volcado de base de datos más reciente.
Para la lectura de WikiTaxi, solo se requieren dos archivos: WikiTaxi.exe y la base de datos .taxi. Cópielos en cualquier dispositivo de almacenamiento (lápiz de memoria o tarjeta de memoria) o grábelos en un CD o DVD y llévese su Wikipedia a donde quiera que vaya.
BzReader y MzReader (para Windows)
BzReader es un lector de Wikipedia sin conexión con capacidades de búsqueda rápida. Transforma el texto Wiki en HTML y no necesita descomprimir la base de datos. Requiere Microsoft .NET framework 2.0.
MzReader de Mun206 funciona con (aunque no está afiliado a) BzReader y permite una mayor representación de wikicode en un mejor HTML, incluida una interpretación de la máscara de monobook. Su objetivo es hacer que las páginas sean más legibles. Requiere Microsoft Visual Basic 6.0 Runtime, que no se suministra con la descarga. También requiere Inet Control e Internet Controls (Internet Explorer 6 ActiveX), que se incluyen con la descarga.
EPWING
La base de datos de Wikipedia sin conexión en formato de diccionario EPWING, que es común y un estándar industrial japonés (JIS) obsoleto en Japón, se puede leer, incluidas imágenes en miniatura y tablas con algunos límites de representación, en cualquier sistema donde haya un lector disponible ( Boookends ). Hay muchos lectores comerciales y gratuitos para Windows (incluido Mobile), Mac OS X, iOS (iPhone, iPad), Android, Unix-Linux-BSD, DOS y aplicaciones de navegador basadas en Java ( Visores EPWING ).
Edificio de espejos
WP-ESPEJO
- Importante: WP-mirror no se admite desde 2014, y se necesita la verificación de la comunidad de que realmente funciona. Ver página de discusión .
WP-MIRROR es una utilidad gratuita para duplicar cualquier conjunto deseado de wikis WMF. Es decir, crea una granja de wiki que el usuario puede explorar localmente. WP-MIRROR crea un espejo completo con archivos multimedia de tamaño original. WP-MIRROR está disponible para descargar .
Ver también
- DBpedia
- WikiReader
- m: Exportar
- m: Ayuda: Descarga de páginas
- m: Importar
- Meta: volcados de datos / otras herramientas , para herramientas relacionadas, por ejemplo, extractores y "lectores de volcado"
- Wikipedia: Selección de CD de Wikipedia
- Wikipedia: tamaño de Wikipedia
- meta: Reflejo de volcados XML del proyecto Wikimedia
- meta: herramientas de versión estática
- Proyectos fuera de línea de Wikimedia
Referencias
- ^ "Benchmarked: ¿Cuál es el mejor formato de compresión de archivos?" . Cómo geek . How-To Geek, LLC . Consultado el 18 de enero de 2017 .
- ^ "Comprima y descomprima archivos" . Microsoft . Microsoft . Consultado el 18 de enero de 2017 .
- ^ Compatibilidad con archivos grandes en Linux
- ^ Android 2.2 y antes usaban el sistema de archivos YAFFS; 14 de diciembre de 2010.
enlaces externos
- Descargas de Wikimedia .
- Domas visita los registros (¡ lee esto! ). Además, datos antiguos en Internet Archive .
- Archivos de listas de correo de Wikimedia .
- Usuario: Archivo Emijrp / Wikipedia . Un esfuerzo por encontrar todos los datos disponibles de Wiki [mp] edia y para animar a las personas a descargarlos y guardarlos en todo el mundo.
- Script para descargar todos los volcados de Wikipedia 7z .