Investigar Wikipedia (anteriormente conocido como Estado de Wikipedia ) analiza algunas formas de medir cuantitativamente varios aspectos del proyecto de Wikipedia y cubre la investigación realizada en esa área. El tema es difícil, ya que hay diferentes objetivos que puede tener Wikipedia y diferentes formas de medir el logro de esos objetivos.
Una forma difícil de medir el éxito es contar la cantidad de artículos en Wikipedia. Esta información se puede encontrar en la página de Estadísticas . Un problema con solo contar el número de artículos es, ¿qué es un "artículo"? Un gran porcentaje de nuestros "artículos" pueden ser resúmenes muy breves o incluso consistir en actos de vandalismo no detectados. {{ fusionar }} Los artículos rechonchos generan menos artículos, mejores, sin perder contenido. Una medida más precisa del tamaño de Wikipedia es la cantidad de caracteres o palabras en los artículos. Wikipedia en octubre de 2006 tenía 1,4 millones de artículos con una longitud media de 3300 caracteres.
Tal medida no da ninguna indicación de la calidad del contenido. Es mucho más difícil estimar la cantidad de artículos buenos, útiles, precisos o equilibrados en Wikipedia. Para esto, solo podemos tener en cuenta los artículos que hayan sido evaluados de alguna manera, ya sea como artículos " destacados ", " buenos ", " A- " o " B-Class ". En febrero de 2007, uno en ca. 550 artículos en Wikipedia son "destacados" o "buenos".
Una forma de pensar en la página de Estadísticas es considerarla una medida del éxito de Wikipedia como un proyecto más que como una obra de referencia. Dado que es un proyecto para producir un trabajo de referencia (con la construcción de comunidad como un efecto secundario, no un objetivo secundario), la evaluación del éxito del proyecto estará directamente relacionada con la evaluación del trabajo de referencia.
Otra forma de considerar el éxito de Wikipedia es preguntar qué tan relevante es la información de Wikipedia para la World Wide Web . ¿Cuántas visitas al día recibe el sitio de Wikipedia? ¿Cuántos lectores proceden de Google ? ¿Qué páginas tienen un PageRank de Google alto ?
Una medida de la popularidad de Wikipedia la proporciona su entrada en Alexa, que muestra su clasificación de tráfico web.
Una medida que es valiosa, pero difícil de automatizar, es considerar Wikipedia: los 10 principales éxitos de Google . De los temas que ya están en Wikipedia, ¿cuántos son referencias lo suficientemente buenas como para obtener un alto ranking de página en Google?
Otra medida más podría involucrar la cantidad o el grado en que otros sitios usan el contenido de Wikipedia . El hecho de que otros sitios confíen en la precisión del contenido de Wikipedia es un fuerte indicador de su éxito.
Otro eje a considerar es la cobertura de Wikipedia . La cobertura es una medida de cuánta información que necesitamos en Wikipedia ya está allí. ¿Qué tan bien "cubre" Wikipedia la gama de conocimientos que debería?
Una forma de pensar en la cobertura es imaginar algún tipo de "punto final" en el futuro - Edit Zero - donde toda la información que es digna de Wikipedia está en el sistema. En ese momento, el trabajo de los wikipedistas pasará de escribir sobre temas existentes a agregar artículos sobre nuevos temas a medida que surjan nuevas personas, eventos, países, ceremonias de premios, especies, álbumes, libros y planetas. Una medida de la cobertura actual de Wikipedia sería medir cuántos de los artículos de esa enciclopedia imaginada ya existen en alguna forma útil.
Ésta es, en la mayoría de los casos, una métrica inconmensurable. No sabemos cuántos artículos habrá en Wikipedia en Edit Zero, por lo que no podemos saber qué porcentaje de los que ya tenemos. Lo mejor que podemos esperar es aproximarnos a la métrica de cobertura "real" con algunas medidas ad hoc .
Algunas aproximaciones propuestas:
Tenga en cuenta que el modelo Edit Zero es simplista al esperar que la cantidad de artículos dignos de Wikipedia converja en algún momento en el futuro.
Esta página de Wikipedia debe actualizarse . Ayude a actualizar esta página de Wikipedia para reflejar los eventos recientes o la información disponible recientemente. La discusión relevante se puede encontrar en la página de discusión . |
Wikipedia (principalmente) y otros proyectos de Wikimedia generan cada vez más investigaciones relacionadas con el estudio de los fenómenos responsables de su funcionamiento. Parte de esa investigación se ha publicado en revistas académicas profesionales o se ha presentado en conferencias: consulte Wikipedia: Estudios académicos de Wikipedia .
Sin embargo, una cantidad significativa de otras consultas no se publican en dichas revistas y, como resultado, el espacio de nombres de Wikipedia en Wikipedia, así como algunas páginas en nuestra Meta wiki y probablemente en otros proyectos, se ha llenado cada vez más con artículos de investigación, ensayos y trabajos breves. otros recursos. meta: La investigación es el lugar donde se supone que se coordina dicha investigación , pero de hecho, la mayoría de las herramientas y artículos se pueden encontrar en Wikipedia en inglés . A continuación se muestra una guía de esos recursos.
Nota 1: Los proyectos más interesantes y más o menos actualizados están en negrita .
Nota 2: Los gráficos, cuadros y demás deben agregarse a la Categoría: cuadros de Wikipedia
Palabras clave:
Artículo | Descripción y comentarios | Última actualización a partir de | Serie temporal de | Análisis | Tiene tablas / listas | Tiene gráficos | Palabras clave |
---|---|---|---|---|---|---|---|
Estadísticas del administrador: Usuario: NoSeptember / The NoSeptember Admin Project | Muchas estadísticas relacionadas con la administración, muchas subpáginas. | Febrero de 2007 | Al principio, tanto como sea posible | sí | sí | sí | Editores |
Anuncios | Anuncios sobre 1) Hitos importantes, estadísticas y noticias de clasificación de Alexa sobre la Wikipedia en inglés (ver Especial: Estadísticas) 2) Cualquier noticia sobre la Fundación Wikimedia que afecte a la Wikipedia en inglés. | Mensual | Desde enero de 2001 | Tipo de comunicado de prensa | sí | No | |
Artículos para estadísticas de eliminación | Estadísticas aproximadas sobre AfD, ver subpáginas. Particularmente útil: Wikipedia: AFD 100 días : se utilizó un script de computadora diseñado por Dragons flight para analizar 100 días de registros de AFD desde el 1 de junio de 2005 al 8 de septiembre de 2005 buscando palabras clave en negrita (por ejemplo, eliminar, mantener, fusionar, redirigir, matar , limpieza, etc.) en comentarios firmados. Esto ha permitido generar una gran muestra estadística a partir de la cual se podrían identificar patrones importantes en el comportamiento de votación y eliminación de artículos. | Enero de 2006 | 7 de febrero | Algunos | sí | No | Artículos |
Artículos por población | La cantidad de artículos de Wikipedia que existen en un idioma por millón de hablantes totales de ese idioma. | Septiembre de 2006 | Ninguno, pero el historial muestra una serie de actualizaciones desde noviembre de 2005 | No | sí | No | Artículos |
Estadísticas de conciencia | Intenta medir el crecimiento de la conciencia pública sobre Wikipedia. Principalmente preocupado por las calificaciones de Alexa de Wikipedia , es decir, "qué tan popular es Wikipedia". | Varía, pero la mayoría de las tablas están actualizadas al 7 de enero de 2007; los gráficos están etiquetados como enero de 2006 | Varía, desde octubre de 2002 en adelante | sí | sí | sí | Usuarios |
Navegadores | Qué navegadores se utilizan para acceder a la Wikipedia en inglés | Septiembre de 2004 | El historial muestra datos antiguos de abril de 2004 | No | sí | No | Técnico, Usuarios |
Estadísticas de artículos destacados | Algunas estadísticas básicas sobre artículos destacados . | Mensual | Enero de 2004 | sí | sí | sí | Artículos |
Buenas estadísticas de artículos | Algunas estadísticas básicas sobre buenos artículos . | Febrero de 2007 | Noviembre de 2005 | sí | sí | sí | Artículos |
Lo que le gustó a Google | Google tiene una página web llamada Google Zeitgeist sobre patrones de búsqueda y tendencias para la web en general. Esto nos puede decir en Wikipedia lo que la gente está buscando. ¿Tenemos contenido para que lo encuentren? De lo contrario, sería bueno que tuviéramos una prioridad alta en la creación de dicha lista, especialmente para las diez búsquedas principales más recientes. Idealmente, las estadísticas de Google Zeitgeist deberían coincidir con las estadísticas de enlaces de Google a Wikipedia. Véase también Wikipedia: artículos que son el número uno por una palabra en las búsquedas de Google y Wikipedia: Zeitgeist (datos de 2004) | 7 de marzo de 2003 | Noviembre de 2001 | sí | sí | No | Usuarios, Técnico |
Lista de wikipedistas por número de ediciones | El nombre se explica por sí mismo. | Mayo de 2008 | 16 de junio de 2004 | Un poquito | sí | No | Editores |
Lista de wikipedistas por número de ediciones recientes | El nombre se explica por sí mismo. | Mayo de 2008 | Mayo de 2004 | No | sí | No | Editores |
Estadísticas de hitos | Idiomas (fechas en las que se alcanzaron los hitos (definidos como la cantidad de artículos en una Wikipedia determinada), en orden de alcanzarlos) | Febrero de 2007 | Ninguno, pero el historial muestra actualizaciones desde noviembre de 2004 | No | sí | No | Artículos |
Modelando el crecimiento de Wikipedia | Esta página analiza los datos de recuento de artículos en Wikipedia: tamaño de Wikipedia e intenta ajustar un modelo numérico simple de crecimiento pasado y futuro a los datos de crecimiento y tamaño de recuento de artículos observados. | Noviembre de 2006 | Junio de 2003 si quieres profundizar en la historia | sí | No | sí | Artículos |
Artículos más referenciados | Estos son los artículos más referenciados que se encuentran en el volcado de la base de datos del 25 de enero de 2006. | 25 de enero de 2006 | 14 de agosto de 2003 en el historial de páginas | sí | sí | No | Artículos |
Páginas editadas con más frecuencia | Obvio. | Mayo de 2008 | Enero de 2004 | No | sí | No | Artículos |
Páginas más populares Octubre de 2001 | Obvio y no actualizado. Ver páginas populares . | Octubre de 2001 | No | sí | sí | No | Artículos |
Páginas de discusión más editadas | Aquí están las páginas de discusión con más revisiones, al 11 de noviembre de 2003. | 11 de noviembre de 2003 | Febrero de 2003 | No | sí | No | Artículos |
Crecimiento de wikipedistas por idioma. Muchas páginas de la categoría, particularmente interesantes: Wikipedia: Estadísticas mensuales multilingües (panorama) y Wikipedia: Estadísticas multilingües . | Febrero de 2007 | Julio de 2001 | Algunas veces | sí | No | Artículos | |
Personas por año | Utiliza categorías de nacimiento y muerte para contar el número de artículos sobre personas nacidas / muertas en un año determinado. Véase también Wikipedia: Personas por año / Informes . | Julio de 2005 | Septiembre de 2004 | No | sí | No | Artículos, Técnico |
Quinielas | Se han creado grupos en los que las personas hacen conjeturas sobre varios hitos futuros de Wikipedia, con hitos definidos como "cuándo alcanzará Wikipedia el número x de artículos". Puede ser útil para algunos análisis de predicciones. | Varios | Varios | N / A | sí | No | |
Paginas populares | Una lista de páginas ordenadas por número de visitas en el último mes. | Mayo de 2008 | Abril de 2004 | No | sí | No | Artículos |
Wikipedia: productividad de los autores de Wikipedia | Actividad de los editores por idioma de Wikipedia | mediados de 2006 | No | sí | sí | No | Editores |
Investigando Wikipedia | Esta página analiza algunas formas de medir cuantitativamente nuestro éxito con Wikipedia. Básicamente un ensayo sobre estadísticas de Wikipedia. | 2003 | No | sí | No | No | Todos |
Estadísticas del motor de búsqueda | Registra datos sobre la frecuencia y protagonismo con que Wikipedia aparece en los buscadores (Google). | Noviembre de 2005 | No | sí | sí | sí | Artículos, Técnico |
Comparaciones de tamaño | Este artículo compara el tamaño de Wikipedia con otras enciclopedias y colecciones de información. | Febrero de 2007 | Septiembre de 2002 en la historia del artículo. | sí | sí | No | Artículos, Usuarios |
Tamaño de Wikipedia | Página de estadísticas antigua. Mayormente histórico. | Algunos actualizados, otros no. | Consultar historial. | sí | sí | sí | Artículos, Usuarios |
Wikipedia: Estadísticas | La página principal de estadísticas oficiales. | Mayormente actualizado. | Diciembre de 2001, pero nada útil allí. | sí | No | No | Todos |
Porcentajes de talón | Con Wikipedia cruzando un millón de artículos a principios de 2006, hice una pregunta simple: ¿qué proporción de esos artículos son stubs? | Julio de 2005 | No | sí | No | sí | Artículos |
Encuesta Wikipediana de Wikimania 2006 | Una pequeña encuesta sobre las razones del éxito de Wikipedia. Preguntas abiertas: ¿Qué impulsa a las personas a editar Wikipedia en primer lugar? ¿Por qué los editores se quedan con el proyecto? ¿Qué te ha dado la edición de Wikipedia a cambio? ¿Algo más que le gustaría agregar? ¿Cuantos años tienes? ¿Con qué frecuencia editas? ¿Cuál es su nivel de usuario más alto (anónimo, usuario registrado, administrador, burócrata, administrador, desarrollador, miembro de la junta, jimbo)? | Verano 2006 | No repetido | sí | No | No | Editores |
Wikipedia interwiki y prueba de conocimientos especializados | ¿Cuánta información más hay para asimilar Wikipedia? | 22 de julio de 2006 | No actualizado | sí | No | No | Artículos |
Artículos solicitados Estadísticas de bot | Esta página muestra el número actual de solicitudes en cada una de las páginas de artículos solicitados que el RABot puede procesar. También se muestra el número máximo / mínimo de solicitudes que se han observado en cada página desde que el bot comenzó a ejecutarse y el número de solicitudes completadas que RABot ha eliminado. Las cifras "por día" reflejan el número de días que se ha utilizado RABot como ayuda en cada página, que puede ser menor que el número total de días que ha existido el guión. La limpieza inicial, incluidos los cientos de solicitudes eliminadas la primera vez que se ejecutó, no se incluyen en estos totales. | Junio de 2006 | Junio de 2005 | sí | sí | No | Artículos |
Wikipedia: Departamento de Estadística | Este proyecto, el Departamento de Estadística, ofrece un espacio para que los contribuyentes interesados en estadísticas discutan qué medir, cuándo y cómo. | inactivo | inactivo | algunos | no | no | |
Palabras por artículo | Una de las métricas en la página de comparación de tamaño de Wikipedia es el número de palabras por artículo. Algunos wikipedistas anticipan que la tasa de creación de nuevos artículos eventualmente se ralentizará y, en cambio, se hará un esfuerzo para mejorar la calidad de los artículos existentes. Esta página examina un par de tendencias vagamente asociadas con la calidad: el número de palabras por artículo y el número de revisiones por artículo. | Octubre de 2005 | Enero de 2001 | sí | No | sí | Artículos |
¿El tráfico de Wikipedia obedece a la ley de Zipf? | Ley de Zipf | Septiembre de 2006 | No | sí | No | sí | Usuarios |
Wikipedia: estadísticas de Xiong | Este es un análisis preliminar de las estadísticas seleccionadas de Wikipedia en inglés durante el período comprendido entre enero de 2002 y marzo de 2005. Los datos se examinan en busca de evidencia de un cambio en los valores y la composición cultural de la comunidad wikipedista. | 2005 marzo | 2002 enero | sí | No | sí | Artículos, usuarios, editores |
Wikipedia: Tráfico | Algunas cifras de tráfico diario de finales de 2002 / principios de 2003 para la Wikipedia en inglés en visitas / día: | 2003 | 2002 | sí | sí | sí | Usuarios |
Tendencias de creación de WikiProject | Usar metadatos relacionados con WikiProjects como una ventana a la evolución de Wikipedia. | Julio de 2005 | Ninguno | sí | No | sí | Editores, Artículos |
Descripción de categoría:
Esta categoría tiene como objetivo incluir recursos para investigadores en dos capacidades:
Estamos interesados en la segunda subcategoría que sorprendentemente tiene muy pocas páginas.
Artículo | Descripción y comentarios |
---|---|
Wikipedia: WikiProject Wikidemia | Este proyecto, Wikidemia, proporciona un espacio para artículos relacionados con la investigación académica sobre Wikipedia. Semiactivo. Wikipedia: Parece que la wikipediología es una versión inactiva olvidada. |
Wikipedia: estudios académicos de Wikipedia | Una lista incompleta de presentaciones académicas y artículos en Wikipedia. |
Wikipedia: encuesta de usuarios | Propuesta olvidada, ver meta: Encuesta general de usuarios para un poco más avanzado, lamentablemente también inactivo. Véase también Wikipedia: encuesta de la Universidad de Würzburg, 2005 . |
Wikipedia: investigando con Wikipedia | Si bien es un recurso para la primera categoría, es un buen artículo y una buena introducción a Wikipedia desde una perspectiva más académica. |
Las siguientes herramientas son útiles para la investigación / análisis de estadísticas de Wikipedia y proyectos relacionados.
Artículo | Descripción y comentarios | Palabras clave |
---|---|---|
Consulta de API | Esta API proporciona una forma para que sus aplicaciones consulten datos directamente desde los servidores de MediaWiki. Se pueden recuperar una o más piezas de información sobre el sitio y / o una lista determinada de páginas. La información se puede devolver en una máquina (xml, json, php, yaml, wddx) o en un formato legible por humanos. Se puede solicitar más de un dato con una sola consulta. | |
Herramienta IBM History Flow | Una buena herramienta de 2004 ( descarga ) que llevó a este artículo , desafortunadamente no hay (yo conozco) 'cómo' usarlo, y fue diseñado para MediaWiki anterior a 1.5 (basado en SQL), lo que significa que puede ser en su mayoría sin valor ahora. Si alguien puede actualizar y crear un "cómo usarlo" sensato, por favor hágalo. | |
WhodunitQuery | Una aplicación basada en Windows desarrollada para Wikipedia en inglés. Con él, el usuario puede cargar cualquier artículo de Wikipedia, seleccionar una frase determinada y, con un clic, buscará en el historial de la página para determinar quién agregó la frase. Puede resultar muy útil para algunos análisis de contenido. | |
Editar contadores | Editar contadores. La forma más fácil de obtener algunos datos estadísticos útiles en este lado de tratar de lidiar con los volcados de bases de datos. Particularmente útil: Contador de contribuciones de artículos de TDS : lista de contribuyentes al artículo por número de contribuyentes (grupos anon juntos, use esto para obtener una lista de anones) ; Estadísticas de usuario de Interiot Tool 3 y Tool 1 (diseño diferente - diferentes estadísticas accesibles más fácilmente en cada una). La herramienta de Flcelloguy: la probaré pronto, parece muy prometedora. Lista de artículos creados por el usuario . | |
Guiones | Encuentro los siguientes scripts útiles para recopilar datos: Historial y Editar Resumen Uso Análisis (útil, pero puede bloquear el navegador de vez en cuando, y la descripción ('libro de códigos ...') de algunas estadísticas que calcula no es muy clara), Nuevo registro de páginas y contadores de edición del registro de nuevos usuarios (todavía no lo he probado) | |
WikiXRay en meta | El objetivo principal de este proyecto es desarrollar una herramienta de software robusta y extensible para un análisis cuantitativo en profundidad de todo el proyecto de Wikipedia. Parece prometedor pero no muy fácil de usar en este momento (nivel pre-alfa)). | |
WikiEvidens | WikiEvidens es una herramienta estadística y de visualización para wikis. |
Esta sección necesita expansión . Puedes ayudar agregando más . |