De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Wikidata es un gráfico de conocimiento multilingüe editado en colaboración alojado por la Fundación Wikimedia . Es una fuente común de datos abiertos que proyectos de Wikimedia como Wikipedia , [2] [3] y cualquier otra persona, pueden usar bajo la licencia de dominio público CC0 . Wikidata funciona con el software Wikibase . [4]

Concepto [ editar ]

Este diagrama muestra los términos más importantes utilizados en Wikidata.

Wikidata es una base de datos orientada a documentos , centrada en elementos, que representan cualquier tipo de temas, conceptos u objetos. A cada elemento se le asigna un identificador persistente único, un número entero positivo prefijado con la letra Q mayúscula, conocida como " QID ". Esto permite traducir la información básica necesaria para identificar el tema que cubre el ítem sin privilegiar ningún idioma.

Ejemplos de artículos incluyen los Juegos Olímpicos de Verano de 1988 (Q8470) , el amor (Q316) , Elvis Presley (Q303) y Gorilla (Q36611) .

Las etiquetas de los artículos no tienen por qué ser únicas. Por ejemplo, hay dos elementos llamados "Elvis Presley": Elvis Presley (Q303) , que representa al cantante y actor estadounidense , y Elvis Presley (Q610926) , que representa su álbum homónimo . Sin embargo, la combinación de una etiqueta y su descripción debe ser única. Por lo tanto, para evitar la ambigüedad, el identificador único de un artículo ( QID ) está vinculado a esta combinación.

Los tipos de elementos son generales y lexemas. [ aclaración necesaria ]

Partes principales [ editar ]



Un diseño de los cuatro componentes principales de una página de Wikidata de fase 1: la etiqueta, la descripción, los alias y los enlaces entre idiomas.

Básicamente, un artículo consta de:

  • Obligatoriamente, un identificador (el QID), relacionado con una etiqueta y una descripción.
  • Opcionalmente, múltiples alias y cierto número de declaraciones (y sus propiedades y valores).

Declaraciones [ editar ]

Tres declaraciones del artículo de Wikidata sobre el planeta Marte (Q111). Los valores incluyen enlaces a otros elementos y a Wikimedia Commons .

Las declaraciones son cómo se registra cualquier información conocida sobre un elemento en Wikidata. Formalmente, constan de pares clave-valor , que hacen coincidir una propiedad (como "autor" o "fecha de publicación") con uno o más valores de entidad (como " Sir Arthur Conan Doyle " o "1902"). Por ejemplo, la declaración informal en inglés "la leche es blanca" estaría codificada por una declaración que empareje la propiedad color (P462) con el valor blanco (Q23444) bajo el elemento leche (Q8495) .

Las declaraciones pueden asignar una propiedad a más de un valor. Por ejemplo, la propiedad de "ocupación" de Marie Curie podría vincularse con los valores "físico" y "químico", para reflejar el hecho de que ella se dedicó a ambas ocupaciones. [5]

Los valores pueden adoptar muchos tipos, incluidos otros elementos, cadenas, números o archivos multimedia de Wikidata. Las propiedades prescriben con qué tipos de valores se pueden emparejar. Por ejemplo, el sitio web oficial de la propiedad (P856) solo puede emparejarse con valores de tipo "URL". [6]

Propiedad y valor [ editar ]

Ejemplo de una declaración simple que consta de un par propiedad-valor

El método de Wikidata para estructurar datos involucra dos elementos principales: propiedades y valores de dichas propiedades (denominados "elementos" en la terminología de Wikidata). [7] [8]

Una propiedad describe el valor de datos de una declaración y se puede considerar como una categoría de datos, por ejemplo, color (P462) para el valor de datos azul (Q1088) o educación para un elemento de persona.

Como se dijo, las propiedades , cuando se combinan con valores , forman una declaración en Wikidata.

La propiedad más utilizada es cites work (P2860) , que se utiliza en más de 210.000.000 páginas de elementos. [9]

Las propiedades tienen sus propias páginas en Wikidata y, como un elemento puede incluir varias propiedades, esto da como resultado una estructura de datos vinculada de páginas, bajo la misma declaración.

Las propiedades también pueden definir reglas más complejas sobre su uso previsto, denominadas restricciones . Por ejemplo, la propiedad de capital (P36) incluye una "restricción de valor único", lo que refleja la realidad de que (típicamente) los territorios tienen solo una ciudad capital. Las restricciones se tratan como alertas y sugerencias de prueba, en lugar de reglas inviolables. [10]

Opcionalmente, los calificadores se pueden utilizar para refinar el significado de una declaración proporcionando información adicional que se aplica al alcance de la declaración, dentro de los valores. Por ejemplo, la propiedad "población" podría modificarse con un calificador como "a partir de 2011". Los valores en las declaraciones también se pueden anotar con referencias , apuntando a una fuente que respalda el contenido de la declaración. [11]

Lexemes [ editar ]

En lingüística , un lexema es una unidad de significado léxico . Del mismo modo, los lexemas de Wikidata son elementos con una estructura que los hace más adecuados para almacenar datos lexicográficos . Además de almacenar el lenguaje al que se refiere el lexema, tienen una sección para formas y una sección para sentidos . [12]

Desarrollo [ editar ]

La creación del proyecto se financió con donaciones del Instituto Allen de Inteligencia Artificial , la Fundación Gordon y Betty Moore y Google, Inc. , por un total de 1,3 millones de euros. [13] [14] El desarrollo del proyecto está impulsado principalmente por Wikimedia Deutschland bajo la dirección de Lydia Pintscher , y originalmente se dividió en tres fases: [15]

  1. Centralización de enlaces entre idiomas: enlaces entre artículos de Wikipedia sobre el mismo tema en diferentes idiomas.
  2. Proporcionar un lugar central para los datos de la caja de información para todas las wikipedias.
  3. Crear y actualizar artículos de listas basados ​​en datos en Wikidata y vincularlos a otros proyectos hermanos de Wikimedia, incluidos Meta-Wiki y el propio Wikidata (interwikilinks).

Lanzamiento inicial [ editar ]

Wikidata se lanzó el 29 de octubre de 2012 y fue el primer proyecto nuevo de la Fundación Wikimedia desde 2006. [2] [16] [17] En este momento, solo estaba disponible la centralización de enlaces de idiomas. Esto permitió crear elementos y completarlos con información básica: una etiqueta - un nombre o título, alias - términos alternativos para la etiqueta, una descripción y enlaces a artículos sobre el tema en todas las ediciones de varios idiomas de Wikipedia (enlaces interwikipedia) .

Históricamente, un artículo de Wikipedia incluía una lista de enlaces entre idiomas , que eran enlaces a artículos sobre el mismo tema en otras ediciones de Wikipedia, si existieran. Inicialmente, Wikidata era un repositorio autónomo de enlaces entre idiomas. [18] Las ediciones en idiomas de Wikipedia aún no podían acceder a Wikidata, por lo que necesitaban continuar manteniendo sus propias listas de enlaces entre idiomas, principalmente al final de las páginas de los artículos. [ cita requerida ]

El 14 de enero de 2013, la Wikipedia húngara se convirtió en la primera en permitir el suministro de enlaces entre idiomas a través de Wikidata. [19] Esta funcionalidad se amplió a las Wikipedias hebreas e italianas el 30 de enero, a la Wikipedia en inglés el 13 de febrero ya todas las demás Wikipedias el 6 de marzo. [20] [21] [22] [23] Después de que no se alcanzó un consenso sobre una propuesta para restringir la eliminación de enlaces de idiomas de la Wikipedia en inglés, [24] se otorgó el poder de eliminarlos de la Wikipedia en inglés a los editores automáticos ( bots ). El 23 de septiembre de 2013, se lanzaron enlaces entre idiomas en Wikimedia Commons.[25]

Declaraciones y acceso a datos [ editar ]

El 4 de febrero de 2013, se introdujeron declaraciones en las entradas de Wikidata. Los posibles valores para las propiedades se limitaron inicialmente a dos tipos de datos (elementos e imágenes en Wikimedia Commons ), con más tipos de datos (como coordenadas y fechas) para seguir más adelante. El primer tipo nuevo, string, se implementó el 6 de marzo. [26]

La capacidad de las distintas ediciones de Wikipedia para acceder a los datos de Wikidata se extenderá progresivamente entre el 27 de marzo y el 25 de abril de 2013. [27] [28] El 16 de septiembre de 2015, comenzó a permitir Wikidata llamado acceso arbitraria , o el acceso de una dado un artículo de Wikipedia a las declaraciones sobre elementos de Wikidata que no están directamente conectados a él. Por ejemplo, fue posible leer datos sobre Alemania del artículo de Berlín, lo que antes no era factible. [29] El 27 de abril de 2016 se activó el acceso arbitrario en Wikimedia Commons. [30]

Según un estudio de 2020, una gran proporción de los datos de Wikidata consisten en entradas importadas en masa de otras bases de datos por bots de Internet , lo que ayuda a "derribar [] las paredes" de los silos de datos . [31]

Servicio de consultas y otras mejoras [ editar ]

El 7 de septiembre de 2015, la Wikimedia Foundation anunció el lanzamiento del Wikidata Query Service, [32] que permite a los usuarios ejecutar consultas sobre los datos contenidos en Wikidata. [33] El servicio utiliza SPARQL como lenguaje de consulta. A noviembre de 2018, existen al menos 26 herramientas diferentes que permiten consultar los datos de diferentes formas. [34]

Por otro lado, en el panel lateral de Wiktionary, las herramientas ahora incluyen [ ¿cuándo? ] un "elemento de Wikidata" para ayudar a crear un nuevo elemento y enlaces a nuevas páginas. [ cita requerida ] Por ejemplo, esto es útil cuando el elemento está solo en el Wiktionary en inglés y necesita estar vinculado a otro proyecto de Wikimedia, en lugar de a Wiktionaries en otros idiomas.

A continuación se muestra un ejemplo de SPARQL para buscar una instancia de (P31) serie de televisión (Q5398426) con tema principal (P921) sobre isla (Q23442) y accidente de aviación (Q744913). Sin embargo, también se pueden encontrar resultados similares directamente en Wikipedia utilizando intersecciones de categorías si existen y están permitidas las categorías adecuadas.

SELECCIONAR  ?  Item? ItemLabel WHERE  {  ?  Item wdt : P31  wd : Q5398426 .  ? elemento  wdt : P921  wd : Q23442 .  ? elemento  wdt : P921  wd : Q744913 .  SERVICE  wikibase : label  { bd : serviceParam  wikibase : language  "[AUTO_LANGUAGE], en" .} }

A continuación se muestra otro ejemplo de SPARQL para encontrar una instancia de la serie de televisión (P31) (Q5398426) donde el miembro del elenco (P161) incluye a Daniel Dae Kim (Q299700) y Jorge García (Q264914). La condición de la serie de televisión evita que se muestre un episodio de la serie de televisión (Q21191270) / episodio de dos partes (Q21664088) y no muestra resultados que sean una película (Q11424).

SELECCIONAR  ?  Item? ItemLabel WHERE  {  ?  Item wdt : P31  wd : Q5398426 .  ? elemento  wdt : P161  wd : Q299700 .  ? elemento  wdt : P161  wd : Q264914 .  SERVICE  wikibase : label  { bd : serviceParam  wikibase : language  "[AUTO_LANGUAGE], en" .} }

[ editar ]

Las barras del logotipo contienen la palabra "WIKI" codificada en código Morse . [35] Fue creado por Arun Ganesh y seleccionado por decisión de la comunidad. [36]

Recepción [ editar ]

En noviembre de 2014, Wikidata recibió el premio Open Data Publisher Award del Open Data Institute "por su gran escala y apertura incorporada". [37]

En noviembre de 2018 , la información de Wikidata se utilizó en el 58,4% de todos los artículos de Wikipedia en inglés , principalmente para identificadores externos o ubicaciones de coordenadas. En conjunto, los datos de Wikidata se muestran en el 64% de todas las páginas de Wikipedias , el 93% de todos los artículos de Wikivoyage , el 34% de todos los Wikiquotes , el 32% de todos los Wikisources y el 27% de Wikimedia Commons. El uso en otros proyectos de la Fundación Wikimedia es testimonial. [38]

En diciembre de 2020 , los datos de Wikidata fueron visualizados por al menos otras 20 herramientas externas [39] y se han publicado más de 300 artículos sobre Wikidata. [40]

El conjunto de datos estructurados de Wikidata ha sido utilizado por asistentes virtuales como Siri de Apple y Amazon Alexa . [41]

Aplicaciones [ editar ]

  • La extensión Mwnci puede importar datos de Wikidata a hojas de cálculo de LibreOffice Calc [42]
  • Hay (en octubre de 2019) discusiones sobre el uso de elementos QID en relación con lo que se llama emoji QID [43]
  • Wiki Explorer - Aplicación de Android para descubrir cosas a tu alrededor y microedición de Wikidata [44]
  • Itinerario de KDE: un asistente de viaje de código abierto consciente de la privacidad que utiliza datos de Wikidata [45]

Ver también [ editar ]

  • Wikipedia abstracta
  • BabelNet
  • DBpedia
  • Freebase
  • Semántica MediaWiki
  • SPARQL

Referencias [ editar ]

  1. ^ https://blog.wikimedia.org/2013/04/25/the-wikidata-revolution/ ; consultado: 14 de noviembre de 2018; cita: Desde que Wikidata.org se puso en marcha el 30 de octubre de 2012.
  2. ^ a b Wikidata ( Archivado el 30 de octubre de 2012 en WebCite )
  3. ^ "Revolución de datos para Wikipedia" . Wikimedia Deutschland. 30 de marzo de 2012. Archivado desde el original el 11 de septiembre de 2012 . Consultado el 11 de septiembre de 2012 .
  4. ^ "Wikibase - Inicio" .
  5. ^ "Ayuda: declaraciones" .
  6. ^ "Ayuda: tipo de datos" .
  7. Vrandečić, Denny; Krötzsch, Markus (octubre de 2014). "Wikidata: una base de conocimiento colaborativa gratuita" . Comunicaciones de la ACM . 57 (10): 78–85. doi : 10.1145 / 2629489 . ISSN 0001-0782 . Wikidata Q18507561 .  
  8. ^ Turki, Houcemeddine; Shafee, Thomas; Hadj Taieb, Mohamed Ali; Ben Aouicha, Mohamed; Vrandečić, Denny; Das, Diptanshu; Hamdi, Helmi (23 de septiembre de 2019). "Wikidata: una base de datos médica ontológica colaborativa a gran escala" . Revista de Informática Biomédica . 99 : 103292. doi : 10.1016 / J.JBI.2019.103292 . ISSN 1532-0464 . PMID 31557529 . S2CID 203568040 . Wikidata Q68471881 .    
  9. ^ "Wikidata: informes de base de datos / Lista de propiedades / Top100" . Consultado el 26 de marzo de 2021 . CS1 maint: discouraged parameter (link)
  10. ^ "Ayuda: portal de restricciones de propiedad" .
  11. ^ "Ayuda: Fuentes" .
  12. ^ "Wikidata - documentación de datos lexicográficos" .
  13. ^ Dickinson, Boonsri (30 de marzo de 2012). "Paul Allen invierte en un proyecto masivo para mejorar Wikipedia" . Business Insider . Consultado el 11 de septiembre de 2012 .
  14. ^ Pérez, Sarah (30 de marzo de 2012). "Próxima gran cosa de Wikipedia: Wikidata, una base de datos editable por el usuario, legible por máquina financiada por Google, Paul Allen y otros" . TechCrunch . Archivado desde el original el 11 de septiembre de 2012 . Consultado el 11 de septiembre de 2012 .
  15. ^ "Wikidata - Meta" .
  16. ^ Pintscher, Lydia (30 de octubre de 2012). "wikidata.org está disponible (con algunas salvedades)" . wikidata-l (lista de correo) . Consultado el 3 de noviembre de 2012 .
  17. ^ Roth, Matthew (30 de marzo de 2012). "La revolución de los datos de Wikipedia" . Fundación Wikimedia. Archivado desde el original el 11 de septiembre de 2012 . Consultado el 11 de septiembre de 2012 .
  18. ^ Leitch, Thomas (1 de noviembre de 2014). Wikipedia U: conocimiento, autoridad y educación liberal en la era digital . Prensa de la Universidad Johns Hopkins . pag. 120 . ISBN 978-1-4214-1550-5.
  19. ^ Pintscher, Lydia (14 de enero de 2013). "Primeros pasos de Wikidata en la Wikipedia húngara" . Wikimedia Deutschland . Consultado el 17 de diciembre de 2015 .
  20. ^ Pintscher, Lydia (30 de enero de 2013). "Wikidata viene a las próximas dos Wikipedias" . Wikimedia Deutschland . Consultado el 31 de enero de 2013 .
  21. ^ Pintscher, Lydia (13 de febrero de 2013). "Wikidata en vivo en la Wikipedia en inglés" . Wikimedia Deutschland . Consultado el 15 de febrero de 2013 .
  22. ^ Pintscher, Lydia (6 de marzo de 2013). "Wikidata ahora está disponible en todas las Wikipedias" . Wikimedia Deutschland . Consultado el 8 de marzo de 2013 .
  23. ^ "Wikidata ist für alle Wikipedien da" (en alemán). Golem.de . Consultado el 29 de enero de 2014 .
  24. ^ "Charla de Wikipedia: Wikidata interwiki RFC" . 29 de marzo de 2013 . Consultado el 30 de marzo de 2013 .
  25. ^ Pintscher, Lydia (23 de septiembre de 2013). "¡Wikidata está aquí!" . Comunes: bomba de pueblo .
  26. ^ Pintscher, Lydia. "Wikidata / Actualizaciones de estado / 2013 03 01" . Wikimedia Meta-Wiki . Fundación Wikimedia . Consultado el 3 de marzo de 2013 .
  27. ^ Pintscher, Lydia (27 de marzo de 2013). "¡Puedes tener todos los datos!" . Wikimedia Deutschland . Consultado el 28 de marzo de 2013 .
  28. ^ "Wikidata se lanza en todo el mundo" . The H. 25 de abril de 2013. Archivado desde el original el 1 de enero de 2014.
  29. ^ Lydia, Pintscher (16 de septiembre de 2015). "Wikidata: el acceso a los datos de elementos arbitrarios está aquí" . Wikipedia: Bomba de pueblo (técnica) . Consultado el 30 de agosto de 2016 .
  30. ^ Lydia, Pintscher (27 de abril de 2016). "Soporte de Wikidata: el acceso arbitrario está aquí" . Comunes: bomba de pueblo . Consultado el 30 de agosto de 2016 .
  31. ^ Waagmeester, Andra; Estúpido, Gregory; Burgstaller-Muehlbacher, Sebastián; et al. (17 de marzo de 2020). "Wikidata como gráfico de conocimiento para las ciencias de la vida" . eLife . 9 . doi : 10.7554 / ELIFE.52614 . ISSN 2050-084X . PMC 7077981 . PMID 32180547 . Wikidata Q87830400 .    
  32. ^ https://query.wikidata.org/
  33. ^ "Anuncio del lanzamiento del servicio de consultas de Wikidata" .
  34. ^ "Herramientas de datos de consulta de Wikidata" .
  35. ^ commons: File talk: Wikidata-logo-en.svg # Hybrid . Consultado el 6 de octubre de 2016.
  36. ^ https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/
  37. ^ "Primeros premios de datos abiertos ODI presentados por los señores Tim Berners-Lee y Nigel Shadbolt" . Archivado desde el original el 24 de marzo de 2016.
  38. ^ "Porcentaje de artículos que utilizan datos de Wikidata" .
  39. ^ "Herramientas de Wikidata - Visualizar datos" .
  40. ^ "Escolia - Wikidata" .
  41. ^ Simonite, Tom (18 de febrero de 2019). "Dentro del mundo de Wikidata compatible con Alexa" . Cableado . ISSN 1059-1028 . Consultado el 25 de diciembre de 2020 . 
  42. ^ Rob Barry / Mwnci - Hojas de cálculo profundas · GitLab
  43. ^ "Problemas de revisión pública" .
  44. ^ Wiki Explorer en Google Play Store
  45. ^ Krause, Volker, KDE Itinerary - A privacy by design travel assistant , consultado el 10 de noviembre de 2020

Lectura adicional [ editar ]

  • Mark Graham (6 de abril de 2012), "The Problem With Wikidata" , The Atlantic , EE. UU.
  • Claudia Müller-Birn, Benjamin Karran, Janette Lehmann, Markus Luczak-Rösch: Sistema de producción entre pares o esfuerzo de desarrollo de ontología colaborativa: ¿Qué es Wikidata? En, OpenSym 2015 - Conferencia sobre colaboración abierta, San Francisco, EE. UU., 19-21 de agosto de 2015 (preimpresión).

Enlaces externos [ editar ]

  • Sitio web oficial ( móvil )
  • Vídeos: WikidataCon en media.ccc.de