De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
Ejemplo de una trama de violín
Ejemplo de una trama de violín en una publicación científica en PLOS Pathogens .

Un diagrama de violín es un método para trazar datos numéricos. Es similar a un diagrama de caja , con la adición de un diagrama de densidad de grano rotado en cada lado. [1]

Los diagramas de violín son similares a los diagramas de caja , excepto que también muestran la densidad de probabilidad de los datos en diferentes valores, generalmente suavizados por un estimador de densidad de granos . Normalmente, un diagrama de violín incluirá todos los datos que están en un diagrama de caja: un marcador para la mediana de los datos; un recuadro o marcador que indique el rango intercuartílico; y posiblemente todos los puntos de muestra, si el número de muestras no es demasiado alto.

Recientemente se demostró que el diagrama de violín llamado diagrama de densidad espejada (diagrama MD) supera a los diagramas de violín convencionales en términos de identificación de estructuras interesantes en datos en los lenguajes de programación de R y Python. [2] Los gráficos de violín están disponibles como extensiones para varios paquetes de software como DataVisualization en CRAN [3] y el paquete md-plot en PyPI. [4]

Un diagrama de violín es más informativo que un diagrama de caja simple. Mientras que un diagrama de caja solo muestra estadísticas resumidas como la media / mediana y los rangos intercuartílicos, el diagrama de violín muestra la distribución completa de los datos. La diferencia es particularmente útil cuando la distribución de datos es multimodal (más de un pico). En este caso, un diagrama de violín muestra la presencia de diferentes picos, su posición y amplitud relativa.

Al igual que los diagramas de caja, los diagramas de violín se utilizan para representar la comparación de una distribución variable (o distribución de la muestra) en diferentes "categorías" (por ejemplo, la distribución de la temperatura en comparación con el día y la noche, o la distribución de los precios de los automóviles en comparación con diferentes fabricantes de automóviles).

Una trama de violín puede tener varias capas. Por ejemplo, la forma exterior representa todos los resultados posibles. La siguiente capa en el interior podría representar los valores que ocurren el 95% del tiempo. La siguiente capa (si existe) dentro podría representar los valores que ocurren el 50% del tiempo.

Aunque son más informativos que los diagramas de caja, son menos populares. Debido a su impopularidad, su significado puede ser más difícil de comprender para muchos lectores que no están familiarizados con la representación de la trama del violín. En este caso, una alternativa más accesible puede ser trazar una serie de histogramas apilados o distribuciones de densidad de kernel .

Los gráficos de violín están disponibles como extensiones para varios paquetes de software, incluidos los paquetes R vioplot, wvioplot, caroline, UsingR, lattice y ggplot2 , el comando complementario de Stata vioplot, [5] y las bibliotecas de Python matplotlib , [6] Plotly , [7] ROOT [8] y Seaborn , [9] un tipo de gráfico en Origin , [10] IGOR Pro , [11] Paquete de trazado estadístico de Julia StatsPlots.jl [12] y DistributionChart enMathematica .

Referencias [ editar ]

  1. ^ "Trama de violín" . NIST DataPlot . Instituto Nacional de Estándares y Tecnología. 2015-10-13.
  2. ^ Thrun, Michael C .; Gehlert, Tino; Ultsch, Alfred (14 de octubre de 2020). Vafaee, Fatemeh (ed.). "Analizando la fina estructura de distribuciones" . PLOS ONE . 15 (10): e0238835. doi : 10.1371 / journal.pone.0238835 . ISSN 1932-6203 . 
  3. ^ "CRAN - Visualización de datos del paquete" .
  4. ^ "md-plot. PyPI" .
  5. ^ Hintze, Jerry L .; Nelson, Ray D. (1998). "Tramas de violín: un sinergismo de traza de densidad de diagrama de caja" . El estadístico estadounidense . 52 (2): 181–4. doi : 10.1080 / 00031305.1998.10480559 .
  6. ^ "parcelas de violín" . Novedades de matplotlib .
  7. ^ "Tramas de violín en Python" . Plotly Python API Library Reference .
  8. ^ "La opción de violín" . Consultado el 5 de mayo de 2020 .
  9. ^ Waskom, Michael. "Violinplot de un conjunto de datos de formato amplio" . Seaborn: visualización de datos estadísticos .
  10. ^ "Trama de violín en origen 2019" . Consultado el 29 de octubre de 2018 .
  11. ^ "Aspectos destacados de Igor Pro 8" . Wavemetrics . Consultado el 28 de julio de 2019 .
  12. ^ "diagrama de caja, diagrama de puntos y violín" . Consultado el 15 de agosto de 2020 .

Enlaces externos [ editar ]

  • Complemento Vioplot para Stata
  • Violinplot de un conjunto de datos de formato amplio con la biblioteca de visualización estadística seaborn basada en matplotlib

 Este artículo incorpora  material de dominio público del documento del Instituto Nacional de Estándares y Tecnología : "Manual de referencia del diagrama de datos: diagrama del violín" .