Un gráfico de puntos o diagrama de puntos es un gráfico estadístico que consta de puntos de datos trazados en una escala bastante simple, que generalmente usa círculos rellenos. Hay dos versiones comunes, pero muy diferentes, del gráfico de puntos. El primero se ha utilizado en gráficos dibujados a mano (antes de la era de la computadora) para representar distribuciones que se remontan a 1884. [1] La otra versión es descrita por William S. Cleveland como una alternativa al gráfico de barras, en el que se utilizan puntos. para representar los valores cuantitativos (por ejemplo, recuentos) asociados con las variables categóricas. [2]
Gráficos de puntos
El diagrama de puntos como representación de una distribución consiste en un grupo de puntos de datos trazados en una escala simple. Los gráficos de puntos se utilizan para datos continuos , cuantitativos y univariados . Los puntos de datos se pueden etiquetar si hay pocos.
Los gráficos de puntos son uno de los gráficos estadísticos más simples y son adecuados para conjuntos de datos de tamaño pequeño a moderado. Son útiles para resaltar agrupaciones y brechas, así como valores atípicos . Su otra ventaja es la conservación de información numérica. Cuando se trabaja con conjuntos de datos más grandes (alrededor de 20-30 o más puntos de datos), el diagrama de raíz , el diagrama de caja o el histograma relacionados pueden ser más eficientes, ya que los diagramas de puntos pueden volverse demasiado desordenados después de este punto. Los gráficos de puntos se pueden distinguir de los histogramas en que los puntos no están espaciados uniformemente a lo largo del eje horizontal.
Aunque la trama parece simple, su cálculo y la teoría estadística subyacente no lo son. El algoritmo para calcular un diagrama de puntos está estrechamente relacionado con la estimación de la densidad del kernel . El tamaño elegido para los puntos afecta la apariencia del gráfico. La elección del tamaño de los puntos equivale a la elección del ancho de banda para una estimación de la densidad del núcleo.
En el lenguaje de programación R , este tipo de gráfico también se conoce como gráfico de tira [3] o gráfico de tira . [4]
Gráficos de puntos de Cleveland
El diagrama de puntos también puede referirse a diagramas de puntos que pertenecen a una de varias categorías. Son una alternativa a los gráficos de barras o los gráficos circulares, y se parecen a un gráfico de barras horizontales en el que las barras se reemplazan por puntos en los valores asociados con cada categoría. En comparación con los gráficos de barras (verticales) y los gráficos circulares, Cleveland sostiene que los gráficos de puntos permiten una interpretación más precisa del gráfico por parte de los lectores al hacer que las etiquetas sean más fáciles de leer, reducir la tinta sin datos (o el desorden de gráficos) y respaldar la búsqueda de tablas.
Referencias
- ^ Wilkinson, Leland (1999). "Gráficos de puntos". El estadístico estadounidense . Asociación Estadounidense de Estadística. 53 (3): 276–281. doi : 10.2307 / 2686111 . JSTOR 2686111 .
- ^ Cleveland, William S. (1993). Visualización de datos . Prensa Hobart. hdl : 2027 / mdp.39015026891187 . ISBN 0-9634884-0-6.
- ^ Peter Dalgaard . Introducción a la Estadística con R . Saltador. ISBN 0-387-95475-9.
- ^ Paul Murrell (2005). R Graphics . Chapman y Hall / CRC. ISBN 1-58488-486-X.
otras referencias
- Wild, C. y Seber, G. (2000) Encuentros casuales: un primer curso en análisis e inferencia de datos John Wiley and Sons. ISBN 0-471-32936-3