De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Distribución de ejemplo con asimetría no negativa (positiva). Estos datos provienen de experimentos sobre el crecimiento de pasto de trigo.

En teoría de la probabilidad y estadística , la asimetría es una medida de la asimetría de la distribución de probabilidad de una verdadera -valued variable aleatoria respecto a su media. El valor de asimetría puede ser positivo, cero, negativo o indefinido.

Para una distribución unimodal , el sesgo negativo comúnmente indica que la cola está en el lado izquierdo de la distribución y el sesgo positivo indica que la cola está a la derecha. En los casos en que una cola es larga pero la otra es gruesa, la asimetría no obedece a una regla simple. Por ejemplo, un valor cero significa que las colas a ambos lados de la media se equilibran en general; este es el caso de una distribución simétrica, pero también puede ser cierto para una distribución asimétrica donde una cola es larga y delgada y la otra es corta pero gruesa.

Introducción [ editar ]

Considere las dos distribuciones de la figura que se muestra a continuación. Dentro de cada gráfico, los valores en el lado derecho de la distribución disminuyen de manera diferente a los valores en el lado izquierdo. Estos lados ahusados ​​se denominan colas y proporcionan un medio visual para determinar cuál de los dos tipos de sesgo tiene una distribución:

  1. sesgo negativo : la cola izquierda es más larga; la masa de la distribución se concentra a la derecha de la figura. La distribución se dice que está a la izquierda-sesgada , a la izquierda de cola , o sesgado a la izquierda , a pesar del hecho de que la propia curva parece ser sesgada o se inclina a la derecha; left, en cambio, se refiere a la cola izquierda que se extrae y, a menudo, la media está sesgada hacia la izquierda de un centro típico de los datos. Una distribución sesgada hacia la izquierda suele aparecer como unacurva inclinada hacia la derecha . [1]
  2. sesgo positivo : la cola derecha es más larga; la masa de la distribución se concentra a la izquierda de la figura. La distribución se dice que es sesgada de derecha , derecha de cola , o sesgada a la derecha , a pesar del hecho de que la propia curva parece ser sesgada o inclinarse hacia la izquierda; derecho, en cambio, se refiere a la cola derecha que se extrae y, a menudo, la media está sesgada a la derecha de un centro típico de los datos. Una distribución sesgada a la derecha suele aparecer como unacurva inclinada a la izquierda . [1]

Diagramas de sesgo negativo y positivo (inglés) .svg

La asimetría en una serie de datos a veces puede observarse no solo gráficamente sino mediante una simple inspección de los valores. Por ejemplo, considere la secuencia numérica (49, 50, 51), cuyos valores se distribuyen uniformemente alrededor de un valor central de 50. Podemos transformar esta secuencia en una distribución sesgada negativamente agregando un valor muy por debajo de la media, que probablemente sea una valor atípico negativo , por ejemplo (40, 49, 50, 51). Por lo tanto, la media de la secuencia se convierte en 47,5 y la mediana es 49,5. Basado en la fórmula del sesgo no paramétrico , definido como el sesgo es negativo. De manera similar, podemos hacer que la secuencia esté sesgada positivamente agregando un valor muy por encima de la media, que probablemente sea un valor atípico positivo, por ejemplo (49, 50, 51, 60), donde la media es 52,5 y la mediana es 50,5.

Como se mencionó anteriormente, una distribución unimodal con valor cero de asimetría no implica que esta distribución sea necesariamente simétrica. Sin embargo, una distribución simétrica unimodal o multimodal siempre tiene una asimetría cero.

Ejemplo de distribución asimétrica con asimetría cero. Esta cifra sirve como contraejemplo de que la asimetría cero no implica necesariamente una distribución simétrica. (La asimetría se calculó mediante el coeficiente de asimetría de momentos de Pearson).

Relación de la media y la mediana [ editar ]

La asimetría no está directamente relacionada con la relación entre la media y la mediana: una distribución con asimetría negativa puede tener su media mayor o menor que la mediana, y lo mismo ocurre con la asimetría positiva. [2]

Una relación general de media y mediana bajo una distribución unimodal con sesgos diferentes

En la noción más antigua de sesgo no paramétrico , definido como dónde es la media , es la mediana y es la desviación estándar , el sesgo se define en términos de esta relación: sesgo no paramétrico positivo / derecho significa que la media es mayor que (a la derecha de) la mediana, mientras que el sesgo no paramétrico negativo / izquierdo significa que la media es menor que (a la izquierda) de la mediana. Sin embargo, la definición moderna de asimetría y la definición no paramétrica tradicional no siempre tienen el mismo signo: si bien están de acuerdo para algunas familias de distribuciones, difieren en algunos de los casos y combinarlas es engañoso.

Si la distribución es simétrica , entonces la media es igual a la mediana y la distribución tiene una asimetría cero. [3] Si la distribución es simétrica y unimodal , entonces la media = mediana = moda . Este es el caso de un lanzamiento de moneda o la serie 1, 2, 3, 4, ... Tenga en cuenta, sin embargo, que lo contrario no es cierto en general, es decir, una asimetría cero no implica que la media sea igual a la mediana.

Un artículo de una revista de 2005 señala: [2]

Muchos libros de texto enseñan una regla empírica que establece que la media está a la derecha de la mediana debajo de la inclinación derecha y a la izquierda de la mediana debajo de la inclinación izquierda. Esta regla falla con sorprendente frecuencia. Puede fallar en distribuciones multimodales o en distribuciones donde una cola es larga pero la otra pesada . Sin embargo, lo más común es que la regla falle en distribuciones discretas donde las áreas a la izquierda y a la derecha de la mediana no son iguales. Tales distribuciones no solo contradicen la relación de libro de texto entre media, mediana y sesgo, sino que también contradicen la interpretación de libro de texto de la mediana.

Distribución de residentes adultos en hogares de EE. UU.

Por ejemplo, en la distribución de los residentes adultos en los hogares de EE. UU., El sesgo es hacia la derecha. Sin embargo, dado que la mayoría de los casos es menor o igual que la moda, que también es la mediana, la media se encuentra en la cola izquierda más pesada. Como resultado, la regla de oro de que la media está a la derecha de la mediana bajo el sesgo a la derecha falló. [2]

Definición [ editar ]

Coeficiente de sesgo del momento de Pearson [ editar ]

La asimetría de una variable aleatoria X es el tercer momento estandarizado , definido como: [4] [5]

donde μ es la media, σ es la desviación estándar , E es el operador de la expectativa , μ 3 es el tercer momento central y κ t son los t -ésimos acumulados . A veces se lo conoce como coeficiente de asimetría de momento de Pearson , [5] o simplemente el coeficiente de asimetría de momento , [4] pero no debe confundirse con otras estadísticas de asimetría de Pearson (ver más abajo). La última igualdad expresa asimetría en términos de la relación del tercer acumulado κ 3a la potencia 1,5 del segundo acumulativo κ 2 . Esto es análogo a la definición de curtosis como el cuarto acumulante normalizado por el cuadrado del segundo acumulante. La asimetría también se denota a veces Skew [ X ].

Si σ es finito, μ también es finito y la asimetría se puede expresar en términos del momento no central E [ X 3 ] expandiendo la fórmula anterior,

Ejemplos [ editar ]

La asimetría puede ser infinita, como cuando

donde los terceros acumulados son infinitos, o como cuando

donde el tercer acumulante no está definido.

Entre los ejemplos de distribuciones con asimetría finita se incluyen los siguientes.

  • Una distribución normal y cualquier otra distribución simétrica con tercer momento finito tiene una asimetría de 0
  • Una distribución medio normal tiene un sesgo justo por debajo de 1
  • Una distribución exponencial tiene una asimetría de 2
  • Una distribución logarítmica normal puede tener una asimetría de cualquier valor positivo, según sus parámetros

Muestra de sesgo [ editar ]

Para una muestra de n valores, dos estimadores del método natural de momentos de la asimetría de la población son [6]

y

donde es la media de la muestra , s es la desviación estándar de la muestra , m 2 es el segundo momento central de la muestra (sesgada) y m 3 es el tercer momento central de la muestra. [6]

Otra definición común de la asimetría de la muestra es [6] [7]

donde es el estimador insesgado simétrico único del tercer acumulante y es el estimador insesgado simétrico del segundo acumulante (es decir, la varianza de la muestra ). Este coeficiente de momento estandarizado de Fisher-Pearson ajustado es la versión que se encuentra en Excel y en varios paquetes estadísticos, incluidos Minitab , SAS y SPSS . [8]

Bajo el supuesto de que la variable aleatoria subyacente se distribuye normalmente, se puede demostrar que todas las tres relaciones , y son imparciales y consistentes estimadores de la asimetría de la población , con , es decir, sus distribuciones convergen a una distribución normal con media 0 y varianza 6 ( Fisher, 1930). [6] Por tanto, la varianza de la asimetría de la muestra es aproximadamente para muestras suficientemente grandes. Más precisamente, en una muestra aleatoria de tamaño n de una distribución normal, [9] [10]

En muestras normales, tiene la varianza más pequeña de los tres estimadores, con [6]

Para distribuciones no normales , y son generalmente estimadores sesgados de la asimetría de la población ; sus valores esperados pueden incluso tener el signo opuesto al verdadero sesgo. Por ejemplo, una distribución mixta que consta de gaussianos muy delgados centrados en −99, 0.5 y 2 con pesos 0.01, 0.66 y 0.33 tiene una asimetría de aproximadamente −9.77, pero en una muestra de 3 tiene un valor esperado de aproximadamente 0.32, ya que, por lo general, las tres muestras se encuentran en la parte de la distribución con valor positivo, que está sesgada en sentido contrario.

Aplicaciones [ editar ]

La asimetría es una estadística descriptiva que se puede utilizar junto con el histograma y el gráfico de cuantiles normal para caracterizar los datos o la distribución.

La asimetría indica la dirección y la magnitud relativa de la desviación de una distribución de la distribución normal.

Con una asimetría pronunciada, los procedimientos de inferencia estadística estándar, como un intervalo de confianza para una media, no solo serán incorrectos, en el sentido de que el nivel de cobertura real diferirá del nivel nominal (por ejemplo, 95%), sino que también darán como resultado probabilidades de error en cada lado.

La asimetría se puede utilizar para obtener probabilidades aproximadas y cuantiles de distribuciones (como el valor en riesgo en las finanzas) a través de la expansión Cornish-Fisher .

Muchos modelos asumen una distribución normal; es decir, los datos son simétricos con respecto a la media. La distribución normal tiene una asimetría de cero. Pero, en realidad, los puntos de datos pueden no ser perfectamente simétricos. Entonces, una comprensión de la asimetría del conjunto de datos indica si las desviaciones de la media serán positivas o negativas.

La prueba K-cuadrado de D'Agostino es una prueba de normalidad de bondad de ajuste basada en la asimetría y la curtosis de la muestra.

Otras medidas de asimetría [ editar ]

Comparación de la media , la mediana y la moda de dos distribuciones logarítmicas normales con las mismas medianas y diferentes asimetrías.

Se han utilizado otras medidas de asimetría, incluidos los cálculos más sencillos sugeridos por Karl Pearson [11] (que no debe confundirse con el coeficiente de asimetría de momento de Pearson, véase más arriba). Estas otras medidas son:

Primer coeficiente de asimetría de Pearson (asimetría de modo) [ editar ]

La asimetría del modo de Pearson, [12] o primer coeficiente de asimetría, se define como

significa - modo/Desviación Estándar.

Segundo coeficiente de asimetría de Pearson (asimetría mediana) [ editar ]

La asimetría mediana de Pearson, o segundo coeficiente de asimetría, [13] [14] se define como

3 ( media - mediana )/Desviación Estándar.

Que es un múltiplo simple del sesgo no paramétrico .

Medidas basadas en cuantiles [ editar ]

La medida de asimetría de Bowley (de 1901), [15] [16] también llamada coeficiente de Yule (de 1912) [17] [18] se define como:

El numerador es la diferencia entre el promedio de los cuartiles superior e inferior (una medida de ubicación) y la mediana (otra medida de ubicación), mientras que el denominador es el rango semi-intercuartílico , que para distribuciones simétricas es la medida de dispersión MAD .

Otros nombres para esta medida son la medida de asimetría de Galton, [19] el índice de Yule-Kendall [20] y la asimetría de cuartiles, [21]

Groeneveld, RA y Meeden, G. (1984) describieron una formulación más general de una función de asimetría: [22] [23] [24]

donde F es la función de distribución acumulativa . Esto conduce a una medida global correspondiente de la asimetría [23] se define como el extremo superior de este en el rango de 1/2 ≤  U  <1. Otra medida se pueden obtener mediante la integración del numerador y el denominador de esta expresión. [22] La función γ ( u ) satisface −1 ≤  γ ( u ) ≤ 1 y está bien definida sin requerir la existencia de momentos de la distribución. [22]Las medidas de asimetría basadas en cuantiles son a primera vista fáciles de interpretar, pero a menudo muestran variaciones muestrales significativamente mayores que los métodos basados ​​en momentos. Esto significa que a menudo las muestras de una distribución simétrica (como la distribución uniforme) tienen una gran asimetría basada en cuantiles, solo por casualidad.

La medida de asimetría de Bowley es γ ( u ) evaluada en u  = 3/4. La medida de asimetría de Kelley usa u = 0.1. [25]

Coeficiente de Groeneveld y Meeden [ editar ]

Groeneveld y Meeden han sugerido, como una medida alternativa de asimetría, [22]

donde μ es la media, ν es la mediana, | ... | es el valor absoluto y E () es el operador de expectativa. Esto está estrechamente relacionado en forma con el segundo coeficiente de asimetría de Pearson .

Momentos L [ editar ]

El uso de momentos L en lugar de momentos proporciona una medida de sesgo conocida como sesgo L. [26]

Asimetría de distancia [ editar ]

Un valor de asimetría igual a cero no implica que la distribución de probabilidad sea simétrica. Por lo tanto, existe la necesidad de otra medida de asimetría que tenga esta propiedad: dicha medida se introdujo en 2000. [27] Se llama sesgo de distancia y se denota por dSkew. Si X es una variable aleatoria que toma valores en el espacio euclidiano d- dimensional, X tiene una expectativa finita, X ' es una copia independiente distribuida de forma idéntica de X , y denota la norma en el espacio euclidiano, entonces una medida simple de asimetría con respecto a el parámetro de ubicación θ es

y dSkew ( X ): = 0 para X  = θ (con probabilidad 1). La asimetría de la distancia siempre está entre 0 y 1, es igual a 0 si y solo si X es diagonalmente simétrica con respecto a θ ( X y 2θ− X tienen la misma distribución de probabilidad) y es igual a 1 si y solo si X es una constante c ( ) con probabilidad uno. [28] Por lo tanto, existe una prueba estadística consistente simple de simetría diagonal basada en la asimetría de la distancia muestral :

Medcouple [ editar ]

El par medio es una medida robusta de asimetría invariante en la escala, con un punto de ruptura del 25%. [29] Es la mediana de los valores de la función del núcleo.

tomado sobre todas las parejas de tal manera que , donde es la mediana de la muestra . Puede verse como la mediana de todas las posibles medidas de asimetría cuantílica.

Ver también [ editar ]

  • Pico de Bragg
  • Cosquilleo
  • Curtosis
  • Parámetros de forma
  • Distribución normal sesgada
  • Riesgo de sesgo

Referencias [ editar ]

Citas [ editar ]

  1. ^ a b Susan Dean, Barbara Illowsky "Estadísticas descriptivas: asimetría y la media, mediana y moda" , sitio web de Connexions
  2. ↑ a b c von Hippel, Paul T. (2005). "Media, mediana y sesgo: corregir una regla de libro de texto" . Revista de Educación en Estadística . 13 (2).
  3. ^ "1.3.5.11. Medidas de asimetría y curtosis" . NIST . Consultado el 18 de marzo de 2012 .
  4. ^ a b "Medidas de forma: sesgo y curtosis" , 2008-2016 por Stan Brown, Oak Road Systems
  5. ^ a b Coeficiente de sesgo del momento de Pearson , FXSolver.com
  6. ^ a b c d e Joanes, DN; Gill, CA (1998). "Comparación de medidas de asimetría y curtosis muestral". Revista de la Sociedad Real de Estadística, Serie D . 47 (1): 183–189. doi : 10.1111 / 1467-9884.00122 .
  7. ^ Doane, David P. y Lori E. Seward. "Medir la asimetría: una estadística olvidada". Revista de Educación en Estadística 19.2 (2011): 1-18. (Página 7)
  8. ^ Doane DP, Seward LE (2011) J Stat Educ 19 (2)
  9. ^ Duncan Cramer (1997) Estadísticas fundamentales para la investigación social. Routledge. ISBN 9780415172042 (p. 85) 
  10. ^ Kendall, MG; Stuart, A. (1969) La teoría avanzada de la estadística, Volumen 1: Teoría de la distribución, 3ª edición , Griffin. ISBN 0-85264-141-9 (Ex 12.9) 
  11. ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 5 de julio de 2010 . Consultado el 9 de abril de 2010 . CS1 maint: archived copy as title (link)
  12. ^ Weisstein, Eric W. "Asimetría del modo Pearson" . MathWorld .
  13. ^ Weisstein, Eric W. "Coeficientes de asimetría de Pearson" . MathWorld .
  14. ^ Doane, David P .; Seward, Lori E. (2011). "Medir la asimetría: ¿una estadística olvidada?" (PDF) . Revista de Educación en Estadística . 19 (2): 1–18. doi : 10.1080 / 10691898.2011.11889611 .
  15. ^ Bowley, AL (1901). Elementos de estadística, PS King & Son, Laondon. O en una edición posterior: BOWLEY, AL. "Elements of Statistics, 4th Edn (Nueva York, Charles Scribner)" (1920).
  16. ^ Kenney JF y Keeping ES (1962) Matemáticas de estadística, Pt. 1, 3ª ed. , Van Nostrand, (página 102).
  17. ^ Yule, George Udny. Introducción a la teoría de la estadística. C. Griffin, limitada, 1912.
  18. ^ Groeneveld, Richard A (1991). "Un enfoque de función de influencia para describir la asimetría de una distribución". El estadístico estadounidense . 45 (2): 97–102. doi : 10.2307 / 2684367 . JSTOR 2684367 . 
  19. ^ Johnson, NL, Kotz, S y Balakrishnan, N (1994) p. 3 y p. 40
  20. ^ Wilks DS (1995) Métodos estadísticos en las ciencias atmosféricas , p 27. Academic Press. ISBN 0-12-751965-3 
  21. ^ Weisstein, Eric W. "Asimetría" . mathworld.wolfram.com . Consultado el 21 de noviembre de 2019 .
  22. ^ a b c d Groeneveld, RA; Meeden, G. (1984). "Medir la asimetría y la curtosis". El estadístico . 33 (4): 391–399. doi : 10.2307 / 2987742 . JSTOR 2987742 . 
  23. ↑ a b MacGillivray (1992)
  24. ^ Hinkley DV (1975) "Sobre las transformaciones de poder a la simetría", Biometrika , 62, 101-111
  25. ^ AWL Pubudu Thilan. "Estadística aplicada I: Capítulo 5: Medidas de asimetría" (PDF) . Universidad de Ruhuna . pag. 21.
  26. ^ Hosking, JRM (1992). "¿Momentos o momentos L? Un ejemplo que compara dos medidas de forma distributiva". El estadístico estadounidense . 46 (3): 186–189. doi : 10.2307 / 2685210 . JSTOR 2685210 . 
  27. ^ Szekely, GJ (2000). "Teoremas previos y posteriores al límite para la estadística", En: Estadísticas para el siglo XXI (eds. CR Rao y GJ Szekely), Dekker, Nueva York, págs. 411–422.
  28. ^ Szekely, G. J. y Mori, T. F. (2001) "Una medida característica de asimetría y su aplicación para probar la simetría diagonal", Comunicaciones en estadística - Teoría y métodos 30/8 y 9, 1633-1639.
  29. ^ G. Brys; M. Hubert ; A. Struyf (noviembre de 2004). "Una medida sólida de asimetría". Revista de Estadística Computacional y Gráfica . 13 (4): 996–1017. doi : 10.1198 / 106186004X12632 .

Fuentes [ editar ]

  • Johnson, NL; Kotz, S; Balakrishnan, N (1994). Distribuciones univariadas continuas . 1 (2 ed.). Wiley. ISBN 0-471-58495-9.
  • MacGillivray, HL (1992). "Propiedades de forma de las familias g- y h- y Johnson". Comunicaciones en estadística: teoría y métodos . 21 (5): 1244-1250. doi : 10.1080 / 03610929208830842 .
  • Premaratne, G., Bera, AK (2001). Ajuste de las pruebas de asimetría y curtosis para errores de distribución. Documento de trabajo número 01-0116, Universidad de Illinois. Próximamente en Comm en Estadística, Simulación y Computación. 2016 1-15
  • Premaratne, G., Bera, AK (2000). Modelado de asimetría y exceso de curtosis en datos de rendimiento de acciones. Documento de trabajo de la Oficina de Investigación número 00-0123, Universidad de Illinois.
  • Medidas de sesgo para la distribución de Weibull

Enlaces externos [ editar ]

  • "Coeficiente de asimetría" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
  • Un coeficiente de asimetría para distribuciones multivariadas por Michel Petitjean
  • Sobre una estimación más sólida de la asimetría y la curtosis Comparación de estimadores de asimetría de Kim y White.
  • Distribuciones de sesgo cerrado: simulación, inversión y estimación de parámetros