Distribución de Hermite

En teoría y estadística de probabilidad , la distribución de Hermite , que lleva el nombre de Charles Hermite , es una distribución de probabilidad discreta que se utiliza para modelar datos de recuento con más de un parámetro. Esta distribución es flexible en términos de su capacidad para permitir una dispersión excesiva moderada en los datos.

Hermite
Función de probabilidad El eje horizontal es el índice k , el número de ocurrencias. La función solo se define en valores enteros de k . Las líneas de conexión son solo guías para el ojo.
Función de distribución acumulativa El eje horizontal es el índice k , el número de ocurrencias. La CDF es discontinua en los enteros de k y plana en todos los demás porque una variable que está distribuida por Hermite solo toma valores enteros.
Notación	${\ Displaystyle \ operatorname {Herm} (a_ {1}, a_ {2}) \,}$
Parámetros	a ₁ ≥ 0, a ₂ ≥ 0
Apoyo	x ∈ {0, 1, 2, ...}
PMF	${\ Displaystyle x \ mapsto e ^ {- (a_ {1} + a_ {2})} \ sum _ {j = 0} ^ {\ lfloor x / 2 \ rfloor} {\ frac {a_ {1} ^ { n-2j} a_ {2} ^ {j}} {(n-2j)! j!}}}$
CDF	${\ Displaystyle x \ mapsto e ^ {- a_ {1} + a_ {2}} \ sum _ {i = 0} ^ {\ lfloor x \ rfloor} \ sum _ {j = 0} ^ {\ lfloor i / 2 \ rfloor} {\ frac {a_ {1} ^ {i-2j} a_ {2} ^ {j}} {(i-2j)! J!}}}$
Significar	${\ Displaystyle a_ {1} + 2a_ {2}}$
Diferencia	${\ Displaystyle a_ {1} + 4a_ {2}}$
Oblicuidad	${\ Displaystyle {\ frac {a_ {1} + 8a_ {2}} {(a_ {1} + 4a_ {2}) ^ {3/2}}}}$
Ex. curtosis	${\ Displaystyle {\ frac {a_ {1} + 16a_ {2}} {(a_ {1} + 4a_ {2}) ^ {2}}}}$
MGF	${\ Displaystyle \ exp (a_ {1} (e ^ {t} -1) + a_ {2} (e ^ {2t} -1)) \,}$
CF	${\ Displaystyle \ exp (a_ {1} (e ^ {ti} -1) + a_ {2} (e ^ {2ti} -1)) \,}$
PGF	${\ Displaystyle \ exp (a_ {1} (s-1) + a_ {2} (s ^ {2} -1)) \,}$

Los autores Kemp y Kemp ^{[1] la} han llamado "distribución de Hermite" por el hecho de que su función de probabilidad y la función generadora de momentos pueden expresarse en términos de los coeficientes de polinomios de Hermite (modificados) .

Historia

La distribución apareció por primera vez en el artículo Applications of Mathematics to Medical Problems , ^[2] de Anderson Gray McKendrick en 1926. En este trabajo, el autor explica varios métodos matemáticos que se pueden aplicar a la investigación médica. En uno de estos métodos consideró la distribución de Poisson bivariada y demostró que la distribución de la suma de dos variables de Poisson correlacionadas sigue una distribución que luego se conocería como distribución de Hermite.

Como aplicación práctica, McKendrick consideró la distribución de recuentos de bacterias en leucocitos . Usando el método de momentos , ajustó los datos con la distribución de Hermite y encontró que el modelo era más satisfactorio que ajustarlo con una distribución de Poisson .

La distribución fue introducida y publicada formalmente por CD Kemp y Adrienne W. Kemp en 1965 en su trabajo Algunas propiedades de la distribución 'Hermite' . El trabajo se centra en las propiedades de esta distribución, por ejemplo, una condición necesaria sobre los parámetros y sus estimadores de máxima verosimilitud (MLE), el análisis de la función generadora de probabilidad (PGF) y cómo se puede expresar en términos de los coeficientes de modificado) polinomios de Hermite . Un ejemplo que han utilizado en esta publicación es la distribución de recuentos de bacterias en leucocitos que utilizaron McKendrick, pero Kemp y Kemp estiman el modelo utilizando el método de máxima verosimilitud .

La distribución de Hermite es un caso especial de distribución de Poisson compuesta discreta con solo dos parámetros. ^[3]^[4]

Los mismos autores publicaron en 1966 el artículo Una derivación alternativa de la distribución de Hermite . ^[5] En este trabajo se estableció que la distribución de Hermite se puede obtener formalmente combinando una distribución de Poisson con una distribución normal .

En 1971, YC Patel ^[6] realizó un estudio comparativo de varios procedimientos de estimación para la distribución de Hermite en su tesis doctoral. Incluyó estimadores de máxima verosimilitud, momentos, estimadores de frecuencia media y cero y el método de los puntos pares.

En 1974, Gupta y Jain ^[7] hicieron una investigación sobre una forma generalizada de distribución de Hermite.

Definición

Función de probabilidad

Sean X ₁ y X ₂ dos variables de Poisson independientes con parámetros a ₁ y a ₂ . La distribución de probabilidad de la variable aleatoria Y = X ₁ + 2 X ₂ es la distribución de Hermite con los parámetros a ₁ y a ₂ y la función de masa de probabilidad viene dada por ^[8]

{\ Displaystyle p_ {n} = P (Y = n) = e ^ {- (a_ {1} + a_ {2})} \ sum _ {j = 0} ^ {\ lfloor n / 2 \ rfloor} { \ frac {a_ {1} ^ {n-2j} a_ {2} ^ {j}} {(n-2j)! j!}}}

dónde

n = 0, 1, 2, ...
a ₁ , a ₂ ≥ 0.
( n - 2 j )! y j ! son los factoriales de ( n - 2 j ) y j , respectivamente.
${\ textstyle \ lfloor n / 2 \ rfloor}$ es la parte entera de n / 2.

La función generadora de probabilidad de la masa de probabilidad es, ^[8]

{\ Displaystyle G_ {Y} (s) = \ sum _ {n = 0} ^ {\ infty} p_ {n} s ^ {n} = \ exp (a_ {1} (s-1) + a_ {2 } (s ^ {2} -1))}

Notación

Cuando una variable aleatoria Y = X ₁ + 2 X ₂ se distribuye mediante una distribución de Hermite, donde X ₁ y X ₂ son dos variables de Poisson independientes con parámetros a ₁ y a ₂ , escribimos

{\ Displaystyle Y \ \ sim \ operatorname {Herm} (a_ {1}, a_ {2}) \,}

Propiedades

Funciones generadoras de momentos y acumulados

La función generadora de momentos de una variable aleatoria X se define como el valor esperado de e ^t , en función del parámetro real t . Para una distribución de Hermite con parámetros X ₁ y X ₂ , la función generadora de momento existe y es igual a

{\ Displaystyle M (t) = G (e ^ {t}) = \ exp (a_ {1} (e ^ {t} -1) + a_ {2} (e ^ {2t} -1))}

La función generadora acumulada es el logaritmo de la función generadora de momentos y es igual a ^[4]

{\ Displaystyle K (t) = \ log (M (t)) = a_ {1} (e ^ {t} -1) + a_ {2} (e ^ {2t} -1)}

Si consideramos el coeficiente de ( it ) ^r r ! en la expansión de K ( t ) obtenemos el r -cumulante

{\ Displaystyle k_ {n} = a_ {1} + 2 ^ {n} a_ {2}}

Por lo tanto, la media y los tres momentos siguientes son

Pedido	Momento	Acumulante
1	${\ Displaystyle \ mu _ {1} = k_ {1} = a_ {1} + 2a_ {2}}$	${\ Displaystyle \ mu}$
2	${\ Displaystyle \ mu _ {2} = k_ {2} = a_ {1} + 4a_ {2}}$	${\ Displaystyle \ sigma ^ {2}}$
3	${\ Displaystyle \ mu _ {3} = k_ {3} = a_ {1} + 8a_ {2}}$	${\ Displaystyle k_ {3}}$
4	${\ Displaystyle \ mu _ {4} = k_ {4} + 3k_ {2} ^ {2} = a_ {1} + 16a_ {2} +3 (a_ {1} + 4a_ {2}) ^ {2} }$	${\ Displaystyle k_ {4}}$

Oblicuidad

La asimetría es el tercer momento centrado alrededor de la media dividida por la potencia 3/2 de la desviación estándar , y para la distribución de hermita es, ^[4]

{\ Displaystyle \ gamma _ {1} = {\ frac {\ mu _ {3}} {\ mu _ {2} ^ {3/2}}} = {\ frac {a_ {1} + 8a_ {2} } {(a_ {1} + 4a_ {2}) ^ {3/2}}}}

Siempre ${\ Displaystyle \ gamma _ {1}> 0}$ , por lo que la masa de la distribución se concentra a la izquierda.

Curtosis

La curtosis es el cuarto momento centrado alrededor de la media, dividido por el cuadrado de la varianza , y para la distribución de Hermite es, ^[4]

{\ Displaystyle \ beta _ {2} = {\ frac {\ mu _ {4}} {\ mu _ {2} ^ {2}}} = {\ frac {a_ {1} + 16a_ {2} +3 (a_ {1} + 4a_ {2}) ^ {2}} {(a_ {1} + 4a_ {2}) ^ {2}}} = {\ frac {a_ {1} + 16a_ {2}} { (a_ {1} + 4a_ {2}) ^ {2}}} + 3}

El exceso de curtosis es solo una corrección para hacer que la curtosis de la distribución normal sea igual a cero, y es la siguiente,

{\ Displaystyle \ gamma _ {2} = {\ frac {\ mu _ {4}} {\ mu _ {2} ^ {2}}} - 3 = {\ frac {a_ {1} + 16a_ {2} } {(a_ {1} + 4a_ {2}) ^ {2}}}}

Siempre ${\ Displaystyle \ beta _ {2}> 3}$ , o ${\ Displaystyle \ gamma _ {2}> 0}$ la distribución tiene un pico agudo alto alrededor de las colas media y más gruesa.

Función característica

En una distribución discreta, la función característica de cualquier variable aleatoria de valor real se define como el valor esperado de ${\ Displaystyle e ^ {itX}}$ , donde i es la unidad imaginaria y t ∈ R

{\ Displaystyle \ phi (t) = E [e ^ {itX}] = \ sum _ {j = 0} ^ {\ infty} e ^ {ijt} P [X = j]}

Esta función está relacionada con la función generadora de momentos a través de ${\ Displaystyle \ phi _ {x} (t) = M_ {X} (it)}$ . Por tanto, para esta distribución, la función característica es, ^[1]

{\ Displaystyle \ phi _ {x} (t) = \ exp (a_ {1} (e ^ {it} -1) + a_ {2} (e ^ {2it} -1))}

Función de distribución acumulativa

La función de distribución acumulativa es, ^[1]

{\ Displaystyle {\ begin {alineado} F (x; a_ {1}, a_ {2}) & = P (X \ leq x) \\ & = \ exp (- (a_ {1} + a_ {2}) )) \ sum _ {i = 0} ^ {\ lfloor x \ rfloor} \ sum _ {j = 0} ^ {[i / 2]} {\ frac {a_ {1} ^ {i-2j} a_ { 2} ^ {j}} {(i-2j)! J!}} \ End {alineado}}}

Otras propiedades

Esta distribución puede tener cualquier número de modos . Como ejemplo, la distribución ajustada para los datos de McKendrick ^[2] tiene unos parámetros estimados de ${\ Displaystyle {\ hat {a}} _ {1} = 0.0135}$ , ${\ Displaystyle {\ hat {a}} _ {2} = 0.0932}$ . Por lo tanto, las primeras cinco probabilidades estimadas son 0.899, 0.012, 0.084, 0.001, 0.004.

Ejemplo de datos multimodales, distribución de Hermite (0,1,1,5).

Esta distribución está cerrada bajo adición o cerrada bajo convoluciones. ^[9] Al igual que la distribución de Poisson , la distribución de Hermite tiene esta propiedad. Dadas dos variables aleatorias distribuidas por Hermite ${\ Displaystyle X_ {1} \ sim \ operatorname {Herm} (a_ {1}, a_ {2})}$ y ${\ Displaystyle X_ {2} \ sim \ operatorname {Herm} (b_ {1}, b_ {2})}$ , entonces Y = X ₁ + X ₂ sigue una distribución de Hermite, ${\ Displaystyle Y \ sim \ operatorname {Herm} (a_ {1} + b_ {1}, a_ {2} + b_ {2})}$ .
Esta distribución permite una sobredispersión moderada , por lo que se puede utilizar cuando los datos tienen esta propiedad. ^[9] Una variable aleatoria tiene sobredispersión, o está sobredispersada con respecto a la distribución de Poisson, cuando su varianza es mayor que su valor esperado. La distribución de Hermite permite una sobredispersión moderada porque el coeficiente de dispersión siempre está entre 1 y 2,

{\ Displaystyle d = {\ frac {\ operatorname {Var} (Y)} {\ operatorname {E} (Y)}} = {\ frac {a_ {1} + 4a_ {2}} {a_ {1} + 2a_ {2}}} = 1 + {\ frac {2a_ {2}} {a_ {1} + 2a_ {2}}}}

Estimación de parámetros

Método de momentos

La media y la varianza de la distribución de Hermite son ${\ Displaystyle \ mu = a_ {1} + 2a_ {2}}$ y ${\ Displaystyle \ sigma ^ {2} = a_ {1} + 4a_ {2}}$ , respectivamente. Entonces tenemos estas dos ecuaciones,

{\ displaystyle {\ begin {cases} {\ bar {x}} = a_ {1} + 2a_ {2} \\\ sigma ^ {2} = a_ {1} + 4a_ {2} \ end {cases}} }

Resolviendo estas dos ecuaciones obtenemos los estimadores de momento ${\ Displaystyle {\ hat {a_ {1}}}}$ y ${\ Displaystyle {\ hat {a_ {2}}}}$ de un ₁ y un ₂ . ^[6]

{\ Displaystyle {\ hat {a_ {1}}} = 2 {\ bar {x}} - \ sigma ^ {2}}

{\ Displaystyle {\ hat {a_ {2}}} = {\ frac {\ sigma ^ {2} - {\ hat {x}}} {2}}}

Dado que tanto un ₁ como un ₂ son positivos, el estimador ${\ Displaystyle {\ hat {a_ {1}}}}$ y ${\ Displaystyle {\ hat {a_ {2}}}}$ son admisibles (≥ 0) solo si, ${\ displaystyle {\ bar {x}} <\ sigma ^ {2} <2 {\ bar {x}}}$ .

Máxima verosimilitud

Dada una muestra X ₁ , ..., X _m son variables aleatorias independientes, cada una con una distribución de Hermite, deseamos estimar el valor de los parámetros ${\ Displaystyle {\ hat {a_ {1}}}}$ y ${\ Displaystyle {\ hat {a_ {2}}}}$ . Sabemos que la media y la varianza de la distribución son ${\ Displaystyle \ mu = a_ {1} + 2a_ {2}}$ y ${\ Displaystyle \ sigma ^ {2} = a_ {1} + 4a_ {2}}$ , respectivamente. Usando estas dos ecuaciones,

{\ Displaystyle {\ begin {cases} a_ {1} = \ mu (2-d) \\ [4pt] a_ {2} = {\ dfrac {\ mu (d-1)} {2}} \ end { casos}}}

Podemos parametrizar la función de probabilidad por μ y d

{\ Displaystyle P (X = x) = \ exp \ left (- \ left (\ mu (2-d) + {\ frac {\ mu (d-1)} {2}} \ right) \ right) \ suma _ {j = 0} ^ {[x / 2]} {\ frac {(\ mu (2-d)) ^ {x-2j} \ left ({\ frac {\ mu (d-1)} { 2}} \ right) ^ {j}} {(x-2j)! J!}}}

Por lo tanto, la función logarítmica de verosimilitud es, ^[9]

{\ Displaystyle {\ begin {alineado} {\ mathcal {L}} (x_ {1}, \ ldots, x_ {m}; \ mu, d) & = \ log ({\ mathcal {L}} (x_ { 1}, \ ldots, x_ {m}; \ mu, d)) \\ & = m \ mu \ left (-1 + {\ frac {d-1} {2}} \ right) + \ log (\ mu (2-d)) \ sum _ {i = 1} ^ {m} x_ {i} + \ sum _ {i = 1} ^ {m} \ log (q_ {i} (\ theta)) \ end {alineado}}}

dónde

${\ Displaystyle q_ {i} (\ theta) = \ sum _ {j = 0} ^ {[x_ {i} / 2]} {\ frac {\ theta ^ {j}} {(x_ {i} -2j )! j!}}}$
${\ Displaystyle \ theta = {\ frac {d-1} {2 \ mu (2-d) ^ {2}}}}$

De la función logarítmica de verosimilitud, las ecuaciones de verosimilitud son, ^[9]

{\ Displaystyle {\ frac {\ parcial l} {\ parcial \ mu}} = m \ izquierda (-1 + {\ frac {d-1} {2}} \ derecha) + {\ frac {1} {\ mu}} \ sum _ {i = 1} ^ {m} x_ {i} - {\ frac {d-1} {2 \ mu ^ {2} (2-d) ^ {2}}} \ sum _ {i = 1} ^ {m} {\ frac {q_ {i} ^ {'} (\ theta)} {q_ {i} (\ theta)}}}

{\ Displaystyle {\ frac {\ l parcial} {\ d parcial}} = m {\ frac {\ mu} {2}} - {\ frac {\ sum _ {i = 1} ^ {m} x_ {i }} {2-d}} - {\ frac {d} {2 \ mu (2-d) ^ {3}}} \ sum _ {i = 1} ^ {m} \ sum _ {i = 1} ^ {m} {\ frac {q_ {i} ^ {'} (\ theta)} {q_ {i} (\ theta)}}}

Los cálculos sencillos muestran que, ^[9]

${\ Displaystyle \ mu = {\ bar {x}}}$
Y d se puede encontrar resolviendo,

{\ Displaystyle \ sum _ {i = 1} ^ {m} {\ frac {q_ {i} ^ {'} ({\ tilde {\ theta}})} {q_ {i} ({\ tilde {\ theta }})}} = m ({\ bar {x}} (2-d)) ^ {2}}

dónde ${\ displaystyle {\ tilde {\ theta}} = {\ frac {d-1} {2 {\ bar {x}} (2-d) ^ {2}}}}$

Se puede demostrar que la función logarítmica de verosimilitud es estrictamente cóncava en el dominio de los parámetros. En consecuencia, el MLE es único.

La ecuación de verosimilitud no siempre tiene una solución como la que muestra la siguiente proposición,

Proposición: ^[9] Sea X ₁ , ..., X _m procedente de una distribución de Hermite generalizada con n fijo . Entonces los MLE de los parámetros son ${\ Displaystyle {\ hat {\ mu}}}$ y ${\ Displaystyle {\ tilde {d}}}$ si solo si ${\ displaystyle m ^ {(2)} / {\ bar {x}} ^ {2}> 1}$ , dónde ${\ Displaystyle m ^ {(2)} = \ sum _ {i = 1} ^ {n} x_ {i} (x_ {i} -1) / n}$ indica el momento factorial empírico de orden 2.

Observación 1: La condición ${\ displaystyle m ^ {(2)} / {\ bar {x}} ^ {2}> 1}$ es equivalente a ${\ displaystyle {\ tilde {d}}> 1}$ dónde ${\ Displaystyle {\ tilde {d}} = \ sigma ^ {2} / {\ bar {x}}}$ es el índice de dispersión empírico
Observación 2: Si no se cumple la condición, entonces los MLE de los parámetros son ${\ displaystyle {\ hat {\ mu}} = {\ bar {x}}}$ y ${\ Displaystyle {\ tilde {d}} = 1}$ , es decir, los datos se ajustan utilizando la distribución de Poisson.

Frecuencia cero y estimadores medios

Una opción habitual para distribuciones discretas es la frecuencia relativa cero del conjunto de datos que se equipara a la probabilidad de cero bajo la distribución supuesta. Observando eso ${\ Displaystyle f_ {0} = \ exp (- (a_ {1} + a_ {2}))}$ y ${\ Displaystyle \ mu = a_ {1} + 2a_ {2}}$ . Siguiendo el ejemplo de YC Patel (1976) el sistema de ecuaciones resultante,

{\ Displaystyle {\ begin {cases} {\ bar {x}} = a_ {1} + 2a_ {2} \\ f_ {0} = \ exp (- (a_ {1} + a_ {2})) \ finalizar {casos}}}

Obtenemos la frecuencia cero y el estimador medio a ₁ de ${\ Displaystyle {\ hat {a_ {1}}}}$ y un ₂ de ${\ Displaystyle {\ hat {a_ {2}}}}$ , ^[6]

{\ Displaystyle {\ hat {a_ {1}}} = - ({\ bar {x}} + 2 \ log (f_ {0}))}

{\ displaystyle {\ hat {a_ {2}}} = {\ bar {x}} + \ log (f_ {0})}

dónde ${\ Displaystyle f_ {0} = {\ frac {n_ {0}} {n}}}$ , es la frecuencia relativa cero, n > 0

Se puede ver que para distribuciones con alta probabilidad en 0, la eficiencia es alta.

Para valores admisibles de ${\ Displaystyle {\ hat {a_ {1}}}}$ y ${\ Displaystyle {\ hat {a_ {2}}}}$ , Debemos tener

{\ Displaystyle - \ log \ left ({\ frac {n_ {0}} {n}} \ right) <{\ bar {x}} <- 2 \ log \ left ({\ frac {n_ {0}} {n}} \ derecha)}

Prueba de la suposición de Poisson

Cuando se usa la distribución de Hermite para modelar una muestra de datos, es importante verificar si la distribución de Poisson es suficiente para ajustarse a los datos. Siguiendo la función de masa de probabilidad parametrizada utilizada para calcular el estimador de máxima verosimilitud, es importante corroborar la siguiente hipótesis,

{\ displaystyle {\ begin {cases} H_ {0}: d = 1 \\ H_ {1}: d> 1 \ end {cases}}}

Prueba de razón de verosimilitud

El estadístico de prueba de razón de verosimilitud ^[9] para la distribución de hermita es,

{\ Displaystyle W = 2 ({\ mathcal {L}} (X; {\ hat {\ mu}}, {\ hat {d}}) - {\ mathcal {L}} (X; {\ hat {\ mu}}, 1))}

Dónde ${\ Displaystyle {\ mathcal {L}} ()}$ es la función logarítmica de verosimilitud. Como d = 1 pertenece al límite del dominio de parámetros, bajo la hipótesis nula, W no tiene una asintótica ${\ Displaystyle \ chi _ {1} ^ {2}}$ distribución como se esperaba. Se puede establecer que la distribución asintótica de W es una mezcla 50:50 de la constante 0 y la ${\ Displaystyle \ chi _ {1} ^ {2}}$ . Los puntos porcentuales de la cola superior α para esta mezcla son los mismos que los puntos porcentuales de la cola superior 2α para una ${\ Displaystyle \ chi _ {1} ^ {2}}$ ; por ejemplo, para α = 0.01, 0.05 y 0.10 son 5.41189, 2.70554 y 1.64237.

La "puntuación" o prueba del multiplicador de Lagrange

La estadística de puntuación es ^[9]

{\ Displaystyle S_ {2} = 2m \ left [{\ frac {m ^ {(2)} - {\ bar {x}} ^ {2}} {2 {\ bar {x}}}} \ right] ^ {2} = {\ frac {m ({\ tilde {d}} - 1) ^ {2}} {2}}}

donde m es el número de observaciones.

La distribución asintótica del estadístico de la prueba de puntuación bajo la hipótesis nula es una ${\ Displaystyle \ chi _ {1} ^ {2}}$ distribución. Puede ser conveniente utilizar una versión firmada de la prueba de puntuación, es decir, ${\ Displaystyle \ operatorname {sgn} (m ^ {(2)} - {\ bar {x}} ^ {2}) {\ sqrt {S}}}$ , siguiendo asintóticamente un estándar normal.

Ver también

Distribución de Poisson compuesta
distribución de veneno

Referencias

^ a b c Kemp, CD; Kemp, AW (1965). "Algunas propiedades de la distribución" Hermite "". Biometrika . 52 (3–4): 381–394. doi : 10.1093 / biomet / 52.3-4.381 .
^ a b McKendrick, AG (1926). "Aplicaciones de las matemáticas a problemas médicos" . Actas de la Sociedad Matemática de Edimburgo . 44 : 98-130. doi : 10.1017 / s0013091500034428 .
^ Huiming, Zhang; Yunxiao Liu; Bo Li (2014). "Notas sobre el modelo de Poisson compuesto discreto con aplicaciones a la teoría del riesgo". Seguros: Matemáticas y Economía . 59 : 325–336. doi : 10.1016 / j.insmatheco.2014.09.012 .
^ a b c d Johnson, NL, Kemp, AW y Kotz, S. (2005) Distribuciones discretas univariadas, tercera edición, Wiley, ISBN 978-0-471-27246-5 .
^ Kemp, ADRIENNE W .; CD de Kemp (1966). "Una derivación alternativa de la distribución de Hermite". Biometrika . 53 (3–4): 627–628. doi : 10.1093 / biomet / 53.3-4.627 .
^ a b c Patel, YC (1976). "Estimación de punto par y estimación de momento en la distribución de Hermite". Biometría . 32 (4): 865–873. doi : 10.2307 / 2529270 . JSTOR 2529270 .
^ Gupta, RP; Jain, GC (1974). "Una distribución Hermite generalizada y sus propiedades". Revista SIAM de Matemática Aplicada . 27 (2): 359–363. doi : 10.1137 / 0127027 . JSTOR 2100572 .
^ a b Kotz, Samuel (1982-1989). Enciclopedia de ciencias estadísticas . John Wiley. ISBN 978-0471055525.
^ a b c d e f g h Puig, P. (2003). "Caracterización de modelos discretos cerrados aditivamente por una propiedad de sus estimadores de máxima verosimilitud, con una aplicación a distribuciones de Hermite generalizadas". Revista de la Asociación Estadounidense de Estadística . 98 (463): 687–692. doi : 10.1198 / 016214503000000594 . JSTOR 30045296 . S2CID 120484966 .

[kemp1-1] Kemp, CD; Kemp, AW (1965). "Algunas propiedades de la distribución" Hermite "". Biometrika . 52 (3–4): 381–394. doi : 10.1093 / biomet / 52.3-4.381 .

[Mckendrik-2] McKendrick, AG (1926). "Aplicaciones de las matemáticas a problemas médicos" . Actas de la Sociedad Matemática de Edimburgo . 44 : 98-130. doi : 10.1017 / s0013091500034428 .

[3] Huiming, Zhang; Yunxiao Liu; Bo Li (2014). "Notas sobre el modelo de Poisson compuesto discreto con aplicaciones a la teoría del riesgo". Seguros: Matemáticas y Economía . 59 : 325–336. doi : 10.1016 / j.insmatheco.2014.09.012 .

[libro-4] Johnson, NL, Kemp, AW y Kotz, S. (2005) Distribuciones discretas univariadas, tercera edición, Wiley, ISBN 978-0-471-27246-5 .

[kemp2-5] Kemp, ADRIENNE W .; CD de Kemp (1966). "Una derivación alternativa de la distribución de Hermite". Biometrika . 53 (3–4): 627–628. doi : 10.1093 / biomet / 53.3-4.627 .

[patel-6] Patel, YC (1976). "Estimación de punto par y estimación de momento en la distribución de Hermite". Biometría . 32 (4): 865–873. doi : 10.2307 / 2529270 . JSTOR 2529270 .

[gupta-7] Gupta, RP; Jain, GC (1974). "Una distribución Hermite generalizada y sus propiedades". Revista SIAM de Matemática Aplicada . 27 (2): 359–363. doi : 10.1137 / 0127027 . JSTOR 2100572 .

[enci-8] Kotz, Samuel (1982-1989). Enciclopedia de ciencias estadísticas . John Wiley. ISBN 978-0471055525.

[pere-9] Puig, P. (2003). "Caracterización de modelos discretos cerrados aditivamente por una propiedad de sus estimadores de máxima verosimilitud, con una aplicación a distribuciones de Hermite generalizadas". Revista de la Asociación Estadounidense de Estadística . 98 (463): 687–692. doi : 10.1198 / 016214503000000594 . JSTOR 30045296 . S2CID 120484966 .

[1] la