Kernel (estadísticas)

El término kernel se utiliza en análisis estadístico para referirse a una función de ventana . El término "núcleo" tiene varios significados distintos en diferentes ramas de la estadística.

Estadísticas bayesianas

En estadística, especialmente en la estadística bayesiana , el núcleo de una función de densidad de probabilidad (pdf) o función de masa de probabilidad (pmf) es la forma de la pdf o pmf en la que los factores que no son funciones de ninguna de las variables en el dominio son omitido. ^{[ cita requerida ]} Tenga en cuenta que tales factores bien pueden ser funciones de los parámetros del pdf o pmf. Estos factores forman parte del factor de normalización de la distribución de probabilidad y son innecesarios en muchas situaciones. Por ejemplo, en el muestreo de números pseudoaleatorios , la mayoría de los algoritmos de muestreo ignoran el factor de normalización. Además, en el análisis bayesiano de distribuciones previas conjugadas , los factores de normalización generalmente se ignoran durante los cálculos y solo se considera el kernel. Al final, se examina la forma del kernel y, si coincide con una distribución conocida, se puede restablecer el factor de normalización. De lo contrario, puede ser innecesario (por ejemplo, si solo se necesita muestrear la distribución).

Para muchas distribuciones, el kernel se puede escribir en forma cerrada, pero no la constante de normalización.

Un ejemplo es la distribución normal . Su función de densidad de probabilidad es

{\ Displaystyle p (x | \ mu, \ sigma ^ {2}) = {\ frac {1} {\ sqrt {2 \ pi \ sigma ^ {2}}}} e ^ {- {\ frac {(x - \ mu) ^ {2}} {2 \ sigma ^ {2}}}}}

y el kernel asociado es

{\ Displaystyle p (x | \ mu, \ sigma ^ {2}) \ propto e ^ {- {\ frac {(x- \ mu) ^ {2}} {2 \ sigma ^ {2}}}}}

Tenga en cuenta que se ha omitido el factor delante del exponencial, aunque contiene el parámetro ${\ Displaystyle \ sigma ^ {2}}$ , porque no es una función de la variable de dominio ${\ Displaystyle x}$ .

Análisis de patrones

El núcleo de un espacio de Hilbert del núcleo que se reproduce se utiliza en el conjunto de técnicas conocidas como métodos del núcleo para realizar tareas como clasificación estadística , análisis de regresión y análisis de conglomerados de datos en un espacio implícito. Este uso es particularmente común en el aprendizaje automático .

Estadísticas no paramétricas

En estadística no paramétrica , un kernel es una función de ponderación utilizada en técnicas de estimación no paramétrica . Los kernels se utilizan en la estimación de la densidad del kernel para estimar las funciones de densidad de las variables aleatorias , o en la regresión del kernel para estimar la expectativa condicional de una variable aleatoria. Los núcleos también se utilizan en series de tiempo , en el uso del periodograma para estimar la densidad espectral donde se conocen como funciones de ventana . Un uso adicional es la estimación de una intensidad variable en el tiempo para un proceso puntual donde las funciones de ventana (kernels) se convolucionan con datos de series de tiempo.

Por lo general, los anchos de kernel también deben especificarse cuando se ejecuta una estimación no paramétrica.

Definición

Un núcleo es un no negativo valor real- integrable función K. Para la mayoría de aplicaciones, es deseable definir la función para satisfacer dos requisitos adicionales:

Normalización :

{\ Displaystyle \ int _ {- \ infty} ^ {+ \ infty} K (u) \, du = 1 \ ,;}

Simetría:

{\ displaystyle K (-u) = K (u) {\ mbox {para todos los valores de}} u \ ,.}

El primer requisito asegura que el método de estimación de la densidad del kernel dé como resultado una función de densidad de probabilidad . El segundo requisito asegura que el promedio de la distribución correspondiente sea igual al de la muestra utilizada.

Si K es un núcleo, entonces también lo es la función K * definida por K * ( u ) = λ K (λ u ), donde λ> 0. Esto puede usarse para seleccionar una escala que sea apropiada para los datos.

Funciones del kernel de uso común

Todos los núcleos a continuación en un sistema de coordenadas común.

Se utilizan habitualmente varios tipos de funciones del núcleo: uniforme, triangular, Epanechnikov, ^[1] cuartica (bipeso), tricubo, ^[2] tripeso, gaussiana, cuadrática ^[3] y coseno.

En la siguiente tabla, si ${\ Displaystyle K}$ se da con un apoyo acotado , entonces ${\ Displaystyle K (u) = 0}$ para valores de u fuera del soporte.

Funciones del núcleo, K ( u )			${\ Displaystyle \ textstyle \ int u ^ {2} K (u) du}$	${\ Displaystyle \ textstyle \ int K (u) ^ {2} du}$	Eficiencia ^[4] relativa al núcleo de Epanechnikov
Uniforme ("ventana rectangular")	${\ Displaystyle K (u) = {\ frac {1} {2}}}$ Apoyo: ${\ Displaystyle \| u \| \ leq 1}$	" Función de vagón "	${\ Displaystyle {\ frac {1} {3}}}$	${\ Displaystyle {\ frac {1} {2}}}$	92,9%
Triangular	${\ Displaystyle K (u) = (1- \| u \|)}$ Apoyo: ${\ Displaystyle \| u \| \ leq 1}$		${\ Displaystyle {\ frac {1} {6}}}$	${\ Displaystyle {\ frac {2} {3}}}$	98,6%
Epanechnikov (parabólico)	${\ Displaystyle K (u) = {\ frac {3} {4}} (1-u ^ {2})}$ Apoyo: ${\ Displaystyle \| u \| \ leq 1}$		${\ Displaystyle {\ frac {1} {5}}}$	${\ Displaystyle {\ frac {3} {5}}}$	100%
Cuartico (bipeso)	${\ Displaystyle K (u) = {\ frac {15} {16}} (1-u ^ {2}) ^ {2}}$ Apoyo: ${\ Displaystyle \| u \| \ leq 1}$		${\ Displaystyle {\ frac {1} {7}}}$	${\ Displaystyle {\ frac {5} {7}}}$	99,4%
Triweight	${\ Displaystyle K (u) = {\ frac {35} {32}} (1-u ^ {2}) ^ {3}}$ Apoyo: ${\ Displaystyle \| u \| \ leq 1}$		${\ Displaystyle {\ frac {1} {9}}}$	${\ displaystyle {\ frac {350} {429}}}$	98,7%
Tricube	${\ Displaystyle K (u) = {\ frac {70} {81}} (1 - {\ left \| u \ right \|} ^ {3}) ^ {3}}$ Apoyo: ${\ Displaystyle \| u \| \ leq 1}$		${\ Displaystyle {\ frac {35} {243}}}$	${\ displaystyle {\ frac {175} {247}}}$	99,8%
Gaussiano	${\ Displaystyle K (u) = {\ frac {1} {\ sqrt {2 \ pi}}} e ^ {- {\ frac {1} {2}} u ^ {2}}}$		${\ Displaystyle 1 \,}$	${\ Displaystyle {\ frac {1} {2 {\ sqrt {\ pi}}}}}$	95,1%
Coseno	${\ Displaystyle K (u) = {\ frac {\ pi} {4}} \ cos \ left ({\ frac {\ pi} {2}} u \ right)}$ Apoyo: ${\ Displaystyle \| u \| \ leq 1}$		${\ Displaystyle 1 - {\ frac {8} {\ pi ^ {2}}}}$	${\ Displaystyle {\ frac {\ pi ^ {2}} {16}}}$	99,9%
Logístico	${\ Displaystyle K (u) = {\ frac {1} {e ^ {u} + 2 + e ^ {- u}}}}$		${\ Displaystyle {\ frac {\ pi ^ {2}} {3}}}$	${\ Displaystyle {\ frac {1} {6}}}$	88,7%
Función sigmoidea	${\ Displaystyle K (u) = {\ frac {2} {\ pi}} {\ frac {1} {e ^ {u} + e ^ {- u}}}}$		${\ Displaystyle {\ frac {\ pi ^ {2}} {4}}}$	${\ Displaystyle {\ frac {2} {\ pi ^ {2}}}}$	84,3%
Núcleo de Silverman ^[5]	${\ Displaystyle K (u) = {\ frac {1} {2}} e ^ {- {\ frac {\| u \|} {\ sqrt {2}}}} \ cdot \ sin \ left ({\ frac { \| u \|} {\ sqrt {2}}} + {\ frac {\ pi} {4}} \ right)}$		${\ displaystyle 0}$	${\ Displaystyle {\ frac {3 {\ sqrt {2}}} {16}}}$	no aplica

Ver también

Estimación de la densidad de kernel
Kernel más suave
Núcleo estocástico
Estimación de densidad
Estimación de densidad de kernel multivariante

Referencias

^ Nombrado por Epanechnikov, VA (1969). "Estimación no paramétrica de una densidad de probabilidad multivariante". Teoría Probab. Apl . 14 (1): 153-158. doi : 10.1137 / 1114019 .
^ Altman, NS (1992). "Una introducción al kernel y la regresión no paramétrica del vecino más cercano". El estadístico estadounidense . 46 (3): 175-185. doi : 10.1080 / 00031305.1992.10475879 . hdl : 1813/31637 .
^ Cleveland, WS ; Devlin, SJ (1988). "Regresión ponderada localmente: un enfoque para el análisis de regresión por ajuste local". Revista de la Asociación Estadounidense de Estadística . 83 (403): 596–610. doi : 10.1080 / 01621459.1988.10478639 .
^ La eficiencia se define como ${\ Displaystyle {\ sqrt {\ int u ^ {2} K (u) \, du}} \ int K (u) ^ {2} \, du}$ .
^ Silverman, BW (1986). Estimación de densidad para estadísticas y análisis de datos . Chapman y Hall, Londres.

Li, Qi; Racine, Jeffrey S. (2007). Econometría no paramétrica: teoría y práctica . Prensa de la Universidad de Princeton. ISBN 978-0-691-12161-1.

Calabacín, Walter. "TÉCNICAS DE ALISADO APLICADAS Parte 1: Estimación de la densidad del grano" (PDF) . Consultado el 6 de septiembre de 2018 .

Comaniciu, D; Meer, P (2002). "Cambio medio: un enfoque sólido hacia el análisis del espacio de características". Transacciones IEEE sobre análisis de patrones e inteligencia de máquinas . 24 (5): 603–619. CiteSeerX 10.1.1.76.8968 . doi : 10.1109 / 34.1000236 .

[1] Nombrado por Epanechnikov, VA (1969). "Estimación no paramétrica de una densidad de probabilidad multivariante". Teoría Probab. Apl . 14 (1): 153-158. doi : 10.1137 / 1114019 .

[2] Altman, NS (1992). "Una introducción al kernel y la regresión no paramétrica del vecino más cercano". El estadístico estadounidense . 46 (3): 175-185. doi : 10.1080 / 00031305.1992.10475879 . hdl : 1813/31637 .

[3] Cleveland, WS ; Devlin, SJ (1988). "Regresión ponderada localmente: un enfoque para el análisis de regresión por ajuste local". Revista de la Asociación Estadounidense de Estadística . 83 (403): 596–610. doi : 10.1080 / 01621459.1988.10478639 .

[4] ^ La eficiencia se define como ${\ Displaystyle {\ sqrt {\ int u ^ {2} K (u) \, du}} \ int K (u) ^ {2} \, du}$ .

[5] Silverman, BW (1986). Estimación de densidad para estadísticas y análisis de datos . Chapman y Hall, Londres.

[1]