Distribución normal sesgada

Distribución normal sesgada
	; Función de densidad de probabilidad
	; Función de distribución de probabilidad
Parámetros	ubicación (real); escala (real positivo); forma (real)
Dominio
Función de densidad (pdf)
Función de distribución (cdf)
Media	donde
Moda
Curtosis
Función generadora de momentos (mgf)
Función característica
	[editar datos en Wikidata]

En estadística y probabilidad, la distribución normal sesgada es una distribución de probabilidad continua que generaliza a la distribución normal permitiendo que el sesgo estadístico sea distinto de cero.

Definición

Sea $\phi (x)$ la función de densidad de probabilidad para una distribución normal

\phi (x)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {x^{2}}{2}}}

con la función de distribución acumulada dada por

\Phi (x)=\int _{-\infty }^{x}\phi (t)\ dt={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x}{\sqrt {2}}}\right)\right]

,

donde "erf" es la función error. Entonces, la función de densidad de probabilidad (comúnmente "PDF" por sus siglas en inglés) de la distribución normal sesgada con parámetro $\alpha$ está dada por

f(x)=2\phi (x)\Phi (\alpha x).\,

La distribución fue descrita por primera vez por O'Hagan y Leonard en 1976.^[1] Existen aproximaciones a la distribución que son matemáticamente más fáciles de manipular, presentadas por Ashour y Abdel-Hamid^[2] y otra por Mudholkar y Hutson.^[3]

Andel, Netuka y Zvara describieron un proceso estocástico subyacente a la distribución en 1984.^[4] Tanto la distribución el proceso estocástico son consecuencias del argumento de simetría desarrollado por Chan y Tong (1986),^[5] que se aplica a los casos multivariados más allá de la normalidad, como por ejemplo distribuciones t multivariadas. La distorsión es un caso particular de una clase general de distribuciones con funciones de densidad de probabilidad de la forma f(x)=2 φ(x) Φ(x) donde φ() es cualquier PDF simétrica alrededor del cero y Φ() es cualquier CDF cuya PDF es simétrica alrededor del cero.^[6]

Para añadir parámetros de ubicación y escala a esta distribución, es usual hacer la transformación $x\rightarrow {\frac {x-\xi }{\omega }}$ . Se puede verificar que la distribución normal se recupera cuando $\alpha =0$ , y que el valor absoluto del sesgo incrementa a medida que el valor absoluto de $\alpha$ incrementa. La distribución está sesgada hacia la derecha si $\alpha >0$ y sesgada hacia la izquierda si $\alpha <0$ . La función de la densidad de probabilidad con ubicación $\xi$ , escala $\omega$ , y parámetro $\alpha$ se vuelve

f(x)={\frac {2}{\omega }}\phi \left({\frac {x-\xi }{\omega }}\right)\Phi \left(\alpha \left({\frac {x-\xi }{\omega }}\right)\right).\,

Debe notarse, sin embargo, que el sesgo ( $\gamma _{1}$ ) de la distribución está limitado al intervalo $(-1,1)$ .

Se ha demostrado,^[7] que la moda (máximo) de la distribución es único. Para un $\alpha$ en general, no existen expresiones analíticas para $m_{o}$ , aunque es posible conseguir una buena aproximación numérica con:

m_{o}(\alpha )\approx \mu _{z}-{\frac {\gamma _{1}\sigma _{z}}{2}}-{\frac {\mathrm {sgn} (\alpha )}{2}}\exp \left(-{\frac {2\pi }{|\alpha |}}\right)

donde $\mu _{z}={\sqrt {\frac {2}{\pi }}}\delta$ y $\sigma _{z}={\sqrt {1-\mu _{z}^{2}}}$

Estimación

Las estimaciones de máxima verosimilitud para $\xi$ , $\omega$ , y $\alpha$ pueden ser calculados numéricamente, pero no existen expresiones en forma cerrada para estos estimados a menos que $\alpha =0$ . Si es necesaria una expresión en forma cerrada, puede aplicarse el método de momentos para estimar $\alpha$ a partir del sesgo muestra, mediante la inversión de la ecuación de sesgo. Esto da como resultado la estimación

|\delta |={\sqrt {{\frac {\pi }{2}}{\frac {|{\hat {\gamma }}_{1}|^{\frac {2}{3}}}{|{\hat {\gamma }}_{1}|^{\frac {2}{3}}+((4-\pi )/2)^{\frac {2}{3}}}}}}

donde $\delta ={\frac {\alpha }{\sqrt {1+\alpha ^{2}}}}$ , y ${\hat {\gamma }}_{1}$ es el sesgo muestra. El signo de $\delta$ debe ser el mismo signo que ${\hat {\gamma }}_{1}$ . En consecuencia, ${\hat {\alpha }}=\delta /{\sqrt {1-\delta ^{2}}}$ .

El sesgo máximo (teóricamente) se obtiene al establecer ${\delta =1}$ en la ecuación de sesgo, resultando en $\gamma _{1}\approx 0.9952717$ . Sin embargo, es posible que el sesgo muestra sea más grande, con lo que $\alpha$ no podría ser determinado a partir de estas ecuaciones. Al usar el método de momentos de forma automática, por ejemplo para dar valores iniciales para la iteración de máxima verosimilitud, uno debería establecer (por ejemplo) que $|{\hat {\gamma }}_{1}|=\min(0.99,|(1/n)\sum {((x_{i}-{\bar {x}})/s)^{3}}|)$ .

Existen, sin embargo, objeciones acerca del impacto de los métodos de sesgo normal y de qué tan confiables son las inferencias basadas en ellos.^[8]

Distribuciones relacionadas

La distribución noremal modificada exponencialmente es otra distribución de 3 parámetros que generaliza a la distribución normal para incluir casos sesgados. La distribución normal sesgada mantiene una "cola" normal en la dirección del sesgo, con una "cola" más corta en la dirección opuesta; esto es, su densidad es asintóticamente proporcional a $e^{-kx^{2}}$ para un $k$ positivo. Por lo tanto en términos de los siete estados de aleatoriedad, presenta "aleatoriedad moderada propiamente". En contraste, la distribución normal modificada exponencialmente tiene una "cola" exponencial en la dirección del sesgo; su densidad es asintóticamente proporcional a $e^{-k|x|}$ . En los mismos términos, demuestra "aleatoriedad moderada marginal". Por ello, la distribución normal sesgada es útil para modelar distribuciones sesgadas que no tienen más valores atípicos que la normal, mientras que la distribución normal modificada exponencialmente es útil para casos con un mayor número de casos atípicos en una sola dirección.

Implementaciones

Existe una implementación en R para la función de densidad, de distribución, de cuantiles y para generar desviaciones aleatorias en https://cran.r-project.org/web/packages/sn/index.html.

Véase también

Referencias

↑ O'HAGAN, A.; LEONARD, TOM (1976). «Bayes estimation subject to uncertainty about parameter constraints». Biometrika 63 (1): 201-203. ISSN 0006-3444. doi:10.1093/biomet/63.1.201.
↑ Ashour, Samir K.; Abdel-hameed, Mahmood A. (October 2010). «Approximate skew normal distribution». Journal of Advanced Research 1 (4): 341-350. ISSN 2090-1232. doi:10.1016/j.jare.2010.06.004.
↑ Mudholkar, Govind S.; Hutson, Alan D. (February 2000). «The epsilon–skew–normal distribution for analyzing near-normal data». Journal of Statistical Planning and Inference 83 (2): 291-309. ISSN 0378-3758. doi:10.1016/s0378-3758(99)00096-8.
↑ Andel, J., Netuka, I. and Zvara, K. (1984) On threshold autoregressive processes. Kybernetika, 20, 89-106
↑ Chan, K. S.; Tong, H. (March 1986). «A note on certain integral equations associated with non-linear time series analysis». Probability Theory and Related Fields 73 (1): 153-158. ISSN 0178-8051. S2CID 121106515. doi:10.1007/bf01845999.
↑ Azzalini, A. (1985). «A class of distributions which includes the normal ones». Scandinavian Journal of Statistics 12: 171-178.
↑ Azzalini, Adelchi; Capitanio, Antonella (2014). The skew-normal and related families. pp. 32-33. ISBN 978-1-107-02927-9.
↑ Pewsey, Arthur (1 de septiembre de 2000). «Problems of inference for Azzalini's skewnormal distribution». Journal of Applied Statistics 27 (7): 859-870. ISSN 0266-4763. doi:10.1080/02664760050120542.

Enlaces externos

Azzalini, A (1 de diciembre de 1996). «The multivariate skew-normal distribution». Biometrika 83 (4): 715-726. ISSN 0006-3444,1464-3510 |issn= incorrecto (ayuda). doi:10.1093/biomet/83.4.715.
Una muy breve introducción a la distribución normal sesgada (en inglés)
La distribución normal sesgada (y distribuciones relacionadas, como la t sesgada) (en inglés)
Función T de Owens (en inglés)
Distribuciones cerradas sesgadas - Simulación, inversión y estimación de parámetros Archivado el 14 de agosto de 2011 en Wayback Machine. (en inglés)

Esta obra contiene una traducción derivada de «Skew normal distribution» de Wikipedia en inglés, concretamente de esta versión del 7 de mayo de 2021, publicada por sus editores bajo la Licencia de documentación libre de GNU y la Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional.

Datos: Q3258551

[1] O'HAGAN, A.; LEONARD, TOM (1976). «Bayes estimation subject to uncertainty about parameter constraints». Biometrika 63 (1): 201-203. ISSN 0006-3444. doi:10.1093/biomet/63.1.201.

[2] Ashour, Samir K.; Abdel-hameed, Mahmood A. (October 2010). «Approximate skew normal distribution». Journal of Advanced Research 1 (4): 341-350. ISSN 2090-1232. doi:10.1016/j.jare.2010.06.004.

[3] Mudholkar, Govind S.; Hutson, Alan D. (February 2000). «The epsilon–skew–normal distribution for analyzing near-normal data». Journal of Statistical Planning and Inference 83 (2): 291-309. ISSN 0378-3758. doi:10.1016/s0378-3758(99)00096-8.

[4] Andel, J., Netuka, I. and Zvara, K. (1984) On threshold autoregressive processes. Kybernetika, 20, 89-106

[5] Chan, K. S.; Tong, H. (March 1986). «A note on certain integral equations associated with non-linear time series analysis». Probability Theory and Related Fields 73 (1): 153-158. ISSN 0178-8051. S2CID 121106515. doi:10.1007/bf01845999.

[Azzalini1985-6] Azzalini, A. (1985). «A class of distributions which includes the normal ones». Scandinavian Journal of Statistics 12: 171-178.

[Azzalini2014-7] Azzalini, Adelchi; Capitanio, Antonella (2014). The skew-normal and related families. pp. 32-33. ISBN 978-1-107-02927-9.

[8] Pewsey, Arthur (1 de septiembre de 2000). «Problems of inference for Azzalini's skewnormal distribution». Journal of Applied Statistics 27 (7): 859-870. ISSN 0266-4763. doi:10.1080/02664760050120542.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Distribución normal sesgada
Función de densidad de probabilidad
Función de distribución de probabilidad
Parámetros	$\xi \,$ ubicación (real) $\omega \,$ escala (real positivo) $\alpha \,$ forma (real)
Dominio	$x\in \mathbb {R}$
Función de densidad (pdf)	${\frac {2}{\omega {\sqrt {2\pi }}}}e^{-{\frac {(x-\xi )^{2}}{2\omega ^{2}}}}\int _{-\infty }^{\alpha \left({\frac {x-\xi }{\omega }}\right)}{\frac {1}{\sqrt {2\pi }}}e^{-{\frac {t^{2}}{2}}}\ dt$
Función de distribución (cdf)	$\Phi (x)=\int _{-\infty }^{x}\phi (t)\ dt={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x}{\sqrt {2}}}\right)\right]$
Media	$\xi +\omega \delta {\sqrt {\frac {2}{\pi }}}$ donde $\delta ={\frac {\alpha }{\sqrt {1+\alpha ^{2}}}}$
Moda	$\xi +\omega m_{o}(\alpha )$
Curtosis	$2(\pi -3){\frac {\left(\delta {\sqrt {2/\pi }}\right)^{4}}{\left(1-2\delta ^{2}/\pi \right)^{2}}}$
Función generadora de momentos (mgf)	$M_{X}\left(t\right)=2\exp \left(\xi t+{\frac {\omega ^{2}t^{2}}{2}}\right)\Phi \left(\omega \delta t\right)$
Función característica	$e^{it\xi -t^{2}\omega ^{2}/2}\left(1+i\,{\textrm {Erfi}}\left({\frac {\delta \omega t}{\sqrt {2}}}\right)\right)$
[editar datos en Wikidata]