Distribución normal | ||
---|---|---|
La llinia verde correspuende a la distribución normal estándar Función de densidá de probabilidá | ||
Función de distribución de probabilidá | ||
Parámetros |
| |
Función de densidá (pdf) | ||
Función de distribución (cdf) | ||
Media | ||
Mediana | ||
Moda | ||
Varianza | ||
Coeficiente de simetría | 0 | |
Curtosis | 0 | |
Entropía | ||
Función xeneradora de momentos (mgf) | ||
Función característica | ||
[editar datos en Wikidata] |
En estadística y probabilidad llámase distribución normal, distribución de Gauss o distribución gaussiana o distribución de Laplace-Gauss, a una de les distribuciones de probabilidá de variable continua que con más frecuencia apaez estadística y teoría de probabilidá.[1]
La gráfica de la so función de densidá tien una forma acampanada y ye simétrica respectu d'un determináu parámetru estadísticu. Esta curva conozse como campana de Gauss y ye el gráficu d'una función gaussiana.[2]
La importancia d'esta distribución anicia en que dexa modelar numberosos fenómenos naturales, sociales y psicolóxicos.[3]Ente que los mecanismos que subyacen a gran parte d'esti tipu de fenómenos son desconocíos, pola enorme cantidá de variables incontrolables que nellos intervienen, l'usu del modelu normal puede xustificase asumiendo que cada observación llógrase como la suma d'unes poques causes independientes.
Ello ye que la estadística descriptiva namái dexa describir un fenómenu, ensin esplicación dalguna. Pa la esplicación causal ye precisu'l diseñu esperimental, d'ende que al usu de la estadística en psicoloxía y socioloxía seya conocíu como métodu correlacional.
La distribución normal tamién ye importante pola so rellación cola estimación por mínimos cuadraos, unu de los métodos d'estimación más simples y antiguos.
Dellos exemplos de variables acomuñaes a fenómenos naturales que siguen el modelu de la normal son:
- calteres morfolóxicos d'individuos como la estatura;
- calteres fisiolóxicos como l'efeutu d'un fármacu;
- calteres sociolóxicos como'l consumu de ciertu productu por un mesmu grupu d'individuos;
- calteres psicolóxicos como'l cociente intelectual;
- nivel de ruiu en telecomunicaciones;
- errores cometíos al midir ciertes magnitúes;
- etc.
La distribución normal tamién apaez en munches árees de la mesma estadística. Por casu, la distribución muestral de les medies muestrales ye aproximao normal, cuando la distribución de la población de la cual estrayer la muestra nun ye normal.[4] Amás, la distribución normal maximiza la entropía ente toles distribuciones con media y varianza conocíes, lo cual convertir na eleición natural de la distribución subxacente a una llista de datos resumíos en términos de media muestral y varianza. La distribución normal ye la más estendida n'estadística y munchos tests estadísticos tán basaos nuna "normalidá" más o menos xustificada de la variable aleatoria so estudiu.
En probabilidá, la distribución normal apaez como la llende de delles distribuciones de probabilidá continues y discretes.
Historia
La distribución normal foi presentada per primer vegada por Abraham de Moivre nun artículu del añu 1733,[5] que foi reimpreso na segunda edición de la so The Doctrine of Chances, de 1738, nel contestu de ciertu aproximamientu de la distribución binomial para grandes valores de n. La so resultancia foi ampliáu por Laplace nel so llibru Teoría analítica de les probabilidaes (1812), y na actualidá llámase Teorema de De Moivre-Laplace.
Laplace usó la distribución normal nel analís d'errores d'esperimentos. L'importante métodu de mínimos cuadraos foi introducíu por Legendre en 1805. Gauss, qu'afirmaba usar el métodu dende 1794, xustificar rigorosamente en 1809 asumiendo una distribución normal de los errores. El nome de Gauss acomuñóse a esta distribución porque la usó con mapa cuando analizaba datos astronómicos[6] y dellos autores atribúyen-y un descubrimientu independiente del de De Moivre.[7]Esta atribución del nome de la distribución a una persona distinta del so primer descubridor ye un claru exemplu de la llei de Stigler.
El nome de "campana" vien d'Esprit Jouffret qu'usó'l términu "bell surface" (superficie campana) per primer vegada en 1872 pa una distribución normal bivariante de componentes independientes. El nome de "distribución normal" foi dau independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis escontra 1875.[ensin referencies] A pesar d'esta terminoloxía, otres distribuciones de probabilidá podríen ser más apropiaes en determinaos contestos; vease'l discutiniu sobre incidencia, más embaxo.
Definición formal
La función de distribución de la distribución normal ta definida como sigue:
Poro, la función de distribución de la normal estándar ye:
Esta función de distribución puede espresase en términos d'una función especial llamada función error de la siguiente forma:
- .
y la mesma función de distribución puede, poro, espresase asina:
El complementu de la función de distribución de la normal estándar, , se denota con frecuencia , y ye referida, dacuando, como a cencielles función Q, especialmente en testos d'inxeniería.[8][9] Esto representa la cola de probabilidá de la distribución gaussiana. Tamién s'usen dacuando otres definiciones de la función Q, que son toes elles tresformamientos simples de .[10]
La inversa de la función de distribución de la normal estándar (función cuantil) puede espresase en términos de la inversa de la función d'error:
- .
y l'inversa de la función de distribución puede, poro, espresase como:
Esta función cuantil llámase dacuando la función probit. Nun hai una primitiva elemental pa la función probit. Esto nun quier dicir puramente que nun se conoz, sinón que se probó la inesistencia de tal función. Esisten dellos métodos exactos p'averar la función cuantil por aciu la distribución normal (vease función cuantil).
Los valores Φ(x) pueden averase con muncha precisión por distintos métodos, tales como integración numbérica, series de Taylor, series asintóticas y fracciones continues.
Llende inferior y superior estrictos pa la función de distribución
Pa grandes valores de x la función de distribución de la normal estándar ye bien próxima a 1 y ta mui cerca de 0. Les llendes elementales
- .
en términos de la densidá son útiles.
Usando'l camudo de variable v = o²/2, la llende cimera llógrase como sigue:
De forma similar, usando y la regla del cociente,
Resolviendo pa apurre la llende inferior.
Funciones generatrices
Función generatriz de momentos
La función generatriz de momentos defínese como la esperanza de y(tX). Pa una distribución normal, la función generatriz de momentos ye:
como puede comprobase al completar el cuadráu nel esponente.
Función carauterística
La función carauterística defínese como la esperanza de yitX, onde i ye la unidá imaxinaria. D'esta miente, la función carauterística llógrase reemplazando t por it na función generatriz de momentos. Pa una distribución normal, la función carauterística ye[11]
Propiedaes
Delles propiedaes de la distribución normal son les siguientes:
- Ye simétrica respectu de la so media, ;
- La moda y la mediana son dambes iguales a la media, ;
- Los punto d'inflexón de la curva dar pa y .
- Distribución de probabilidá nuna redolada de la media:
- nel intervalu atópase entendida, aproximao, el 68,26% de la distribución;
- nel intervalu atópase, aproximao, el 95,44% de la distribución;
- pela so parte, nel intervalu atópase entendida, aproximao, el 99,74% de la distribución. Estes propiedaes son de gran utilidá pal establecimientu d'intervalo d'enfotu. Per otra parte, el fechu de que práuticamente la totalidá de la distribución atopar a tres desviación típiques de la media xustifica les llendes de les tables emplegaes davezu na normal estándar.
- Si y , entós .
- Si y son variables aleatories normales independientes, entós:
- La so suma ta de normal distribuyida con (demostración). Recíprocamente, si dos variables aleatories independientes tienen una suma de normal distribuyida, tienen de ser normales (Teorema de Crámer).
- La so diferencia ta de normal distribuyida con .
- Si les varianzas de X y Y son iguales, entós O y V son independientes ente sigo.
- La diverxencia de Kullback-Leibler,
- Si y son variables aleatories independientes de normal distribuyíes, entós:
- El so productu sigue una distribución con densidá dada por
- onde ye una función de Bessel modificada de segundu tipu.
- El so cociente sigue una distribución de Cauchy con . D'esta miente la distribución de Cauchy ye un tipu especial de distribución cociente.
- El so productu sigue una distribución con densidá dada por
- Si son variables normales estándar independientes, entós sigue una distribución χ² con n graos de llibertá.
- Si son variables normales estándar independientes, entós la media muestral y la varianza muestral son independientes. Esta propiedá caracteriza a les distribuciones normales y contribúi a esplicar por qué'l test-F nun ye robezu al respective de la non-normalidá).
Estandarización de variables aleatories normales
De resultes de la Propiedá 1; ye posible rellacionar toles variables aleatories normales cola distribución normal estándar.
Si , entós
ye una variable aleatoria normal estándar: ~ .
El tresformamientu d'una distribución X ~ N(μ, σ) nuna N(0, 1) llámase normalización, estandarización o tipificación de la variable X.
Una consecuencia importante d'esto ye que la función de distribución d'una distribución normal ye, poro,
A la inversa, si ye una distribución normal estándar, ~ , entós
ye una variable aleatoria normal tipificada de media y varianza .
La distribución normal estándar ta tabulada (davezu na forma del valor de la función de distribución Φ) y les otres distribuciones normales pueden llograse como tresformamientos simples, como se describe más arriba, de la distribución estándar. D'esta miente pueden usase los valores tabulados de la función de distribución normal estándar p'atopar valores de la función de distribución de cualesquier otra distribución normal.
Momentos
Los primeres momentos de la distribución normal son:
Númberu | Momentu | Momentu central | Cumulante |
---|---|---|---|
0 | 1 | 1 | |
1 | 0 | ||
2 | |||
3 | 0 | 0 | |
4 | 0 | ||
5 | 0 | 0 | |
6 | 0 | ||
7 | 0 | 0 | |
8 | 0 |
Tolos cumulantes de la distribución normal, más allá del segundu, son cero.
Los momentos centrales d'orde cimeru (2k con μ = 0) vienen daos pola fórmula
El Teorema de la Llende Central
El Teorema de la llende central establez que so ciertes condiciones (como pueden ser independientes y hermano distribuyíes con varianza finita), la suma d'un gran númberu de variables aleatories distribúyese aproximao como una normal.
La importancia práutica del Teorema de la llende central ye que la función de distribución de la normal puede usase como aproximamientu de delles otres funciones de distribución. Por casu:
- Una distribución binomial de parámetros n y p ye aproximao normal pa grandes valores de n, y p non demasiáu cercanu a 0 o a 1 (dellos llibros encamienten usar esti aproximamientu namái si np y n(1 − p) son dambos, siquier, 5; nesti casu tendría d'aplicase una correición de continuidá).
La normal averada tien parámetros μ = np, σ2 = np(1 − p).
- Una distribución de Poisson con parámetru λ ye aproximao normal pa grandes valores de λ.
La distribución normal averada tien parámetros μ = σ2 = λ.
La exactitú d'estos aproximamientos depende del propósitu pal que se precisen y de la tasa de converxencia a la distribución normal. Dase'l casu típicu de que tales aproximamientos son menos precises nes coles de la distribución. El Teorema de Berry-Esséen apurre una llende cimera xeneral del error d'aproximamientu de la función de distribución.
Divisibilidad infinita
Les normales tienen una distribución de probabilidá infinitamente divisible: Pa una distribución normal X de media μ y varianza σ2 ≥ 0, ye posible atopar n variables aleatories independientes {X1,...,Xn} caúna con distribución normal de media μ/n y varianza σ2/n yá que la suma X1 + . . . + Xn d'estes n variables aleatories
tenga esta específica distribución normal (pa verificalo, úsese la función carauterística de convolución y la inducción matemática).
Estabilidá
Les distribuciones normales son puramente estables.
Esviación típica ya intervalos d'enfotu
Alredor del 68% de los valores d'una distribución normal tán a una distancia σ < 1 (esviación típica) de la media, μ; alredor del 95% de los valores tán a dos desviación típiques de la media y alredor del 99,7% tán a tres desviación típiques de la media. Esto conozse como la "regla 68-95-99,7" o la "regla empírica".
Pa ser más precisos, l'área so la curva campana ente μ − nσ y μ + nσ en términos de la función de distribución normal vien dada por
onde erf ye la función error. Los valores pa n=1, n=2, ... , n= 6, son... (con 12 decimales)...:
1 | 0,682689492137 |
2 | 0,954499736104 |
3 | 0,997300203937 |
4 | 0,999936657516 |
5 | 0,999999426697 |
6 | 0,999999998027 |
La siguiente tabla apurre la rellación inversa de múltiples σ correspondientes a unos pocos valores usaos con frecuencia pa l'área so la campana de Gauss. Estos valores son útiles pa determinar intervalo d'enfotu pa los niveles especificaos basaos nuna curva de normal distribuyida (o estimadores asintóticamente normales):
0,80 | 1,28155 |
0,90 | 1,64485 |
0,95 | 1,95996 |
0,98 | 2,32635 |
0,99 | 2,57583 |
0,995 | 2,80703 |
0,998 | 3,09023 |
0,999 | 3,29052 |
0,9999 | 3,8906 |
0,99999 | 4,4172 |
onde'l valor a la izquierda de la tabla ye la proporción de valores que van cayer nel intervalu dau y n ye un múltiplu de la esviación típica que determina l'anchor del intervalu.
Forma familia esponencial
La distribución normal tien forma de familia esponencial biparamétrica con dos parámetros naturales, μ y 1/σ2, y estadísticos naturales X y X2. La forma canónica tien como parámetros y y estadísticos suficientes y
Distribución normal complexa
Considérese la variable aleatoria complexa gaussiana
- .
onde X y Y son variables gaussianas reales ya independientes con igual varianza . La función de distribución de la variable conxunta ye entós
Como , la función de distribución resultante pa la variable gaussiana complexa Z ye
Distribuciones rellacionaes
- ye una distribución de Rayleigh si onde y son dos distribuciones normales independientes.
- ye una distribución χ² con grado de llibertá si onde pa y son independientes.
- ye una distribución de Cauchy si pa y son dos distribuciones normales independientes.
- ye una distribución log-normal si y .
- Rellación con una distribución estable: si entós .
- Distribución normal truncada. si entós atayando X per debaxo de y percima de va dar llugar a una variable aleatoria de media onde y ye la función de densidá d'una variable normal estándar.
- Si ye una variable aleatoria de normal distribuyida y , entós tien una distribución normal doblada.
Estadística descriptiva y inferencial
Resultaos
De la distribución normal derívense munches resultaos, incluyendo rangos de percentiles ("percentiles" o "cuantiles"), curves normales equivalentes, stanines, z-scores, y T-scores. Amás, un númberu de procedimientos d'estadísticos de comportamientu tán basaos na asunción de qu'eses resultaos tán de normal distribuyíos. Por casu, el test de Student y el analís de varianza (ANOVA) (vease más embaxo). La gradación de la curva campana asigna graos relativos basaos nuna distribución normal de resultaos.
Tests de normalidá
Los tests de normalidá aplicar a conxuntos de datos pa determinar la so semeyanza con una distribución normal. La hipótesis nula ye, nestos casos, si'l conxuntu de datos ye similar a una distribución normal, polo qu'un P-valor abondo pequeñu indica datos non normales.
- Prueba de Kolmogórov-Smirnov
- Test de Lilliefors
- Test de Anderson–Darling
- Test de Ryan–Joiner
- Test de Shapiro–Wilk
- Normal probability plot (rankit plot)
- Test de Jarque–Bera
- Test omnibús de Spiegelhalter
Estimación de parámetro
Estimación de parámetros de máxima verosimilitud
Supóngase que
son independientes y caúna ta de normal distribuyida con media μ y varianza σ 2 > 0. En términos estadísticos los valores reparaos d'estes n variables aleatories constitúin una "muestra de tamañu n d'una población de normal distribuyida. Deseyar envalorar la media poblacional μ y la esviación típica poblacional σ, basándose nos valores reparaos d'esta muestra. La función de densidá conxunta d'estes n variables aleatories independientes ye
Como función de μ y σ, la función de verosimilitud basada nes observaciones X1, ..., Xn ye
con dalguna constante C > 0 (de la cual, polo xeneral, dexaríase inclusive que dependiera de X1, ..., Xn, anque sumiera coles derivaes parciales de la función de log-verosimilitud al respective de los parámetros teníos en cuenta, vease más embaxo).
Nel métodu de máxima verosimilitud, los valores de μ y σ que maximizan la función de verosimilitud tómense como estimadores de los parámetros poblacionales μ y σ.
Davezu na maximización d'una función de dos variables, podríen considerase derivaes parciales. Pero equí esplótase'l fechu de que'l valor de μ que maximiza la función de verosimilitud con σ fixu nun depende de σ. Sicasí, atopamos qu'esi valor de μ, entós sustitúyese por μ na función de verosimilitud y finalmente atopamos el valor de σ que maximiza la espresión resultante.
Rescampla que la función de verosimilitud ye una función decreciente de la suma
Asina que se deseya'l valor de μ que embrive esta suma. Sía
la media muestral basada nes n observaciones. Nótese que
Namái l'últimu términu depende de μ y embrívese por
Esta ye la estimación de máxima verosimilitud de μ basada nes n observaciones X1, ..., Xn. Cuando sustituyimos esta estimación por μ na función de verosimilitud, llogramos
- .
Convenir en denotar la "log-función de verosimilitud", esto ye, el llogaritmu de la función de verosimilitud, con una minúscula ℓ, y tenemos
- .
entós
Esta derivada ye positiva, cero o negativa según σ2 tea ente 0 y
esto ye igual a esa cantidá, o mayor qu'esa cantidá. (Si hai solamente una observación, lo que significa que n = 1, o si X1 = ... = Xn, lo cual namái asocede con probabilidad cero, entós por esta fórmula, reflexa'l fechu de que nestos casos la función de verosimilitud ye ilimitada cuando σ escai hasta cero.)
Consecuentemente esta media de cuadraos de residuos ye'l estimador de máxima verosimilitud de σ2, y el so raigañu cuadráu ye'l estimador de máxima verosimilitud de σ basáu nes n observaciones. Esti estimador ye sesgado, pero tien un menor error mediu al cuadráu que l'habitual estimador insesgado, que ye n/(n − 1) vegaes esti estimador.
Sorprendente xeneralización
La derivada del estimador de máxima verosimilitud de la matriz de covarianza d'una distribución normal multivariante ye despreciable. Arreya'l teorema espectral y la razón pola que puede ser meyor pa ver un esguilar como la traza d'una matriz 1×1 que como un pixín esguilar. Vease estimación de la covarianza de matrices.
Estimación insesgada de parámetros
El estimador de máxima verosimilitud de la media poblacional μ, ye un estimador insesgado de la media poblacional.
El estimador de máxima verosimilitud de la varianza ye insesgado si asumimos que la media de la población ye conocida a priori, pero na práutica esto nun asocede. Cuando disponemos d'una muestra y nun sabemos nada de la media o la varianza de la población de la que s'estrayxo, como s'asumía na derivada de máxima verosimilitud de riba, entós el estimador de máxima verosimilitud de la varianza ye sesgado. Un estimador insesgado de la varianza σ2 ye la cuasi varianza muestral:
que sigue una distribución Gamma cuando les Xi son normales independientes y hermano distribuyíes:
- .
con media y varianza
La estimación de máxima verosimilitud de la esviación típica ye'l raigañu cuadráu de la estimación de máxima verosimilitud de la varianza. Sicasí, nin ésta, nin el raigañu cuadráu de la cuasivarianza muestral apurren un estimador insesgado pa la esviación típica (vease estimación insesgada de la esviación típica pa una fórmula particular pa la distribución normal.
Incidencia
Les distribuciones aproximao normales apaecen peruquier, como queda esplicáu pol teorema central de la llende. Cuando nun fenómenu abarrúntase la presencia d'un gran númberu de pequeñes causes actuando de forma aditiva ya independiente ye razonable pensar que les observaciones van ser "normales". Hai métodos estadísticos pa probar empíricamente esta asunción, por casu, el test de D'Agostino-Pearson. El test de Kolmogorov-Smirnov, antes llargamente usáu, agora paez tar desaconseyáu.
Hai causes que pueden actuar de forma multiplicativa (más que aditiva). Nesti casu, l'asunción de normalidá nun ta xustificada y ye el llogaritmu de la variable en cuestión el que taría de normal distribuyíu. La distribución de les variables direutamente reparaes nesti casu denominar log-normal.
Finalmente, si hai una simple influencia esterna que tien un gran efeutu na variable en considerancia, l'asunción de normalidá nun ta tampoco xustificada. Esto ye ciertu inclusive si, cuando la variable esterna caltiénse constante, les distribuciones marxinales resultantes son, n'efeutu, normales. La distribución completa va ser una superposición de variables normales, que nun ye polo xeneral normal. Ello ta rellacionáu cola teoría d'errores (vease más embaxo).
De siguío amuésense una llista de situaciones que taríen, aproximao, de normal distribuyíes. Más embaxo puede atopase un discutiniu detalláu de caúna d'elles:
- En problemes de recuentu, onde'l teorema central de la llende inclúi un aproximamientu de discreta a continua y onde les distribuciones infinitamente divisibles y descomponibles tán arreyaes, tales como:
- variables aleatories binomiales, acomuñaes con entrugues sí/non;
- variables aleatories de Poisson, acomuñaes con eventos raros;
- En midíes fisiolóxiques de especímenes biolóxicos:
- El llogaritmu de les midíes del tamañu de texíos vivos (llargor, altor, superficie de piel, pesu);
- La llargor d'apéndices inertes (pelo, garres, rabos, dientes) de especímenes biolóxicos na direición del crecimento;
- Otres midíes fisiolóxiques podríen tar de normal distribuyíes, anque nun hai razón pa esperalo a priori;
- Asumir con frecuencia que los errores de midida tán de normal distribuyíos y cualquier esviación de la normalidá considérase una cuestión que tendría d'esplicase;
- Variables financieres, nel modelu Black-Scholes:
- Cambeos nel llogaritmu de Cambeos
nel llogaritmu de tases de cambéu, índices de precios, índices d'esistencies de mercáu; estes variables pórtense como l'interés compuestu, non como l'interés simple, por tanto, son multiplicatives;
- Ente que el modelu Black-Scholes presupon normalidá, en realidá estes variables exhiben coles pesaes, como puede trate en crash de les esistencies de mercáu;
- Otres variables financieres podríen tar de normal distribuyíes, pero nun hai razón pa esperalo a priori;
- Intensidá de la lluz:
- La intensidá de la lluz láser ta de normal distribuyida;
- La lluz térmico tien una distribución de Bose-Einstein n'escales de tiempu bien curtios y una distribución normal en grandes escales de tiempu debíu al teorema central de la llende.
Ye relevante pa la bioloxía y l'economía el fechu de que los sistemes complexos tienden a amosar la llei de potencies más que normal.
Recuentu de fotones
La intensidá de la lluz d'una sola fonte varia col tiempu, según les fluctuaciones térmiques que pueden reparase si la lluz analizar a una resolución abondo altu. La mecánica cuántica interpreta les midíes de la intensidá de la lluz como un recuentu de fotones, onde'l camientu natural lleva a usar la distribución de Poisson. Cuando la intensidá de la lluz integrar a lo llargo de grandes periodos de tiempu mayores que'l tiempu de coherencia, l'aproximamientu Poisson - Normal ye apoderada.
Midida d'errores
La normalidá ye la asunción central de la teoría matemática d'errores. De forma similar nel axuste de modelos estadísticu, un indicador de la bondá del axuste ye que'l error residual (asina ye como se llamen los errores nesta circunstancia) seya independiente y de normal distribuyíu. L'asunción ye que cualquier esviación de la normalidá precisa ser esplicada. Nesi sentíu, en dambos, axuste de modelos y teoría d'errores, la normalidá ye la única observación que nun precisa ser esplicada, sinón que ye esperada. Sicasí, si los datos orixinales nun tán de normal distribuyíos (por casu, si siguen una distribución de Cauchy, entós los residuos tampoco van tar de normal distribuyíos. Esti fechu ye ignoráu davezu na práutica.
Les midíes repitíes de la mesma cantidá espérase que dexen el pasu a resultaos que tán arrexuntaos en redol a un valor particular. Si toles fontes principales d'errores tomáronse en cuenta, se asume que l'error que queda ten de ser la resultancia d'un gran númberu de bien pequeños y aditivos efeutos y, poro, normal. Les esviaciones de la normalidá interprétense como indicaciones d'errores sistemáticos que nun fueron tomaos en cuenta. Puede aldericase si esta asunción ye válida.
Una famosa observación atribuyida a Gabriel Lippmann diz:[ensin referencies]
Tol mundu cree na llei normal de los errores: los matemáticos, porque piensen que ye un fechu esperimental; y el esperimentadores, porque suponen que ye un teorema matemáticu
Otra fonte podría ser Henri Poincaré.
Carauterístiques físiques de especímenes biolóxicos
Los tamaños de los animales adultos siguen aproximao una distribución log-normal. La evidencia y esplicación basada en modelos de crecedera foi publicada per primer vegada nel llibru Problemes de crecedera relativa, de 1932, por Julian Huxley.
Les diferencies de tamañu por cuenta de dimorfismos sexuales o otros polimorfismos d'inseutos, como la división social de les abeyes n'obreres, zánganos y reines, por casu, fai que la distribución de tamaños esviar escontra la lognormalidad.
L'asunción de que'l tamañu llinial de los especímenes biolóxicos ye normal (más que lognormal) llévanos a una distribución non normal del pesu (yá que el pesu o'l volume ye proporcional al cuadráu o'l cubu del llargor y les distribuciones gaussianas namái caltienen los tresformamientos lliniales). A la inversa, asumir que'l pesu sigue una distribución normal implica llargores non normales. Esto ye un problema porque, a priori, nun hai razón pola que cualesquier d'elles (llargor, masa corporal o otres) tendría de tar de normal distribuyida. Les distribuciones lognormales, per otru llau, caltener ente potencies, asina que el "problema" esmorezse si asume la lognormalidad.
Per otra parte, hai delles midíes biolóxiques onde s'asume normalidá, tales como la presión sanguínea n'humanos adultos. Esta asunción namái ye posible en dixebrando a homes y muyeres en distintes poblaciones, caúna de les cuales ta de normal distribuyida.
Variables financieres
Yá en 1900 Louis Bachelier propunxo representar los precios de cambéu usando la distribución normal. Esti aproximamientu modificóse dende entós llixeramente. Por causa de la naturaleza multiplicativa del interés compuestu, los indicadores financieros como valores de mercáu y precios de les materies primes exhiben un "comportamientu multiplicativu". Como tales, los sos cambeos periódicos (por casu, cambeos añales) nun son normales, sinón lognormales. Esta ye inda la hipótesis más comúnmente aceptada en economía.
Sicasí, en realidá les variables financieres exhiben coles pesaes y asina, l'asunción de normalidá infravalora la probabilidá d'eventos estremos como quiebres financieres. Suxuriéronse correiciones a esti modelu per parte de matemáticos como Benoît Mandelbrot, quien reparó que los cambeos nel llogaritmu mientres curtios periodos de tiempu (como un día) avérense bien por distribuciones que nun tienen una varianza finita y, poro, el teorema central de la llende nun puede aplicase. Entá más, la suma de munchos de tales cambeos sigue una distribución de log-Levy.
Distribuciones en tests d'intelixencia
Dacuando, la dificultá y númberu d'entrugues nun test d'intelixencia escuéyese de cuenta qu'apurran resultaos de normal distribuyíos. Entá más, les puntuaciones "en crudu" convertir a valores que marquen el cociente intelectual afaciéndoles a la distribución normal. Sía que non trátase d'una resultancia causada deliberadamente pola construcción del test o d'una interpretación de les puntuaciones que suxure normalidá pa la mayoría de la población. Sicasí, la cuestión alrodiu de si la intelixencia en sí ta de normal distribuyida ye más complicada porque se trata d'una variable latente y, poro, nun puede reparase direutamente.
Ecuación d'espardimientu
La función de densidá de la distribución normal ta estrechamente rellacionada cola ecuación d'espardimientu (homoxénea y isótropa) y, por tanto, tamién cola ecuación de calor. Esta ecuación diferencial parcial describe'l tiempu d'evolución d'una función de densidá baxu espardimientu. En particular, la función de densidá de masa
pa la distribución normal con esperanza 0 y varianza t satisfai la ecuación d'espardimientu:
Si la densidá de masa pa un tiempu t = 0 vien dada pola delta de Dirac, lo cual significa, esencialemente que tola masa ta primeramente concentrada nun puntu, entós la función de densidá de masa nel tiempu t va tener la forma de la función de densidá de la normal, con varianza creciendo linealmente con t. Esta conexón nun ye coincidencia: l'espardimientu deber a un movimientu browniano que queda descritu matemáticamente por un procesu de Wiener, y tal procesu nun tiempu t tamién va resultar normal con varianza creciendo linealmente con t'.
Más xeneralmente, si la densidá de masa inicial vien dada por una función φ(x), entós la densidá de masa nun tiempu t va venir dada pola convolución de φ y una función de densidá normal.
Hidroloxía
Na hidroloxía presumir que precipitaciones y descagas de ríos de llarga duración (por casu mensuales o añales) siguen una distribución normal d'alcuerdu al teorema de la llende central. [13]
La imaxe azul ilustra un exemplu del axuste de la distribución normal a datos d'agua mensual d'Ochobre y amuesa los intervalo d'enfotu basaos na distribución binomial.
Usu n'estadística computacional
Xeneración de valores pa una variable aleatoria normal
Pa simulaciones por ordenador ye útil, n'ocasiones, xenerar valores que podríen siguir una distribución anormal. Hai dellos métodos y el más básicu d'ellos ye invertir la función de distribución de la normal estándar p'asina poder realizar la grafica. Conócense otros métodos más eficientes, unu de los cualos ye la tresformamientu de Box-Muller. Un algoritmu inclusive más rápidu ye'l algoritmu zigurat. Dambos alderíquense más embaxo. Un aproximamientu simple a estos métodos ye programalos como sigue: a cencielles súmense 12 esviaciones uniformes (0,1) y réstense 6 (la metá de 12). Esto ye bastante preséu en munches aplicaciones. La suma d'esos 12 valores sigue la distribución de Irwin-Hall; son escoyíos 12 pa dar a la suma una varianza d'unu, esautamente. Les esviaciones aleatories resultantes tán llindaes al rangu (−6, 6) y tienen una densidá que ye una doceava seición d'un aproximamientu polinomial d'undécimu orde a la distribución normal .[14]
El métodu de Box-Muller diz que, si tienes dos númberos aleatorios O y V uniformemente distribuyíos en [0, 1], (por casu, la salida d'un xenerador de númberos aleatorios), entós X y Y son dos variables aleatories estándar de normal distribuyíes, onde:
Esta formulación apaez porque la distribución χ² con dos graos de llibertá (vease la propiedá 4, más arriba) ye una variable aleatoria esponencial fácilmente xenerada (la cual correspuende a la cantidá lnO nestes ecuaciones). Asina, un ángulu escoyíu uniformemente alredor d'un círculu vía la variable aleatoria V y un radiu escoyíu pa ser esponencial tresfórmense entós en coordenaes x y y de normal distribuyíes.
Un métodu muncho más rápido que'l tresformamientu de Box-Muller, pero que sigue siendo exactu ye'l llamáu algoritmu Zigurat, desenvueltu por George Marsaglia. N'alredor del 97% de los casos usa namái dos númberos aleatorios, un enteru aleatoriu y un uniforme aleatoriu, una multiplicación y un test-si . Namái un 3% de los casos onde la combinación d'estos dos cai fora del "corazón del zigurat", un tipu de refuga muestral usando llogaritmos, esponenciales y númberos aleatorios más uniformes tendríen de ser emplegaos.
Hai tamién dalguna investigación sobre la conexón ente la rápida tresformamientu de Hadamard y la distribución normal, en virtú de que'l tresformamientu emplega namái adición y sustracción y pol teorema central de la llende los númberos aleatorios de cuasi cualquier distribución van ser tresformaos na distribución normal. Nesta visión pueden combinase una serie de tresformamientos de Hadamard con permutaciones aleatories pa devolver conxuntos de datos aleatorios de normal distribuyíos.
Aproximamientos numbéricos de la distribución normal y la so función de distribución
La función de distribución normal úsase estensamente en computación científica y estadística. Poro, foi implementada de delles formes.
Abramowitz y Stegun (1964) dan la conocida como "meyor aproximamientu de Hastings" para Φ(x) con x > 0 con un error absolutu |ε(x)| < 7.5·10−8 (algoritmu 26.2.17):
onde ϕ(x) ye la función de densidá de la distribución normal estándar, : y les constantes son b0 = 0.2316419, b1 = 0.319381530, b2 = −0.356563782, b3 = 1.781477937, b4 = −1.821255978, b5 = 1.330274429.
La Biblioteca Científica GNU calcula valores de la función de distribución normal estándar usando aproximamientos por funciones racionales a cachos. Otru métodu d'aproximamientu usa polinomios de tercer grau n'intervalos.[15] L'artículu sobre'l llinguaxe de programación bc apurre un exemplu de cómo computar la función de distribución en GNU bc.
Pa un discutiniu más detalláu sobre cómo calcular la distribución normal, vease la seición 3.4.1C. de The Art of Computer Programming (L'arte de la programación por ordenador), de Knuth.
Ver tamién
- Carl Friedrich Gauss
- Cociente intelectual
- Desenfoque gaussiano y convolución usando la distribución normal como nucleu.
- Distribución χ²
- Distribución loxística
- Distribución log-normal
- Distribución normal multivariante
- Distribución t de Student
- Función gaussiana (campana de Gauss)
- Función logit
- Función probit
- Gráficu de probabilidá normal
- Iannis Xenakis, distribución gaussiana en música
- Procesu de Gauss
- Prueba de Mann-Whitney Métodu non paramétrico qu'avera a una normal
- Tabla distribución normal tipificada
- Tamañu de la muestra
- Teorema Central de la Llende
- Tables estadístiques
Referencies
- ↑ (2007) distribuciones+de+probabilidá&hl=es&sa=X&ved=0ahUKEwj__al99oTYAhXHtRoKHayaD7MQ6AEIJzAA#v=onepage&q=distribuci%C3%B3n%20normal,%20distribuci%C3%B3n%20de%20Gauss%20o%20distribuci%C3%B3n%20gaussiana,%20a%20una%20de%20les%20distribuciones%20de%20probabilidá&f=false Estadística Básica (en castellanu). ITM. ISBN 9789589831410. Consultáu'l 12 d'avientu de 2017.
- ↑ Orrego, Juan José Pumar (2014). so+funci%C3%B3n+de+densidá+tien+una forma acampanada&hl=es&sa=X&ved=0ahUKEwit3puU-ITYAhWIQBQKHQyAAn0Q6AEINDAC#v=onepage&q=gr%C3%A1fica%20de%20el so%20funci%C3%B3n%20de%20densidá%20tien%20una%20forma%20acampanada&f=false LOGISTICA DE SUMINISTRU (en castellanu). Ediciones Paraninfu, S.A.. ISBN 9788497329811. Consultáu'l 12 d'avientu de 2017.
- ↑ Gómez-Chacón, Inés Ma; Català, Claudi Alsina; Raig, Núria Planes; Rodríguez, Joaquim Giménez; Muñoz, Yuly Marsela Vanegas (4 d'ochobre de 2010). Educación matemática y ciudadanía (en castellanu). Grao. ISBN 9788499801667. Consultáu'l 12 d'avientu de 2017.
- ↑ Ye una consecuencia del Teorema Central de la Llende
- ↑ Abraham de Moivre, "Approximatio ad Summam Terminorum Binomii (a + b)n in Seriem expansi" (impresu'l 12 de payares de 1733 en Londres pa una edición privada). Esti panfletu se reimprimió en: (1) Richard C. Archibald (1926) “A rare pamphlet of Moivre and some of his discoveries,” Isis, vol. 8, páxines 671-683; (2) Helen M. Walker, “De Moivre on the law of normal probability” en David Eugene Smith, A Source Book in Mathematics [Nueva York, Nueva York: McGraw-Hill, 1929; reimpresión: Nueva York, Nueva York: Dover, 1959], vol. 2, páxines 566-575.; (3) Abraham De Moivre, The Doctrine of Chances (2ª ed.) [Londres: H. Woodfall, 1738; reimpresión: Londres: Cass, 1967], páxines 235-243; (3ª ed.) [Londres: A Millar, 1756; reimpresión: Nueva York, Nueva York: Chelsea, 1967], páxines 243-254; (4) Florence N. David, Games, Gods and Gambling: A History of Probability and Statistical Ideas [Londres: Griffin, 1962], Apéndiz 5, páxines 254-267.
- ↑ Havil, 2003
- ↑ Wussing, Hans (marzu de 1998). leición d'Historia de les Matemátiques, 1ª (castellán), Sieglu XXI d'España Editores, S.A., páx. 190. ISBN 84-323-0966-4. «"La distribución normal y les sos aplicaciones a la teoría d'errores acomúñase de cutiu col nome de Gauss, quien la afayó -igual que Laplace- independientemente; sicasí yá fuera estudiada por de Moivre»
- ↑ La función Q
- ↑ https://web.archive.org/web/20090325160012/http://www.eng.tau.ac.il/~jo/academic/Q.pdf
- ↑ Weisstein, Eric W. «Normal Distribution Function» (inglés). MathWorld. Wolfram Research.
- ↑ M.A. Sanders. «Characteristic function of the univariate normal distribution». Consultáu'l 6 de marzu de 2009.
- ↑ CumFreq software p'adecuación de distribuciones de probabilidá
- ↑ Ritzema (ed.), H.P. (1994). Frequency and Regression Analysis, páx. 175–224. ISBN 90-70754-33-9.
- ↑ Johnson NL, Kotz S, Balakrishnan N. (1995) Continuous Univariate Distributions Volume 2, Wiley. Equation(26.48)
- ↑ Andy Salter. «B-Spline curves». Consultáu'l 5 d'avientu de 2008.
Enllaces esternos
- Graficadora de la distribución normal - CalEst na Web
- Calculadora de distribuciones (discretes y continues) - CalEst na Web
- Graficadora d'una o delles distribuciones normales - CalEst na Web
- Árees so la curva normal Tabla conteniendo los valores de la función normal
- Calculadora de probabilidaes nuna distribución Normal. Dexa faer cálculos direutos ya inversos.
- DynStats: Llaboratoriu estadísticu online con calculadora de funciones de distribución
- Tabla de la distribución normal Tabla de la distribución normal en formatu PDF
Axuste por software d'una distribución de probabilidá a un conxuntu de datos
- Easy fit, "data analysis & simulation"
- MathWorks Benelux (enllaz rotu disponible n'Internet Archive; ver l'historial y la última versión).
- ModelRisk, "risk modelling software"
- Ricci distributions, fitting distrubutions with R , Vito Ricci, 2005
- Risksolver, automatically fit distributions and parameters to samples
- StatSoft distribution fitting
- CumFreq , llibre ensin costu, inclúi la distribución normal, la lognormal, raigañu-normal, cuadráu-normal, y intervalo d'enfotu a base de la distribución binomial
- Calculadora Distribución normal
- Calcular la probabilidá d'una distribución normal con R (llinguaxe de programación)
- Implementación Real en C del algoritmu Expectation Maximization (EM) pa envalorar Gaussian Mixture Models (GMMs).