Distribución Normal

Esta distribución resulta útil no sólo porque un gran número de distribuciones de frecuencias presentan formas aproximadamente normales, sino también por su gran significado teórico en el campo de la estadística inferencial. En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal:

  • Caracteres morfológicos de individuos: talla, peso,..
  • Caracteres sociológicos: consumo de un cierto producto por un grupo de individuos, puntuaciones de examen…
  • Caracteres psicológicos: cociente intelectual, grado de adaptación a un medio,..
  • Valores estadísticos muestrales: la media.
  • Otras distribuciones como la binomial o la de Poisson son aproximaciones normales.

No obstante, hay que tener cuidado al suponer que un determinado conjunto de observaciones se puede aproximar por una distribución normal.

La distribución normal la obtuvo inicialmente De Moivre en 1733 como límite o aproximación de la distribución quicklatex.com d1b64508754df9c342772ffbc7e22f38 l3 Distribución Normal cuando  quicklatex.com 4d6f7bb021ae3aba4d752454a6e191d6 l3 Distribución Normal . Posteriormente Gauss en 1809 y Laplace en 1812 llegaron a obtenerla empíricamente al estudiar la distribución de errores accidentales en Astronomía y Geodesia.

Una justificación de la frecuente aparición de la distribución normal es el teorema central del limite, que veremos más tarde, que establece que cuando los resultados de un experimento son debidos a un conjunto muy grande de causas independientes, que actúan sumando sus efectos, siendo cada efecto individual de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribución normal

La curva normal responde al tipo de curva perfectamente simétrica, y unimodal basada en un número infinito de casos, por lo que sólo puede ser tratada de forma aproximada cuando se opera con datos reales. Por tratarse de una curva simétrica coinciden la media, la moda y la mediana.

Diremos que la variable aleatoria, de tipo continuo, sigue una distribución Normal de parámetros quicklatex.com c4623a8ffb30030391a6a881e68f5d52 l3 Distribución Normal,  si su función de densidad es:
quicklatex.com d11384466fa4691ed396f629a773e975 l3 Distribución Normal , donde quicklatex.com da77660e9da911e329f947ac81102a7e l3 Distribución Normal y tales que quicklatex.com 04f61ddb5ef73816e8013cc261df8609 l3 Distribución Normal y quicklatex.com 23b0579d5ff652e21e90ed53a1036d5a l3 Distribución Normal

La función de densidad depende de dos parámetros: media y varianza de la distribución, y puede verse por la definición que no hay una única distribución normal sino una familia completa de  distribuciones.
Abreviadamente esta distribución la indicaremos por: quicklatex.com 4b643e42bd96aff145ac1c12f9d41bde l3 Distribución Normal
Se observa que tiene forma de campana, de aquí que frecuentemente se le llame curva o campana de Gauss.
Los parámetros:

  • quicklatex.com f77a39f40b07c4653f91763b32cc9810 l3 Distribución Normal, es el centro de la distribución y también se corresponde con el punto máximo de la distribución.
  • quicklatex.com bf4714900deb52c2df9698a155da3bb8 l3 Distribución Normal, nos da una idea del grado de apertura de la distribución.
 

d normal 4 Distribución Normal

Veamos los siguientes ejemplos:

  • En este caso tenemos dos curvas normales quicklatex.com ca4c70eb247f4164debd49c816e5b78b l3 Distribución Normal y quicklatex.com e3e02199fb622bbbcb1fde9b9857efd5 l3 Distribución Normal  que tienen distintas medias pero tienen la misma desviación típica, por tanto sus centros están en diferentes lugares pero el grado de apertura de ambas distribuciones es el mismo.
  • En este segundo caso tenemos dos curvas normales  quicklatex.com b4fe7e9d14c7e1ac459bde8a0842c485 l3 Distribución Normalquicklatex.com e1e361ed58485a6b5edfee1e152731dd l3 Distribución Normal que tienen distintas desviaciones típicas pero tienen la misma media. Ahora las curvas están centradas en el mismo punto  m  pero su grado de apertura es distinto. Como  d 1 < d 2 la curva de mayor desviación típica, en este caso d 2 tendrá una mayor dispersión.

Características de ésta distribución:

Función de distribución:

quicklatex.com 080caa4f89fe7a4e5c39404593288eb6 l3 Distribución Normal

La integral correspondiente a esta función de distribución sólo puede calcularse mediante métodos numéricos aproximados. Una manera de simplificar estos cálculos es mediante el proceso de tipificación de una variable aleatoria normal, que nos permite pasar de una quicklatex.com 6b3df91ce6623955ad4ff670bee538fd l3 Distribución Normal a una quicklatex.com e5366d69844007d347ff2f17f91e5148 l3 Distribución Normal

La variable normal con media cero y desviación típica la unidad se denomina normal estándar quicklatex.com e5366d69844007d347ff2f17f91e5148 l3 Distribución Normal; su función de distribución está tabulada. Para calcular probabilidades en el caso general, transformaremos la variable aleatoria normal quicklatex.com 75748c51c67cdc4b61cad3587bd0f163 l3 Distribución Normal en la variable normal estándar quicklatex.com 4af809b34beca6a3b4bdd67f3a7d6d03 l3 Distribución Normal, mediante:
quicklatex.com e77f681add2e67339db536fe46b0dca9 l3 Distribución Normal

Si aplicamos el cambio de variable tenemos como función de densidad: 
quicklatex.com 857ba294c7c5a8309169c1562f4ac515 l3 Distribución Normal
y su función de distribución es: 
quicklatex.com 1acbc0d1826a98b9adc9b8fbf25a5831 l3 Distribución Normal
Las características que presenta la normal tipificada son:

  • No depende de ningún parámetro.
  • La curva quicklatex.com 05c30996231302a973b421880d7415db l3 Distribución Normal es  también es simétrica respecto del eje OY.
  • Para realizar la representación gráfica de la función de densidad quicklatex.com 05c30996231302a973b421880d7415db l3 Distribución Normal correspondiente a la normal quicklatex.com e5366d69844007d347ff2f17f91e5148 l3 Distribución Normal procederíamos de forma análoga a como se hizo para la distribución quicklatex.com 6b3df91ce6623955ad4ff670bee538fd l3 Distribución Normal.
Media y Varianza

quicklatex.com 9bef21b10414673af805e3f0e895d960 l3 Distribución Normal

quicklatex.com df84b802d80fcec6e7bc6d7c74055134 l3 Distribución Normal

Cálculo de probabilidades

Sea quicklatex.com 75748c51c67cdc4b61cad3587bd0f163 l3 Distribución Normal una variable aleatoria normal quicklatex.com 6b3df91ce6623955ad4ff670bee538fd l3 Distribución Normal con función de distribución acumulada quicklatex.com f6f3d53f2b8ad4f9a3f4cc7c48e956fd l3 Distribución Normal, y sean quicklatex.com ec6f3b53ed170295a384e9bac3b46426 l3 Distribución Normal y quicklatex.com 0af9a4def6c33b635fc472f3761900c2 l3 Distribución Normal dos posibles valores que verifican que quicklatex.com 42cb4a4709c4745458afb427f8a5bdab l3 Distribución Normal. Entonces: quicklatex.com 32e2c8d43f4ae6b2083de6cfc98f0fa8 l3 Distribución Normal

d normal 3 Distribución Normal

Cualquier probabilidad puede obtenerse a partir de la función de distribución acumulada, sin embargo, como vimos anteriormente calcular la integral correspondiente a esta función de distribución sólo puede hacerse mediante métodos numéricos aproximados. No obstante cualquier distribución normal  puede expresarse como una normal estándar quicklatex.com e5366d69844007d347ff2f17f91e5148 l3 Distribución Normal
quicklatex.com 86095c7212ef4cd19b0ada0d5783fce2 l3 Distribución Normal 
Donde quicklatex.com 4af809b34beca6a3b4bdd67f3a7d6d03 l3 Distribución Normal es una variable aleatoria normal estándar que está tabulada. En esta tabla encontraremos los valores de:
quicklatex.com 1acbc0d1826a98b9adc9b8fbf25a5831 l3 Distribución Normal

d normal 2 Distribución Normal

No debemos olvidar que se trata de una distribución simétrica y que el área bajo la curva normal es igual a la unidad. Por tanto:

  • quicklatex.com 23bc79ad7788968111a6b2d1211fa7b5 l3 Distribución Normal
  • quicklatex.com 5929f7262e064e543f426dfbe808f86c l3 Distribución Normal
  • quicklatex.com 9b5ec22c25348452c5ca478f9ec46d81 l3 Distribución Normal

Valoración de la normalidad

La decisión de describir una distribución mediante una curva normal puede determinar el análisis que posteriormente se haga de los datos. Una forma de ver si los datos son aproximadamente normales es observando su histograma. Este nos puede revelar de forma clara características no normales de una distribución: las asimetrías prolongadas, los vacíos entre datos, etc.
Una forma de valorar si una distribución es normal es señalando los puntos quicklatex.com 50463c5ec6c0d7f6f6e4a9e18f23f15b l3 Distribución Normal en el eje de ordenadas y observando la probabilidad comprendida en estos intervalos. En el caso de una distribución normal quicklatex.com d4ff002f841e2724b90e7e55183a8405 l3 Distribución Normal:

  • El 68,3 % de las observaciones se encuentran entre quicklatex.com ce873f446e1722896b5ca5e92d4da52e l3 Distribución Normal
  • El 95,5 % de las observaciones se encuentran entre quicklatex.com 1e451b6971837ddd4f5271e438ce4455 l3 Distribución Normal 
  • El 97,7 % de las observaciones se encuentran entre quicklatex.com d28435c8cba98b2f8e6e8b1a19c1a786 l3 Distribución Normal 

d normal 1 Distribución Normal

Propiedades de ésta distribución

  • Si quicklatex.com 55ed0ba9bdc5909dd7225d80473dd76d l3 Distribución Normal son variables aleatorias independientes, distribuidas según una quicklatex.com 7f14eeb1d08a9974f37fe8495f5015e1 l3 Distribución Normal, y si quicklatex.com fb9bdc7fce83f50df975b076f275d3dd l3 Distribución Normal, entonces la variable aleatoria: quicklatex.com eec0d92af9828158034de304d6e5a164 l3 Distribución Normal, sigue una distribución:  quicklatex.com 8bf90486ee86132e8a3528088040316a l3 Distribución Normal
  • La suma de n variables aleatorias independientes, quicklatex.com 55ed0ba9bdc5909dd7225d80473dd76d l3 Distribución Normal y distribuidas según una quicklatex.com 7f14eeb1d08a9974f37fe8495f5015e1 l3 Distribución Normal sigue una distribución: quicklatex.com 5c53af7c2483705f58cc33d716514ca0 l3 Distribución Normal
  • Si quicklatex.com 9eb0b80b68d7d0797d04e55a6abef8a7 l3 Distribución Normal son n variables aleatorias independientes e idénticamente distribuidas según una quicklatex.com 1579c2466be357acbb75d35b2c3c512e l3 Distribución Normal, entonces la variable aleatoria suma de las n variables: quicklatex.com 4546d3a5df110d73487cc944ce1ff674 l3 Distribución Normal, sigue una distribución: quicklatex.com cdf725bf086d8e4df45c27094752e136 l3 Distribución Normal
  • Si quicklatex.com 9eb0b80b68d7d0797d04e55a6abef8a7 l3 Distribución Normal son n variables aleatorias independientes e idénticamente distribuidas según una quicklatex.com 1579c2466be357acbb75d35b2c3c512e l3 Distribución Normal, entonces la variable aleatoria media aritmética de estas  n  variables: quicklatex.com f7bf54e1717fd9f998bbacfbb4749e9e l3 Distribución Normal, sigue una distribución: quicklatex.com cd53fd37c29b9c162fd376b2da0d5ae1 l3 Distribución Normal

Aproximación a la distribución normal la distribución binomial

El teorema de Moivre (1.756) permite realizar esta aproximación considerando que las variables aleatorias sigan una distribución binomial con: quicklatex.com 9f2ae3d0f081e371decaf1dbf84756c9 l3 Distribución Normal. Este teorema fue generalizado posteriormente  por Laplace en 1.810 para distribuciones no simétricas quicklatex.com fee694e6b991bb245c22693b5d0cf577 l3 Distribución Normal.

Vimos que la variable aleatoria binomial  era el número de éxitos que tienen lugar cuando se realizan n repeticiones independientes de un experimento o prueba de Bernoulli. La variable aleatoria quicklatex.com 75748c51c67cdc4b61cad3587bd0f163 l3 Distribución Normal puede escribirse como la suma de n variables aleatorias de Bernoulli: quicklatex.com e71adf204f0d71a77d649d2050bcad1a l3 Distribución Normal

Si quicklatex.com 75748c51c67cdc4b61cad3587bd0f163 l3 Distribución Normal es una variable aleatoria binomial, quicklatex.com d1b64508754df9c342772ffbc7e22f38 l3 Distribución Normal, con media quicklatex.com 1db0685902c249b96c52146baf14abb3 l3 Distribución Normal y desviación típica quicklatex.com 006e873606813dc070fdc08bdebc4fb7 l3 Distribución Normal entonces, cuando quicklatex.com 4d6f7bb021ae3aba4d752454a6e191d6 l3 Distribución Normal la variable aleatoria: quicklatex.com abd4eb311fc8fc6fdc2bb14a43b7333f l3 Distribución Normal, es decir: quicklatex.com 0ca1b52b5c97f7cef6b38dd3e821e2cf l3 Distribución Normal 
En la práctica, decir que n es lo suficientemente grande, se traduce en: 
quicklatex.com bb3ea61280f55a0fe3edc50731b78243 l3 Distribución Normal

Lo que se hace es aproximar una distribución discreta, como es la binomial, a una distribución normal que es continua, y ya que en el caso continuo la probabilidad o masa asociada a un valor concreto de la variable aleatoria es nulo, tendremos que utilizar la corrección de continuidad de Fisher para calcular la probabilidad deseada:

Probabilidad en quicklatex.com 9af8a4e8696a58da2687421932148532 l3 Distribución Normal Corrección de continuidad
quicklatex.com 50401656fc2c14495cef21b5a7265d7e l3 Distribución Normal quicklatex.com 1d4b9cc9c1711125c077d910d6802bc5 l3 Distribución Normal
quicklatex.com ca917233ef6fc6621bf4e40565179dd8 l3 Distribución Normal quicklatex.com 45a256a4a9553205aa9f6eb270eac388 l3 Distribución Normal
quicklatex.com b1a2f4789cc7b40364aedd1331305a92 l3 Distribución Normal quicklatex.com 328fa0b3f3846d19eb8506e16fc126ea l3 Distribución Normal
quicklatex.com e6c9648e566a1477883cffedb404f212 l3 Distribución Normal quicklatex.com 8199851cae26a993a1e6665e56f53ec3 l3 Distribución Normal

Aproximación a la distribución normal la distribución de Poisson

En el caso de la distribución de Poisson, la variable aleatoria nos establece el número de veces que ocurre un suceso en un determinado intervalo de tiempo, sabemos que la media y la varianza  de esta distribución coincide con el parámetro quicklatex.com 0205af168a4cc43ea2f9cb2d9559fe4b l3 Distribución Normal.

Si el número de ocurrencias esperadas quicklatex.com 0205af168a4cc43ea2f9cb2d9559fe4b l3 Distribución Normal es elevado y el intervalo de tiempo se divide en subintervalos de idéntica longitud. En ese caso, el número total de ocurrencias es la suma de las ocurrencias de cada subintervalo, y puede verse como la suma de un número moderadamente grande de variables aleatorias, cada una de las cuales representa el número de ocurrencias en un subintervalo del periodo de tiempo, puede utilizarse la distribución normal como una aproximación a la distribución de Poisson. En la práctica la aproximación es aceptable si quicklatex.com 3b74f6e8b95121d40599e3668e0edff3 l3 Distribución Normal.

El procedimiento práctico es análogo al caso de la binomial, así pues si tenemos una variable aleatoria quicklatex.com 75748c51c67cdc4b61cad3587bd0f163 l3 Distribución Normal  que se distribuye según una distribución de Poisson de parámetro quicklatex.com 0205af168a4cc43ea2f9cb2d9559fe4b l3 Distribución Normal, entonces cuando quicklatex.com 3b74f6e8b95121d40599e3668e0edff3 l3 Distribución Normal la variable aleatoria: 
quicklatex.com 28def4abcade21c3d10a29fc3c97124e l3 Distribución Normal, es decir: quicklatex.com 6e13e8d452ae3484e4b8cd34364f578a l3 Distribución Normal

Al igual que en el caso de la distribución binomial es necesario aplicar la corrección de continuidad para calcular las probabilidades.


Comentarios

Distribución Normal — 1 comentario

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>