Estadistica

Problemas resueltos de Estadística II – Parte 1

0
  • Un estudio realizado establece que el número de hijos que tienen las parejas de 25-35 años viene dado por:
Nº de hijos  Problemas resueltos de Estadística II   Parte 1 0 1 2 3
Probabilidad 0,25 k 0,2 0,1

a) Calcular el valor de k para que sea una distribución de probabilidad

b) Obtener la función de distribución

c) Calcular la esperanza y varianza de la variable aleatoria

a) Debe cumplirse que  Problemas resueltos de Estadística II   Parte 1

b)Teniendo en cuenta que la función de distribución  Problemas resueltos de Estadística II   Parte 1

Tendremos:  Problemas resueltos de Estadística II   Parte 1

c)  Problemas resueltos de Estadística II   Parte 1

Teniendo en cuenta que:  Problemas resueltos de Estadística II   Parte 1, calculamos  Problemas resueltos de Estadística II   Parte 1

Luego:  Problemas resueltos de Estadística II   Parte 1


  • Un estudio realizado establece que el número de hijos que tienen las parejas de 25-35 años viene dado por:
 Problemas resueltos de Estadística II   Parte 1

a) Calcular el valor de la constante  Problemas resueltos de Estadística II   Parte 1

b) Poner las probabilidades en forma de table de doble entrada y hallar las correspondientes distribuciones de probabilidades marginales

c) Calcular las distribuciones de probabilidad condicionadas para ambas variables.

a) Debe cumplirse que:

 Problemas resueltos de Estadística II   Parte 1

b)

X \ Y 1 2  Problemas resueltos de Estadística II   Parte 1
1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
2  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
3  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
 Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1

Las funciones de probabilidad marginal son:

 Problemas resueltos de Estadística II   Parte 1

c) Las funciones de probabilidad condicionadas:

 Problemas resueltos de Estadística II   Parte 1
X  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
2  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
3  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
 Problemas resueltos de Estadística II   Parte 1
Y 1 2
 Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
 Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1
 Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1  Problemas resueltos de Estadística II   Parte 1


  • La variable aleatoria bidimensional (X,Y) son los beneficios de una empresa, procedentes de sus exportaciones a dos países diferentes. Sabiendo que X e Y son independientes, con medias de 2 y 4 millones de euros respectivamente y desviación típica de 0,01 millones de euros en ambas. Se pide:

a) ¿Qué beneficio presenta menor coeficiente de variación? Explique el resultado.

b) La esperanza de los beneficios totales: X+Y

c) La desviación típica de los beneficios totales: X+Y. ¿Qué sucede si X e Y no son independientes? Explique su respuesta.

a) Puesto que las desviaciones típicas son iguales, presentará menor coeficiente de variación la variable Y, por tener mayor media. Tenemos:

 Problemas resueltos de Estadística II   Parte 1

b)  Problemas resueltos de Estadística II   Parte 1

c) Como X e Y son independientes,  Problemas resueltos de Estadística II   Parte 1

Si X e Y no fuesen independientes se cumpliría que:  Problemas resueltos de Estadística II   Parte 1


  • La variable aleatoria bidemensional (X,Y) son los beneficios de una empresa, procedentes de sus exportaciones a dos países diferentes. Sabiendo que X e Y son independientes, con medias de 4 y 6 millones de euros respectivamente y desviación típica 0,02 millones de euros en ambas. Se pide:

a) ¿Qué beneficio presenta menor coeficiente de variación? y ¿Cuál es su covarianza? Explique el resultado.

b) La esperanza de los beneficios totales: X+Y

c) La desviación típica de los beneficios totales: X+Y

d) Explique qué sucede con la desviación típica si X e Y no son independientes.

a) Al ser las desviaciones típicas iguales, presenta menor coeficiente de variación la variable cuya media es mayor, esto es, la Y. Dado que las variables son independientes, su covarianza es cero.

b)  Problemas resueltos de Estadística II   Parte 1

c)  Problemas resueltos de Estadística II   Parte 1, de donde la desviación típica de X+Y será:  Problemas resueltos de Estadística II   Parte 1

d)  Problemas resueltos de Estadística II   Parte 1



Fuente: http://personal.telefonica.terra.es/web/imm/homestad.htm

Construcción de intervalos de confianza

0

Supongamos que una compañía dedicada a la producción de piezas para el sector de automoción, quiere analizar la productividad de una de sus plantas industriales y para ello realiza un control de las piezas fabricadas. Mediante el control realizado sobre una muestra aleatoria de piezas, estima que el 10 % de todas las piezas son defectuosas. El gerente que se encuentra con este dato se hace la siguiente pregunta: ¿Puedo estar seguro de que el verdadero porcentaje de piezas defectuosas está entre 5 % y 15 %? Esta clase de preguntas requieren información que va más allá de la contenida en una simple estimación puntual; se trata de buscar un rango de valores entre los que posiblemente se encuentre la cantidad que se estima.

En una estimación por intervalo se define un intervalo dentro del cual puede estar el parámetro desconocido. El intervalo suele ir acompañado de una afirmación sobre el nivel de confianza que se puede asignar a su precisión, por ello se llama intervalo de confianza.

  • Construcción e interpretación de los intervalos de confianza.

Podemos hacernos la siguiente pregunta; ¿Cómo podemos construir un intervalo y afirmar que confiamos al 95,5 %  que ese intervalo contiene  a   Construcción de intervalos de confianza ,  si ni siquiera sabemos cuál es al media poblacional?

d normal 5 Construcción de intervalos de confianza


Viendo el gráfico y recordando la valoración de normalidad que vimos, el 95,5 % de todas las medias muestrales se encontrarán entre  Construcción de intervalos de confianza . No debemos olvidar que a partir de cualquier población podemos obtener muchas muestras diferentes de un mismo tamaño determinado, cada una de ellas con su propia media  Construcción de intervalos de confianza. Todas estas medias muestrales dan lugar a un intervalo de confianza, que podrá incluir o no a la media poblacional. Por consiguiente, si a partir de cualquier media muestral nos desplazamos dos errores típicos por encima y otros dos por debajo de esa media  Construcción de intervalos de confianza, podemos tener una confianza del 95,5 % de que el intervalo resultante contiene a la media poblacional desconocida.

Si tomáramos 100 muestras aleatorias de tamaño  Construcción de intervalos de confianza de la misma población y calculáramos los extremos del intervalo para cada muestra, entonces esperamos que aproximadamente el 95,5% de los intervalos contendrán en su interior el verdadero valor del parámetro  Construcción de intervalos de confianza y el  4,5% restante no lo contendrán. Pero como nosotros, en la práctica, sólo tomamos una muestra aleatoria y por tanto sólo tenemos un intervalo de confianza, no conocemos  si nuestro intervalo es uno del 95,5% o uno del 4,5 %, por eso hablamos de que tenemos un nivel de confianza del 95,5 %.

El valor de  95,5 % recibe el nombre de  nivel de confianza, es el nivel de confianza que tenemos en que el intervalo contiene el valor del parámetro desconocido. Al valor  Construcción de intervalos de confianza se le llama coeficiente de confianza. El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud y con una alta probabilidad de que el parámetro poblacional se encuentre en su interior. Así pues, elegiremos probabilidades cercanas a la unidad, que se representan por  Construcción de intervalos de confianza, y cuyos valores más frecuentes suelen ser: 0,90, 0,95, 0,99., que corresponden al 99%, 95% y 90%

La precisión de la estimación por intervalos vendrá caracterizada por el nivel de confianza y por la amplitud del intervalo:

  • Para un coeficiente de confianza fijo, cuanto más pequeño sea el intervalo de confianza más precisa será la estimación.
  • Para una misma amplitud de intervalo, cuanto mayor sea el coeficiente de confianza mayor será la precisión.

Métodos de obtención de estimadores

0

Los principales métodos de estimación de parámetros de un modelo probabilístico o de coeficientes de un modelos matemático son los siguientes

  • Método de los momentos
  • Método de máxima verosimilitud
  • Mínimos cuadrados

Para la estimación de parámetros de distribuciones de probabilidad, los métodos empleados son los dos primeros, mientras que el segundo se usa principalmente en los estudios de regresión.


Método de los momentos

Es el método más sencillo y antiguo. Se suele utilizar para obtener una primera aproximación de los estimadores. Se igualan tantos momentos muestrales, como parámetros se tengan que estimar.

Propiedades de los estimadores obtenidos por el método de los momentos:

  • Si los parámetros desconocidos son momentos poblacionales, entonces los estimadores obtenidos serán insesgados y asintóticamente normales
  • Bajo condiciones bastantes generales, los estimadores obtenidos serán consistentes.

Método de la máxima verosimilitud

En esencia el método consiste en seleccionar como estimador del parámetro, de un modelo probabilístico, a aquél valor que tiene la propiedad de maximizar el valor de la probabilidad de la muestra observada. Es decir, encontrar el valor del parámetro que maximiza la función de verosimilitud.
Propiedades de los estimadores obtenidos por el método de máxima verosimilitud:

  • Los estimadores de máxima verosimilitud son consistentes.
  • En general no son insesgados, pero si no son insesgados son asintóticamente insesgados (el estimador contenidos 04 clip image002 Métodos de obtención de estimadores converge al parámetro θ, y en el límite coincide con su valor medio, que es el parámetro θ).
  • Todo estimador de máxima verosimilitud no es eficiente, pero sí son asintóticamente eficientes.
  • Son asintóticamente normales.
  • Son suficientes.

Estimación Puntual

0

Objetivo y características fundamentales

En una estimación puntual se utiliza un solo número o valor para determinar una estimación del parámetro poblacional desconocido. En la estimación puntual se asume que el estadístico es un buen estimador del parámetro. Obviamente cualquier estadístico no sirve, es necesario que satisfaga ciertas propiedades:

Propiedades de los estimadores puntuales

1.- Estimador insesgado o centrado y de varianza mínima. Cota de Cramer-Rao

Se dice que un estimador es insesgado o centrado si la media de la distribución muestral del estadístico muestral coincide con el parámetro a estimar. Es decir, si repetimos el proceso de muestreo muchas vedes en promedio el valor que se obtiene de un estimador insesgado será igual al parámetro poblacional. Un estimador es insesgado cuando no existe sesgo entre la esperanza del estimador y el parámetro poblacional, o sea,  la esperanza del estimador es el propio parámetro.

 Estimación Puntual

Para obtener un estimador insesgado de varianza mínima, hay que determinar las varianzas de todos los estimadores insesgados de  Estimación Puntual y seleccionar el que posea la varianza más pequeña. La cota de Cramer Rao permite obtener una cota inferior de la varianza.

 Estimación Puntual

Siendo  Estimación Puntual la función de verosimilitud.

La media, la varianza  y las proporciones muestrales son estimadores insesgados de los correspondientes parámetros poblacionales.

No debemos olvidar que la varianza muestral la hemos definido  Estimación Puntual, para que podamos obtener un estimador insesgado.

2.- Estimador eficiente

Un estimador es eficiente si se cumple que:

  • Es insesgado.  Estimación Puntual
  • Posee varianza mínima. Para calcular si el valor adquirido por la varianza es mínimo, usamos la cota de Cramer-Rao.

Si se tienen dos estimadores insesgados, que siguen las mismas distribuciones, para un mismo tamaño muestral  Estimación Puntual , se dice que uno es más eficiente que el otro cuando su varianza es menor.

 Estimación Puntual

El estimador 1 será más eficiente que el estimador 2. Al ser estimadores insesgados ambas distribuciones muestrales tienen la misma media, luego será más homogénea la distribución que posee menor varianza.

3.- Estimador consistente

La consistencia de un estimador está relacionada con el comportamiento del estimador cuando el tamaño de la muestra aumenta. Es decir, a medida que el tamaño de la muestra aumenta la información que nos proporciona sobre la población será mayor.

Se dice que un estimador es consistente cuando al aumentar el tamaño de la muestra, el valor medio de la distribución muestral del estadístico muestral tiende al parámetro a estimar.

 Estimación Puntual

Así cuando el tamaño de la muestra aumenta la información es más completa y la varianza del estimador suele ser menor, por tanto la distribución muestral de ese estimador tenderá a encontrarse más concentrada alrededor del parámetro que pretendemos estimar.

4.- Estimador suficiente

Este concepto de suficiencia fue introducido por Fisher en 1922, y puede decirse que:

Diremos que un estadístico es suficiente para un parámetro poblacional desconocido cuando recoge toda la información que la muestra contiene sobre el parámetro. Dicho de otra forma: Una vez que sabemos el valor que ha tomado el estadístico, la muestra  Estimación Puntual ya no puede proporcionarnos mas información sobre dicho parámetro. Esto equivale a decir que, si el estadístico es suficiente, la distribución de probabilidad de la muestra condicionada a que conocemos el valor del estadístico , ha de ser independiente del parámetro.

Estimador invariante

Un estimador es invariante si se verifica que el estimador de una función del parámetro es igual a la función del estimador del parámetro.

 Estimación Puntual

Por ejemplo si la varianza muestral es estimador de la varianza poblacional, si el método de estimación es invariante, la desviación típica muestral será estimador de la desviación típica poblacional.

Existen estimadores invariantes a cambios de origen, cambios de escala, o cambios de origen y escala.

Estimador robusto

Un estimador es robusto cuando pequeños cambios en las hipótesis de partida del procedimiento de estimación considerado, no producen variaciones significativas en los resultados obtenidos.

Para estimaciones de la media poblacional, no conociendo la desviación típica muestral, utilizamos el estadística T- Student con  Estimación Puntual grados de libertad, y con un tamaño de muestra relativamente grande:

 Estimación Puntual

Ante pequeñas variaciones en la distribución  Estimación Puntual, no se producen cambios sustanciales en los procedimientos basados en este estadístico.

Si realizamos pequeñas variaciones en la distribución, sí se producen cambios sustanciales para procedimientos que se realicen sobre la varianza poblacional, basados en el estadístico  Estimación Puntual

Muestreo

0

Muestra aleatoria

Una muestra aleatoria simple de tamaño “ n “ consiste en n objetos (individuos) de una población de N objetos ( individuos ), escogidos de manera que cualquier conjunto de n objetos de la población tenga la misma oportunidad de convertirse en la muestra realmente seleccionada.
Una muestra aleatoria simple no sólo da a cada individuo la misma oportunidad de ser escogido evitando por tanto el sesgo en la selección (diremos que el diseño de un estudio es sesgado si favorece sistemáticamente ciertos resultados), sino que también da a cada posible muestra la misma oportunidad de ser escogida.

Puede pensarse en el proceso de muestreo aleatorio simple de la forma siguiente:
Supongamos que los N miembros de la población se introducen en un enorme sombrero y se mezclan concienzudamente. Una muestra aleatoria simple se obtiene extrayendo a  n  de ellos. En la práctica no es necesario hacerlo de este modo, los programas estadísticos pueden escoger una muestra aleatoria simple casi de forma instantánea de una lista de individuos de una población, o también se puede aleatorizar utilizando una tabla de dígitos aleatorios.

Por el momento nos limitaremos a muestras que hayan sido seleccionadas mediante esquemas de muestreo aleatorio simple. Sin embargo, debemos aclarar que este no es el único procedimiento que existe para elegir individuos de una población, y que, en determinadas circunstancias, pueden resultar preferibles esquemas de muestreo alternativos.

Parámetros poblacionales y estadísticos muestrales

Generalmente diremos que los parámetros poblacionales son las características numéricas de la población. En la estadística clásica un parámetro se puede considerar como una constante fija cuyo valor se desconoce. Uno de los problemas más comunes en la estadística inferencial es estudiar una población con una función de distribución  Muestreo donde la forma de la función de distribución es conocida pero depende de un parámetro  Muestreo desconocido, ya que si fuese conocido tendríamos totalmente especificada la función de distribución.

Un estadístico es una variable aleatoria, que es función de las observaciones muestrales y no contiene ningún valor o parámetro desconocido. Continuando con la población de función de distribución  Muestreo , y considerando una muestra aleatoria simple   Muestreo constituida por  Muestreo  variables aleatorias independientes e idénticamente distribuidas  podemos definir como estadísticos:
 Muestreo

 Muestreo

… etc.
Por tanto, parámetro y estadístico son conceptos muy diferentes. Un parámetro es una constante que describe la población y cuando se conoce queda determinado el modelo probabilístico y un estadístico es una variable aleatoria cuyo valor depende de las observaciones muestrales.
Veamos el siguiente cuadro:

Dada una población finita de tamaño N, y una muestra aleatoria simple de tamaño  n,  Muestreo , obtenida de la población de partida, tenemos:

  PARÁMETROS POBLACIONALES ESTADÍSTICOS MUESTRALES
MEDIA  Muestreo  Muestreo
VARIANZA  Muestreo  Muestreo
PROPORCIÓN  Muestreo  Muestreo

Si la población de partida no es finita utilizaremos la misma notación para designar a estos parámetros poblacionales, pero estos no pueden ser calculados a partir de muestras finitas, sino que tendremos que recurrir al cálculo de valores esperados de variables aleatorias de tipo continuo.

La estadística inferencial o inductiva consiste en utilizar un estadístico para llegar a una conclusión o inferencia sobre el parámetro poblacional correspondiente. Por ejemplo, podemos calcular la media aritmética de una muestra, recurriendo al estadístico  Muestreo , y utilizarlo como estimación de la media aritmética de la población  Muestreo; el estadístico se utiliza como estimador del parámetro.

Función de distribución empírica

La función de distribución empírica tiene las mismas propiedades que la función de distribución de la variable aleatoria, lo que implica que cuando el tamaño de la muestra crece, la gráfica de la función de distribución empírica se aproxima bastante a la de la función de distribución de la población, con lo que puede utilizarse como estimador de la misma. 
 Muestreo 
Siendo  Muestreo el número de valores observados menores o iguales que  Muestreo.

Distribución muestral de estadísticos

Es importante recordar que en el análisis estadístico tiene mucha importancia la información obtenida de una muestra representativa de la población: un director de una empresa elige una muestra representativa para determinar el grado de satisfacción que presentan los usuarios de su producto, un partido político selecciona una muestra de ciudadanos para analizar si su programa político producirá los resultados deseados, etc en estos casos los resultados obtenidos sólo son estimaciones de lo que ocurre en toda la población. El valor del estadístico es aleatorio porque depende de los elementos elegidos en la muestra seleccionada y, por lo tanto, el estadístico tiene una distribución de probabilidad la cual llamamos Distribución Muestral del Estadístico. Esta distribución dependerá del tamaño de la muestra, luego podemos decir que existe diferencia entre la distribución de la población de la cual se ha tomado la muestra y la distribución de alguna función de esa muestra.

La distribución muestral de un estadístico se puede obtener tomando todas las posibles muestras de la población de un tamaño fijado n calculando el valor del estadístico para cada una de las muestras y construyendo la distribución de estos valores. Como para cualquier distribución, las dos medidas fundamentales son la media y la desviación típica, también denominada error típico.

En esta asignatura estudiaremos las distribuciones muestrales del los estadísticos media, varianza y proporción muestral, pues son de bastante utilidad en diferentes aplicaciones estadísticas.

Distribución muestral del estadístico media muestral

    Cuando se conoce la varianza poblacional

    Si tenemos una muestra aleatoria de tamaño n procedente de una población con distribución normal  Muestreo entonces la distribución del estadístico media muestral será:
     Muestreo  , si tipificamos  Muestreo
    Si la distribución no es normal, basta que  Muestreo para que la media muestral siga una distribución normal, por el Teorema Central del Límite.

    Cuando no se conoce la varianza poblacional

    Calculamos la varianza muestral y la usamos como varianza poblacional (cuasi varianza)

     Muestreo  Muestreo

    Distribución muestral del estadístico varianza muestral

    A partir de la definición de la cuasivarianza muestral, obtenemos:

    Cuando no se conoce la media poblacional.
     Muestreo
    Cuando se conoce la media poblacional.
     Muestreo
    Estos estadísticos son independientes. Recordar que los grados de libertad, son los números de variables que integran, en este caso, el estadístico.

    Distribución muestral del estadístico proporción muestral

    Sea una muestra aleatoria simple de tamaño n procedente de una población con distribución B(1, p)
     Muestreo

    Si tipificamos:  Muestreo

    demoivre.jpg

    Teorema Central del Límite

    1

    No existe un único Teorema Central del Límite, sino un conjunto de teoremas, todos ellos dando condiciones para que una sucesión de variables aleatorias tienda a distribuirse según una distribución normal. Muchas variables aleatorias que se encuentran en la práctica son sumas o promedios de un número grande de variables aleatorias independientes.

    Consideremos que  Teorema Central del Límite es una sucesión de n variables aleatorias independientes e idénticamente distribuidas, con media  Teorema Central del Límite y varianza  Teorema Central del Límite (ambas finitas). Definimos una nueva variable:  Teorema Central del Límite

    Para cualquier  variable aleatoria, al restar la media y dividir por la desviación típica se obtiene una variable aleatoria tipificada de media 0 y varianza 1:
     Teorema Central del Límite. Cuando  Teorema Central del Límite, entonces podemos decir que  Teorema Central del Límite o bien  Teorema Central del Límite.

    El teorema central del límite tiene un impacto sustancial en la práctica estadística. Afirma que cualquiera que sea la distribución común de un conjunto de variables aleatorias, suponiendo que la media y la varianza son finitas, la suma de un número moderadamente grande de ellas será una variable aleatoria con distribución parecida a la normal.

    1. demoivre Teorema Central del Límite La validez del teorema central del límite no está limitado a variables aleatorias continuas y simétricas, se extiende también a variables aleatorias discretas y asimétricas. Así tenemos el Teorema de Moivre:
    2. Si las variables aleatorias no son independientes o no tienen la misma distribución de probabilidad, en ese caso habrá que utilizar otras condiciones de mayor dificultad que no consideraremos en este caso.

    Otro resultado interesante de este teorema es el siguiente, consideramos que  Teorema Central del Límite es una sucesión de n variables aleatorias independientes e idénticamente distribuidas, con media  Teorema Central del Límite y varianza  Teorema Central del Límite (ambas finitas). Definimos una nueva variable  Teorema Central del Límite que es el promedio de estas variables aleatorias:
     Teorema Central del Límite

    Para cualquier variable aleatoria, al restar la media y dividir por la desviación típica se obtiene una variable aleatoria tipificada de media 0 y varianza 1:
     Teorema Central del Límite Cuando  Teorema Central del Límite entonces podemos decir que  Teorema Central del Límite o bien  Teorema Central del Límite

    Vídeo explicativo de los conceptos:

    distribucionnormal.jpg

    Distribución Normal

    0

    Esta distribución resulta útil no sólo porque un gran número de distribuciones de frecuencias presentan formas aproximadamente normales, sino también por su gran significado teórico en el campo de la estadística inferencial. En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal:

    • Caracteres morfológicos de individuos: talla, peso,..
    • Caracteres sociológicos: consumo de un cierto producto por un grupo de individuos, puntuaciones de examen…
    • Caracteres psicológicos: cociente intelectual, grado de adaptación a un medio,..
    • Valores estadísticos muestrales: la media.
    • Otras distribuciones como la binomial o la de Poisson son aproximaciones normales.

    No obstante, hay que tener cuidado al suponer que un determinado conjunto de observaciones se puede aproximar por una distribución normal.

    La distribución normal la obtuvo inicialmente De Moivre en 1733 como límite o aproximación de la distribución  Distribución Normal cuando   Distribución Normal . Posteriormente Gauss en 1809 y Laplace en 1812 llegaron a obtenerla empíricamente al estudiar la distribución de errores accidentales en Astronomía y Geodesia.

    Una justificación de la frecuente aparición de la distribución normal es el teorema central del limite, que veremos más tarde, que establece que cuando los resultados de un experimento son debidos a un conjunto muy grande de causas independientes, que actúan sumando sus efectos, siendo cada efecto individual de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribución normal

    La curva normal responde al tipo de curva perfectamente simétrica, y unimodal basada en un número infinito de casos, por lo que sólo puede ser tratada de forma aproximada cuando se opera con datos reales. Por tratarse de una curva simétrica coinciden la media, la moda y la mediana.

    Diremos que la variable aleatoria, de tipo continuo, sigue una distribución Normal de parámetros  Distribución Normal,  si su función de densidad es:
     Distribución Normal , donde  Distribución Normal y tales que  Distribución Normal y  Distribución Normal

    La función de densidad depende de dos parámetros: media y varianza de la distribución, y puede verse por la definición que no hay una única distribución normal sino una familia completa de  distribuciones.
    Abreviadamente esta distribución la indicaremos por:  Distribución Normal
    Se observa que tiene forma de campana, de aquí que frecuentemente se le llame curva o campana de Gauss.
    Los parámetros:

    •  Distribución Normal, es el centro de la distribución y también se corresponde con el punto máximo de la distribución.
    •  Distribución Normal, nos da una idea del grado de apertura de la distribución.
     

    d normal 4 Distribución Normal

    Veamos los siguientes ejemplos:

    • En este caso tenemos dos curvas normales  Distribución Normal y  Distribución Normal  que tienen distintas medias pero tienen la misma desviación típica, por tanto sus centros están en diferentes lugares pero el grado de apertura de ambas distribuciones es el mismo.
    • En este segundo caso tenemos dos curvas normales   Distribución Normal Distribución Normal que tienen distintas desviaciones típicas pero tienen la misma media. Ahora las curvas están centradas en el mismo punto  m  pero su grado de apertura es distinto. Como  d 1 < d 2 la curva de mayor desviación típica, en este caso d 2 tendrá una mayor dispersión.

    Características de ésta distribución:

    Función de distribución:
     Distribución Normal

    La integral correspondiente a esta función de distribución sólo puede calcularse mediante métodos numéricos aproximados. Una manera de simplificar estos cálculos es mediante el proceso de tipificación de una variable aleatoria normal, que nos permite pasar de una  Distribución Normal a una  Distribución Normal

    La variable normal con media cero y desviación típica la unidad se denomina normal estándar $N(0,1)$; su función de distribución está tabulada. Para calcular probabilidades en el caso general, transformaremos la variable aleatoria normal  Distribución Normal en la variable normal estándar  Distribución Normal, mediante:
     Distribución Normal

    Si aplicamos el cambio de variable tenemos como función de densidad: 
     Distribución Normal
    y su función de distribución es: 
     Distribución Normal
    Las características que presenta la normal tipificada son:

    • No depende de ningún parámetro.
    • La curva  Distribución Normal es  también es simétrica respecto del eje OY.
    • Para realizar la representación gráfica de la función de densidad  Distribución Normal correspondiente a la normal  Distribución Normal procederíamos de forma análoga a como se hizo para la distribución  Distribución Normal.
    Media y Varianza
     Distribución Normal  Distribución Normal

    Cálculo de probabilidades

    Sea  Distribución Normal una variable aleatoria normal  Distribución Normal con función de distribución acumulada  Distribución Normal, y sean  Distribución Normal y  Distribución Normal dos posibles valores que verifican que  Distribución Normal. Entonces:  Distribución Normal

    d normal 3 Distribución Normal

    Cualquier probabilidad puede obtenerse a partir de la función de distribución acumulada, sin embargo, como vimos anteriormente calcular la integral correspondiente a esta función de distribución sólo puede hacerse mediante métodos numéricos aproximados. No obstante cualquier distribución normal  puede expresarse como una normal estándar  Distribución Normal
     Distribución Normal 
    Donde  Distribución Normal es una variable aleatoria normal estándar que está tabulada. En esta tabla encontraremos los valores de:
     Distribución Normal

    d normal 2 Distribución Normal

    No debemos olvidar que se trata de una distribución simétrica y que el área bajo la curva normal es igual a la unidad. Por tanto:

    •  Distribución Normal
    •  Distribución Normal
    •  Distribución Normal

    Valoración de la normalidad

    La decisión de describir una distribución mediante una curva normal puede determinar el análisis que posteriormente se haga de los datos. Una forma de ver si los datos son aproximadamente normales es observando su histograma. Este nos puede revelar de forma clara características no normales de una distribución: las asimetrías prolongadas, los vacíos entre datos, etc.
    Una forma de valorar si una distribución es normal es señalando los puntos  Distribución Normal en el eje de ordenadas y observando la probabilidad comprendida en estos intervalos. En el caso de una distribución normal  Distribución Normal:

    • El 68,3 % de las observaciones se encuentran entre  Distribución Normal
    • El 95,5 % de las observaciones se encuentran entre  Distribución Normal 
    • El 97,7 % de las observaciones se encuentran entre  Distribución Normal 

    d normal 1 Distribución Normal

    Propiedades de ésta distribución

    • Si  Distribución Normal son variables aleatorias independientes, distribuidas según una  Distribución Normal, y si  Distribución Normal, entonces la variable aleatoria:  Distribución Normal, sigue una distribución:   Distribución Normal
    • La suma de n variables aleatorias independientes,  Distribución Normal y distribuidas según una  Distribución Normal sigue una distribución:  Distribución Normal
    • Si  Distribución Normal son n variables aleatorias independientes e idénticamente distribuidas según una  Distribución Normal, entonces la variable aleatoria suma de las n variables:  Distribución Normal, sigue una distribución:  Distribución Normal
    • Si  Distribución Normal son n variables aleatorias independientes e idénticamente distribuidas según una  Distribución Normal, entonces la variable aleatoria media aritmética de estas  n  variables:  Distribución Normal, sigue una distribución:  Distribución Normal

    Aproximación a la distribución normal la distribución binomial

    El teorema de Moivre (1.756) permite realizar esta aproximación considerando que las variables aleatorias sigan una distribución binomial con:  Distribución Normal. Este teorema fue generalizado posteriormente  por Laplace en 1.810 para distribuciones no simétricas  Distribución Normal.

    Vimos que la variable aleatoria binomial  era el número de éxitos que tienen lugar cuando se realizan n repeticiones independientes de un experimento o prueba de Bernoulli. La variable aleatoria  Distribución Normal puede escribirse como la suma de n variables aleatorias de Bernoulli:  Distribución Normal

    Si  Distribución Normal es una variable aleatoria binomial,  Distribución Normal, con media  Distribución Normal y desviación típica  Distribución Normal entonces, cuando  Distribución Normal la variable aleatoria:  Distribución Normal, es decir:  Distribución Normal 
    En la práctica, decir que n es lo suficientemente grande, se traduce en: 
     Distribución Normal

    Lo que se hace es aproximar una distribución discreta, como es la binomial, a una distribución normal que es continua, y ya que en el caso continuo la probabilidad o masa asociada a un valor concreto de la variable aleatoria es nulo, tendremos que utilizar la corrección de continuidad de Fisher para calcular la probabilidad deseada:

    Probabilidad en  Distribución Normal Corrección de continuidad
     Distribución Normal  Distribución Normal
     Distribución Normal  Distribución Normal
     Distribución Normal  Distribución Normal
     Distribución Normal  Distribución Normal

    Aproximación a la distribución normal la distribución de Poisson

    En el caso de la distribución de Poisson, la variable aleatoria nos establece el número de veces que ocurre un suceso en un determinado intervalo de tiempo, sabemos que la media y la varianza  de esta distribución coincide con el parámetro  Distribución Normal.

    Si el número de ocurrencias esperadas  Distribución Normal es elevado y el intervalo de tiempo se divide en subintervalos de idéntica longitud. En ese caso, el número total de ocurrencias es la suma de las ocurrencias de cada subintervalo, y puede verse como la suma de un número moderadamente grande de variables aleatorias, cada una de las cuales representa el número de ocurrencias en un subintervalo del periodo de tiempo, puede utilizarse la distribución normal como una aproximación a la distribución de Poisson. En la práctica la aproximación es aceptable si  Distribución Normal.

    El procedimiento práctico es análogo al caso de la binomial, así pues si tenemos una variable aleatoria  Distribución Normal  que se distribuye según una distribución de Poisson de parámetro  Distribución Normal, entonces cuando  Distribución Normal la variable aleatoria: 
     Distribución Normal, es decir:  Distribución Normal

    Al igual que en el caso de la distribución binomial es necesario aplicar la corrección de continuidad para calcular las probabilidades.

    Distribución Uniforme Continua

    0

    Es la más sencilla de las distribuciones continuas, surge al considerar una variable aleatoria que toma valores equiprobables en un intervalo finito. Su nombre se debe al hecho de que la densidad de probabilidad de esta variable aleatoria es uniforme sobre todo su intervalo de definición.

    La distribución uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad.

    Diremos que una variable aleatoria sigue una distribución uniforme en un intervalo  Distribución Uniforme Continua, con  Distribución Uniforme Continua si la probabilidad de que la variable aleatoria tome un valor en cualquier subintervalo es proporcional a la longitud del subintervalo.

    La función de densidad es:
     Distribución Uniforme Continua
    Abreviadamente esta distribución la indicaremos por:  Distribución Uniforme Continua

    Características:

    Función de distribución:

     Distribución Uniforme Continua

    Media y Varianza

     Distribución Uniforme Continua

     Distribución Uniforme Continua

     Distribución Uniforme Continua

     Distribución Uniforme Continua

     Distribución Uniforme Continua

    Distribución de Poisson

    0

    Consideramos un experimento en el que observamos la aparición de sucesos puntuales sobre un soporte continuo. Suponemos que el proceso se caracteriza por:

    1. Es estable, produce a largo plazo un número medio de sucesos constante  Distribución de Poisson por unidad de tiempo, espacio, área…
    2. Los sucesos aparecen aleatoriamente de forma independiente, es decir, el proceso no tiene memoria: conocer el número de sucesos en un intervalo no ayuda a predecir el número de sucesos en el siguiente.

    Definimos una variable aleatoria de Poisson como el número de sucesos de un intervalo de longitud fija. En este caso, la distribución de probabilidad de la variable aleatoria de Poisson depende solamente del número  Distribución de Poisson de resultados que ocurren en un intervalo.

    Diremos que la variable aleatoria x sigue una distribución de Poisson de parámetro  Distribución de Poisson, si su distribución es:  Distribución de Poisson

    Características:

    Función de distribución

     Distribución de Poisson

    Media y Varianza

    •  Distribución de Poisson
    •  Distribución de Poisson

    Propiedad reproductiva

    Si  Distribución de Poisson y  Distribución de Poisson son dos variables independientes distribuidas según una distribución de Poisson,  Distribución de Poisson y  Distribución de Poisson respectivamente, entonces la variable aleatoria:  Distribución de Poisson se distribuye según una distribución Poisson de parámetro  Distribución de Poisson,  Distribución de Poisson

    Distribución Binomial

    0

    La repetición de un experimento juega un papel muy importante en probabilidad, y en estadística. Una generalización de la distribución de Bernoulli se obtiene cuando el experimento o prueba de Bernoulli se repite varias veces. Por tanto, estamos ante un experimento binomial cuando repetimos n veces de forma independiente un ensayo de Bernoulli. Conceptualmente la distribución B(n,p) describe situaciones que se pueden presentar si un mismo suceso dicotómico se observa o se repite n veces y si los posibles resultados en cada ocasión son independientes de los que puedan lograrse en las demás.

    Definimos la variable aleatoria binomial x, como el número de éxitos que tienen lugar cuando se realizan en repeticiones independientes de un experimento o prueba de Bernoulli.

    Para obtener su función de probabilidad, consideramos que al realizar n repeticiones independientes del experimento hemos obtenido x resultados de éxito (con probabilidad p) y n-x resultados de fracaso con probabilidad q=1-p

     Distribución Binomial

    La probabilidad de x elementos de éxito en cualquier orden, requiere sumar las probabilidades de todos los sucesos mutuamente excluyentes que verifican esta condición.

    Estos sucesos se obtienen permutando las letras anteriores de todas las posibles formas:

     Distribución Binomial

    Diremos que una variable aleatoria x sigue una distribución binomial de parámetros n y p si su distribución de probabilidad está dada por:

     Distribución Binomial

    Abreviadamente esta distribución la indicaremos por:  Distribución Binomial o bien  Distribución Binomial

    Características:

    Función de distribución

     Distribución Binomial

    Media y Varianza

    Para obtener la media y la varianza de la distribución tenemos que tener en cuenta que la variable aleatoria binomial tenemos que tener en cuenta que la variable aleatoria binomial esté definida como el número de éxitos que tienen lugar cuando se realizan n repeticiones independientes de un experimento o prueba de Bernoulli, es decir, como suma de n variables independientes:  Distribución Binomial

    •  Distribución Binomial
    •  Distribución Binomial

    Propiedad reproductiva:

    Si  Distribución Binomial y  Distribución Binomial son dos variables aleatorias independientes distribuidas:  Distribución Binomial y  Distribución Binomial, entonces la variable aleatoria  Distribución Binomial se distribuye según una  Distribución Binomial

    Distribución de Bernoulli

    0

    Este modelo se utiliza principalmente en situaciones en las que solo pueden ocurrir dos resultados posibles mutuamente excluyentes, uno de ellos de probabilidad p y el otro de probabilidad q=1-p

    Supongamos un experimento consistente en observar elementos de una población, con las siguientes características:

    • Mediante esta observación los elementos sólo pueden clasificarse en dos categorías, que generalmente se llamarán "éxito" al suceso de probabilidad p y "fracaso" al suceso de probabilidad q=1-p
    • La proporción de sucesos "éxito" y "fracaso" en la población es constante y no se modifica cualquiera que sea la cantidad observada. Esto implica que los elementos se reemplazan una vez observados en la población.
    • Las observaciones son independientes, la probabilidad de "éxito" es siempre la misma, no se modifica.

    Diremos que una variable aleatoria X sigue una distribución de Bernoulli de parámetro p si su distribución de probabilidad está dada por:  Distribución de Bernoulli

    La variable aleatoria X quedará definida como:

     Distribución de Bernoulli

    Abreviadamente:  Distribución de Bernoulli ó  Distribución de Bernoulli

    Características:

    I. Función de distribución:  Distribución de Bernoulli
    II. Media:  Distribución de Bernoulli
    III. Varianza:  Distribución de Bernoulli
    IV. Función generatriz de momentos:  Distribución de Bernoulli

    Exámenes de Estadística II

    0


    Partes del Temario al que corresponden las preguntas del examen.

    Examen Resuelto:

    Teoría

    Práctica

    2008 – Febrero – 1ª Semana

    1, 3, 3, 3

    1, 3

    2008 – Febrero – 2ª Semana

    3, 1, 1, 3

    1, 2

    2008 – Septiembre

    1, 2, 3, 3

    2, 3

    2008 – Septiembre – Reserva

    1, 3, 1, 3

    1, 3

    2009 – Febrero – 1ª Semana

    1, 1, 1, 3

    1, 2

    2009 – Septiembre

    1, 2, 3, 3

    2, 2

    2010 – Febrero – 1ª Semana

    1, 1, 2, 3

    2, 2

    2010 – Febrero – 2ª Semana

    1, 3, 3, 3

    3, 2

    2010 – Septiembre

    1, 1, 3, 3

    1, 2

    Parte

    Nº Preguntas

    % del Total



    Teoría

    1

    15

    41,67%

    2

    3

    8,33%

    3

    18

    50,00%



    Práctica

    1

    5

    27,78%

    2

    9

    50,00%

    3

    4

    22,22%

    Regresión y correlación lineal simple

    0

    Regresión lineal simple

    La regresión lineal simple nos permitirá pasar de una dependencia estadística a una funcional con las siguientes características:

    • La función a estimar es lineal
    • Existe una variable explicativa o exógena
    • En la exposición nos referimos a una tabla de correlación de frecuencias unitarias
    • Se empleará el ajuste mínimo-cuadrático para estimar la ecuación de la recta:  Regresión y correlación lineal simple

    Las rectas de regresión serán:

     Regresión y correlación lineal simple   ;    Regresión y correlación lineal simple

    donde,

     Regresión y correlación lineal simple y  Regresión y correlación lineal simple

    Correlación lineal simple

    La teoría de la correlación estudia el grado de asociación existente entre las dos variables, es decir, la intensidad de la dependencia entre las mismas.

    Relación entre las varianzas

    Varianza de la variable dependiente  Regresión y correlación lineal simple
    Varianza explicada por la regresión  Regresión y correlación lineal simple
    Varianza residual  Regresión y correlación lineal simple

    Coeficiente de determinación

     Regresión y correlación lineal simple

    Coeficiente de correlación simple

     Regresión y correlación lineal simple

    Estudio descriptivo de las series temporales

    0

    Una serie temporal es un conjunto de datos de una determinada magnitud económica, ordenados a lo largo del tiempo.

    Cada uno de los valores de una serie temporal puede considerarse el resultado de componer (mediante suma o multiplicación) una serie de valores entre los cuales los más importantes son:

    • Componente secular o tendencia: Refleja la evolución de la serie a largo plazo.
    • Componente estacional: Recoge las oscilaciones periódicas periódicas de periodo igual o inferior a un año. Si el periodo marco es el año, pueden observarse variaciones estacionales de periodo cuatrimestral, trimestral o mensual. Si el periodo marco es el mes, pueden observarse variaciones estacionales de periodo semanal o diario, etc…
    • Componente cíclica: Recoge las oscilaciones periódicas no regulares de la serie, de periodo superior al año.
    • Componente accidental: Recoge las oscilaciones ocasionales que se producen por cause de fenómenos imprevisibles.

    Determinación de la tendencia

    • Método gráfico: Representado en abscisas los periodos y en ordenadas los valores, basta unir con una poligonal los puntos obtenidos.
    • Método de las medias móviles: Se obtiene la media aritmética de cada r periodos consecutivos. Si r es impar, dicha media se le asigna al periodo intermedio; si r es par, vuelven a promediarse cada dos medias consecutivas.
    • Método de los mínimos cuadrados: Consiste en ajustar una recta de regresión mínimo cuadrática a la serie de promedios anuales.

    Determinación de las variaciones estacionales

    Su determinación se efectúa mediante la construcción de un índice, para lo cual existen diversos métodos según el que el carácter de la serie sea multiplicativo o aditivo.

    Si es multiplicativo se utiliza el método de la razón a la media móvil mediante el que se eliminan de la serie las componentes tendencia, ciclo y accidental y seguidamente se construye el índice de variación estacional.

    Si es aditivo se calcula la tendencia por ajuste mínimo cuadrático, se corrigen a continuación las medias estacionales y finalmente se construye el índice de variación estacional.

    Determinación de las variaciones cíclicas

    Los movimientos cíclicos no suelen ser regulares y su determinación comprende ciertas dificultades.

    Aun así, se puede tratar de aislar el ciclo bajo la hipótesis multiplicativa dejándolo como residuo con la eliminación de la tendencia y la variación estacional. Los pasos serían:

    1. Estimar la tendencia
    2. Calcular los índices de variación estacional
    3. Se desestacionaliza la serie observada
    4. Se elimina la tendencia dividiendo cada valor desestacionalizado por la serie de tendencia

    El proceso finalizaría intentando eliminar la componente accidental.

    curvadelorentz.gif

    Medidas de concentración

    0

    Índice de concentración de Gini

    Consideramos la variable estadística  Medidas de concentración donde cada valor  Medidas de concentración es la renta de los $n_i$ individuos, siendo  Medidas de concentración. Sea  Medidas de concentración, es decir, la renta total de los individuos con renta  Medidas de concentración y sea  Medidas de concentración el porcentaje que dicho total representa respecto de la renta total, a saber  Medidas de concentración.

    Por otra parte, sea  Medidas de concentración el porcentaje de individuos con renta  Medidas de concentración, es decir,  Medidas de concentración. Se define el índice de concentración de Gini:

     Medidas de concentración

    Para obtener el Índice es conveniente construir la siguiente tabla:

     Medidas de concentración  Medidas de concentración  Medidas de concentración  Medidas de concentración  Medidas de concentración  Medidas de concentración  Medidas de concentración  Medidas de concentración

     

    Casos extremos:

    •  Medidas de concentración La concentración de la renta es mínima, es decir, la renta está equidistribuida.
    •  Medidas de concentración La concentración de la renta es máxima, es decir, un sólo individuo percibe toda la renta.

    El índice de Gini permanece acotado entre 0 y 1. Se puede calcular en distribuciones de frecuencias unidimensionales de variable cuantitativa y da una medida de la mayor o menor concentración de los valores de la variable. La concentración no debe confundirse con lo contrario de la dispersión.

    Curva de Lorentz

    Es la representación gráfica del índice de Gini. La curva de Lorenz es la poligonal que une los puntos:  Medidas de concentración

    El caso de equidistribución corresponde de la renta, la curva corresponde a la diagonal (0,0)-(100,100), y el caso de concentración máxima corresponde a la curva que une (0,0), (100,0) y (100,100)

    curvadelorentz thumb Medidas de concentración

    asimetria.gif

    Medidas de asimetría y curtosis

    0

    Coeficiente de asimetría de Fisher

    Es una medida de asimetría para variables estadísticas. Se dice que una distribución es simétrica si el diagrama de barras que representa es simétrico respecto de la recta  Medidas de asimetría y curtosis

    La simetría implica que  Medidas de asimetría y curtosis, si además es unimodal:  Medidas de asimetría y curtosis

     Medidas de asimetría y curtosis

    Casos:

    • Si  Medidas de asimetría y curtosis la distribución puede ser simétrica.
    • Si  Medidas de asimetría y curtosis la distribución es asimétrica negativa o a la izquierda.
    • Si  Medidas de asimetría y curtosis la distribución es asimétrica positiva o a la derecha.

    asimetria thumb Medidas de asimetría y curtosis

    Coeficiente de curtosis de Fisher

    La curtosis o apuntalamiento surge al comparar la forma de una variable estadística con respecto a la distribución normal.

     Medidas de asimetría y curtosis

    Casos:

    • Si  Medidas de asimetría y curtosis Distribución leptocúrtica.
    • Si  Medidas de asimetría y curtosis Distribución mesocúrtica.
    • Si  Medidas de asimetría y curtosis Distribución platicútica.

    curtosis thumb Medidas de asimetría y curtosis

    Medidas de dispersión

    0

    Tratan de medir lo más o menos esparcida se encuentra la variable estadística.

    Recorrido, rango o intervalo de variación

     Medidas de dispersión

    Intervalos intercuartílicos:

    • Intervalo intercuartílico:  Medidas de dispersión
    • Intervalo semiintercuartílico:  Medidas de dispersión
    • Intervalo intercuartílico relativo:  Medidas de dispersión

    Medidas de dispersión respecto a la media aritmética:

    • Desviación absoluta respecto a la media aritmética:
    • Varianza:  Medidas de dispersión
    • Desviación típica:  Medidas de dispersión
    • Coeficiente de variación de Pearson:  Medidas de dispersión

    La varianza:

    Considerados los valores  Medidas de dispersión de una variable con frecuencias respectivas  Medidas de dispersión, siendo  Medidas de dispersión, cuya media aritmética representamos por  Medidas de dispersión, denominamos varianza a  Medidas de dispersión. Se trata de una medida dispersión puesto que expresa el promedio de los cuadrados de las desviaciones de cada valor respecto de su media aritmética.

    Propiedades:

    • Positividad:  Medidas de dispersión
    • Si  Medidas de dispersión, entonces  Medidas de dispersión
    • La varianza no se afectada por los cambios de origen pero sí por los de escala. Es decir, si  Medidas de dispersión, entonces  Medidas de dispersión
    • Método abreviado de cálculo, en función a los momentos respecto del origen:  Medidas de dispersión

    Distribuciones de frecuencias unidimensionales

    0

    Distribuciones de frecuencias unidimensionales con los datos no agrupados

    Definiciones:

    Llamamos distribución de frecuencias unidimensional unitaria de la característica X al conjunto de los r datos distintos y ordenados de menor a mayor de forma que ninguno está repetido.

    Llamamos distribución de frecuencias unidimensional de la característica X al conjunto de los r datos distintos, ordenados de menor a mayor, acompañados de sus respectivas frecuencias absolutas.

    Llamamos frecuencia total o total de datos, y la denotaremos por N a la suma de todas las frecuencias absolutas:  Distribuciones de frecuencias unidimensionales

    Llamamos frecuencia relativa del valor de la variable  Distribuciones de frecuencias unidimensionales al cociente entre la frecuencia absoluta de dicho valor y el número total de datos N:  Distribuciones de frecuencias unidimensionales

    Llamamos frecuencia absoluta acumulada ascendente  Distribuciones de frecuencias unidimensionales de un determinado valor de la variable ordenado de menor a mayor al número de datos que son menores o iguales a él:  Distribuciones de frecuencias unidimensionales

    Llamamos frecuencia absoluta acumulada descendente  Distribuciones de frecuencias unidimensionales de un determinado valor ordenado al número de datos que son mayores que él:  Distribuciones de frecuencias unidimensionales

     Distribuciones de frecuencias unidimensionales

    Las frecuencias relativas acumuladas tanto ascendentes como descendentes se definen igual sólo que se suman las  Distribuciones de frecuencias unidimensionales en vez de las  Distribuciones de frecuencias unidimensionales

     Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales

    Estos conceptos nos dan la siguiente tabla genérica, de la cuál pueden obtenerse las tablas parciales que se deseen.

     Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales  Distribuciones de frecuencias unidimensionales

    Distribuciones de frecuencias unidimensionales con los datos agrupados en intervalos de clases

    Recorrido de la variable X:  Distribuciones de frecuencias unidimensionales

    Una vez determinados los datos máximo y mínimo podemos agrupar los datos del siguiente modo:

     Distribuciones de frecuencias unidimensionales

    Amplitud del intervalo:  Distribuciones de frecuencias unidimensionales, se verifica que:  Distribuciones de frecuencias unidimensionales

    Amplitud común:  Distribuciones de frecuencias unidimensionales

    Llamamos marca de clase del intervalo a su punto medio:  Distribuciones de frecuencias unidimensionales

    Características de las variables aleatorias

    0

    Valor Esperado o Esperanza Matemática

    En el caso discreto representa la media ponderada de los posible valores que puede tomar la variable aleatoria X.

    En el caso continuo representa el centro de la función de densidad.

    Para ambos casos es necesaria la condición de convergencia absoluta, es decir, que tengan un valor finito.

    · Caso Discreto:  Características de las variables aleatorias

    · Caso Continuo:  Características de las variables aleatorias

    Propiedades:

    • La esperanza de una constante es la propia constante.
    •  Características de las variables aleatorias
    •  Características de las variables aleatorias
    • Si tenemos dos funciones:
       Características de las variables aleatorias
    • Si X es una variable aleatoria con distribución simétrica respecto a un punto c, entonces si existe, su esperanza  Características de las variables aleatorias

    Valor esperado de una función de una variable aleatoria

    En este caso se calcula el valor esperado de una función, a diferencia del caso anterior en el que se calculaba el valor esperado de una variable.

    · Caso Discreto:  Características de las variables aleatorias

    · Caso Continuo:  Características de las variables aleatorias

    Momentos

    • Con respecto al origen:
     Características de las variables aleatorias
    • Con respecto a la media o momento central:

    $latex

    Importante:

     Características de las variables aleatorias  Características de las variables aleatorias

    Varianza

    Es el momento central o con respecto a la media de orden dos. Es una medida de dispersión absoluta de los valores de la distribución con respecto a su media, nos indica cómo representa la media a la distribución. Como la varianza se encuentra representada en una unidad distinta a la media, se introduce la desviación típica:  Características de las variables aleatorias

    La varianza está influenciada por el tamaño de los valores que toma y por la media.

    PROPIEDADES:

    •  Características de las variables aleatorias
    • La variación de una constante es cero.
    •  Características de las variables aleatorias
    • Si X e Y son dos variables aleatorias independientes, cuyas varianzas existen, entonces se verifica:  Características de las variables aleatorias
    • La varianza nunca es negativa.

    Coeficiente de variación

    Para eliminar la influencia que tiene la media con respecto a la varianza, se utiliza otra medida de dispersión, esta vez relativa, que expresa la dispersión de una variable aleatoria respecto a su media. Con el coeficiente de variación podemos comparar dos distribuciones distintas de probabilidad.

     Características de las variables aleatorias

    El coeficiente no tendrá sentido, cuando la variable aleatoria X, tome valores positivos y negativos, (la media puede quedar compensada), sólo cuando tome valores positivos.

    Cambios de origen y escala

    A veces es necesario para facilitar los cálculos, realizar cambios de origen y escala.

    Con respecto a la varianza:  Características de las variables aleatorias

    Por lo tanto, no le afectan los cambios de origen, pero si los de escala.

    Con respecto a la coeficiente de variación:  Características de las variables aleatorias

    Por lo tanto, no le afectan los cambios de escala, pero si los de origen, exceptuando que  Características de las variables aleatorias

    Tipificación de una variable

    Las distribuciones poseen en general distintas medidas de posición y de dispersión. Puede ocurrir que muchas distribuciones sean análogas, o sea, sólo se diferencian en sus orígenes o en sus escalas.

    Cuando queremos comparar estas distribuciones debemos hacerlas homogéneas, a través de la normalización o tipificación.

     Características de las variables aleatorias

    Es necesario que  Características de las variables aleatorias Z no tiene asignada ninguna medida, con lo que puede compararse con otras variables tipificadas.

    Otras medidas de posición y dispersión

    • Cuantiles: medidas, deciles, percentiles

    · Caso discreto:  Características de las variables aleatorias

    · Caso continuo:  Características de las variables aleatorias

    ·  Características de las variables aleatorias

    • Moda: Será aquel valor de la variable para el cual la función de probabilidad o la función de densidad se hace máxima:  Características de las variables aleatorias
    • Desviación absoluta media respecto a la mediana
     Características de las variables aleatorias
    • Recorrido intercuartílico:  Características de las variables aleatorias, dentro de este intervalo intercuartílico se encuentran el 50% de los valores centrales de la variable, prescindiendo del 25% de los valores más pequeños y el 25% de los valores más grandes.

    Medidas de forma

    • Coeficiente de asimetría de Fisher:  Características de las variables aleatorias

     

    • Coeficiente de curtosis o apuntalamiento:  Características de las variables aleatorias

    Teorema de Markov y desigualdad de Chebychev

    Se utilizan cuando conocemos la media y varianza de una ditribución desconocida y queremos calcular cotas superiores de ciertas probabilidades o la probabilidad para algún intervalo relativo a la media.

    Teorema de Markov: Sea X una variable aleatoria no negativa  Características de las variables aleatorias, cuya media existe. Para cualquier  Características de las variables aleatorias

    Desigualdad de Chebychev: Sea X una variable aleatoria con media conocida y varianza finita, para cualquier  Características de las variables aleatorias

    Si k crece, la probabilidad de que X se encuentre fuera del intervalo es menor. La cota de probabilidad es la misma para cualquier variable aleatoria, ya que solo depende de k. Ya la amplitud del intervalo depende de la  Características de las variables aleatorias

    Para una  Características de las variables aleatorias menor, disminuye la amplitud del intervalo para una misma probabilidad.

    Para una  Características de las variables aleatorias mayor aumenta la amplitud del intervalo para una misma probabilidad.

    Si hacemos  Características de las variables aleatorias para cualquier  Características de las variables aleatorias la desigualdad resulta:

     Características de las variables aleatorias  Características de las variables aleatorias

    Función generatriz de momentos

    Se utiliza para calcular los momentos de la distribución de una variable aleatoria, y para obtener la distribución de una función de variables aleatorias. Sea t un número real, la función generatriz de X será:

     Características de las variables aleatorias

    · Caso discreto:  Características de las variables aleatorias, la serie debe ser convergente.

    ·Caso continuo:  Características de las variables aleatorias, la integral debe ser convergente.

    Teorema de la unicidad de la función generatriz:

    Si la función generatriz existe, es única y determina la distribución de probabilidad de la variable aleatoria.

    Si dos variables tienen la misma función generatriz, entonces tienen la misma distribución de probabilidad y viceversa.

    Valor esperado de una variable aleatoria bidimensional

    · Caso Discreto:  Características de las variables aleatorias

    · Caso Continuo:  Características de las variables aleatorias

    Tanto la serie, como la integral deben ser absolutamente convergentes.

    Propiedades:

    • Rigen las misas propiedades que para el caso unidimensional.
    • Si X e Y son variables independientes, cuyos calores esperados existen, entonces:  Características de las variables aleatorias

    Momentos de una variable aleatoria bidimensional

    • Con respecto al origen:  Características de las variables aleatorias

     

    • Con respecto a la media:  Características de las variables aleatorias

    Covarianza

    Permite dar una medida de la fuerza de la relación lineal entre las variables, auqnue al ser el producto de las unidades de dos variables aleatorias, esto hace difícil determinar la fuerza de la relación.

     Características de las variables aleatorias, X aumenta/disminuye, cuando aumenta/disminuye Y

     Características de las variables aleatorias, X disminuye/aumenta, cuando aumenta/disminuye Y

     Características de las variables aleatorias, cuando X e Y son independientes.

    Propiedades:

    • Si X e Y son dos variables aleatorias independientes, entonces  Características de las variables aleatorias, No podemos decir que si la covarianza es nula entonces las variables son independientes, ya que es posible que pares de variables dependientes tengan covarianza cero, de la misma forma que si la covarianza es distinta de cero, ello no implica que las variables sean dependientes.
    • Sean X e Y variables aleatorias, y también  Características de las variables aleatorias, entonces:  Características de las variables aleatorias
    •  Características de las variables aleatorias
    •  Características de las variables aleatorias
    •  Características de las variables aleatorias
    •  Características de las variables aleatorias
    •  Características de las variables aleatorias En el caso de que las variables X e Y fuesen independientes, entonces:  Características de las variables aleatorias
    • Un cambio de origen, no afecta a la covarianza, aunque sí le afecta los cambios de escala.

    Coeficiente de Correlación

    Para eliminar el problema que tiene la covarianza como medida de la fuerza de la relación lineal entre las variables, si dividimos la covarianza por sus desviaciones típicas, estandarizamos dichas medidas, surgiendo así el coeficiente de correlación lineal.

     Características de las variables aleatorias

    Propiedades:

    • Si las variables X e Y son independientes, el coeficiente de correlación es nulo.
    • Si X e Y son variables aleatorias cuyas varianzas existen y son distintas de cero, entonces:  Características de las variables aleatorias
    •  Características de las variables aleatorias Relación lineal perfecta, variables correlacionadas.
    •  Características de las variables aleatorias No existe relación lineal entre variables, Están incorrelacionadas.
    •  Características de las variables aleatorias Correlación positiva.
    •  Características de las variables aleatorias Correlación negativa.
    • El coeficiente de correlación es invariante ante cambios de origen y escala.

    Función generatriz

    · Caso discreto:  Características de las variables aleatorias

    · Caso continuo:  Características de las variables aleatorias

    Variables aleatorias y sus distribuciones

    0

    Variable Aleatoria Unidimimensional

    Una variable aleatoria es una función que asigna un valor numérico a cada suceso elemental del espacio muestral.

    Podemos encontrar variables aleatorias de dos tipos: Discretas y Continuas

    Decimos que una variable aleatoria es discreta si toma un número finito o infinito, pero numerable de valores.

    Será continua si puede tomar un número infinito no numerable de valores, o tomar valores en uno o más intervalos de la recta real.

    Variables aleatorias discretas

    Distribución de probabilidad, función de probabilidad o función de cuantía

    Es una función que llamaremos P(x) y que asigna las probabilidades con la que la variable aleatoria toma los posibles valores, de tal forma que las probabilidades verifiquen:

     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones

    Por lo tanto, la probabilidad no puede ser negativa y para todos los valores posibles los sucesos son excluyentes y exhaustivos (significa que de todos ellos sólo debe ocurrir y no pueden ocurrir dos de forma simultánea.)

    Función de distribución

    Una variable aleatoria queda definida cuando conocemos su campo de variación y el conjunto de probabilidades con que toma valores en ese campo. La probabilidad del suceso  Variables aleatorias y sus distribuciones recibe el nombre de función de distribución de la variable aleatoria y la denominamos  Variables aleatorias y sus distribuciones

    La función de distribución, por definición, no puede ser negariva, al ser una probabilidad, ni decreciente, ya que es acumulativa. Además, por ser una probabilidad, está acotada  Variables aleatorias y sus distribuciones

    • Propiedades
      •  Variables aleatorias y sus distribuciones
      •  Variables aleatorias y sus distribuciones
      • La función es monótona no decreciente.
      • La función es continua por la derecha.

    Variables aleatorias continuas

    Función de densidad

    Si X es una variable aleatoria de tipo continuo y se verifica:

     Variables aleatorias y sus distribuciones

    diremos que f(x) es la función de densidad de la variable aleatoria continua.

    Gráficamente, representa la curva límite correspondiente al histograma de frecuencias relativas.

    En el caso continuo, la suma de densidades de probabilidad o área bajo la curva f(x) es igual a la unidad.

    Como en el caso continuo no existen las probabilidades puntuales  Variables aleatorias y sus distribuciones, entonces,  Variables aleatorias y sus distribuciones

    Función de distribución
     Variables aleatorias y sus distribuciones y representa el área limitada por la curva función de densidad y a la izquierda de la recta  Variables aleatorias y sus distribuciones

    La función de distribución conduce a la probabilidad a través de una longitud, mientras que si utilizamos la función de densidad, el valor es el mismo pero expresado como un área.

    Función simétrica

    Se dice que una distribución es simétrica respecto de un punto C se se verifica:  Variables aleatorias y sus distribuciones

    Diremos que es simétrica respecto del punto cero si:  Variables aleatorias y sus distribuciones

    Variable Aleatoria Bidimensional

    Distribución de probabilidad bidimensional

    Podemos encontrarnos con los dos casos ya mencionados, discretos y continuos.

    En el caso discreto:
    • Distribución de probabilidad conjunta
     Variables aleatorias y sus distribuciones
    • Función de probabilidad conjunta
     Variables aleatorias y sus distribuciones
    En el caso continuo
    • Función de densidad bidimensional
     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones
    • Función de distribución bidimensional
     Variables aleatorias y sus distribuciones

    Distribuciones Marginales

    Cuando queremos conocer por separado la distribución de alguna o de ambas variables partiendo de la información que nos da la distribución conjunta.

    En el caso discreto:
    • Distribución de probabilidad marginal
     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones
    • Distribución de distribución marginal
     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones
    En el caso continuo
    • Función de densidad marginal
     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones
    • Función de distribución marginal
     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones

    Distribuciones condicionadas

    Cuando nos interesa conocer como se distribuye una de las variables cuando se imponen condiciones a la otra.

    En el caso discreto
    • Distribución de probabilidad condicionada
     Variables aleatorias y sus distribuciones

    siempre que  Variables aleatorias y sus distribuciones

    • Función de distribución condicionada
     Variables aleatorias y sus distribuciones
    En el caso continuo
    • Función de densidad condicionada
     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones
    • Función de distribución condicionada
     Variables aleatorias y sus distribuciones  Variables aleatorias y sus distribuciones

    Independencia de variables aleatorias

    Se dice que dos variables aleatorias son independientes si y sólo si se verifica que la función de distribución conjunta es igual al producto de sus distribuciones marginales:

     Variables aleatorias y sus distribuciones
    En el caso discreto
     Variables aleatorias y sus distribuciones
    En el caso continuo
     Variables aleatorias y sus distribuciones
    Ir arriba