Estadistica
Problemas resueltos de Estadística II – Parte 1
0- Un estudio realizado establece que el número de hijos que tienen las parejas de 25-35 años viene dado por:
| Nº de hijos |
0 | 1 | 2 | 3 |
| Probabilidad | 0,25 | k | 0,2 | 0,1 |
a) Calcular el valor de k para que sea una distribución de probabilidad
b) Obtener la función de distribución
c) Calcular la esperanza y varianza de la variable aleatoria
a) Debe cumplirse que
b)Teniendo en cuenta que la función de distribución
Tendremos:
c)
Teniendo en cuenta que: , calculamos
Luego:
- Un estudio realizado establece que el número de hijos que tienen las parejas de 25-35 años viene dado por:
a) Calcular el valor de la constante
b) Poner las probabilidades en forma de table de doble entrada y hallar las correspondientes distribuciones de probabilidades marginales
c) Calcular las distribuciones de probabilidad condicionadas para ambas variables.
a) Debe cumplirse que:
b)
| X \ Y | 1 | 2 | |
| 1 | |||
| 2 | |||
| 3 | |||
Las funciones de probabilidad marginal son:
c) Las funciones de probabilidad condicionadas:
| X | ||
| 1 | ||
| 2 | ||
| 3 |
| Y | 1 | 2 |
- La variable aleatoria bidimensional (X,Y) son los beneficios de una empresa, procedentes de sus exportaciones a dos países diferentes. Sabiendo que X e Y son independientes, con medias de 2 y 4 millones de euros respectivamente y desviación típica de 0,01 millones de euros en ambas. Se pide:
a) ¿Qué beneficio presenta menor coeficiente de variación? Explique el resultado.
b) La esperanza de los beneficios totales: X+Y
c) La desviación típica de los beneficios totales: X+Y. ¿Qué sucede si X e Y no son independientes? Explique su respuesta.
a) Puesto que las desviaciones típicas son iguales, presentará menor coeficiente de variación la variable Y, por tener mayor media. Tenemos:
b)
c) Como X e Y son independientes,
Si X e Y no fuesen independientes se cumpliría que:
- La variable aleatoria bidemensional (X,Y) son los beneficios de una empresa, procedentes de sus exportaciones a dos países diferentes. Sabiendo que X e Y son independientes, con medias de 4 y 6 millones de euros respectivamente y desviación típica 0,02 millones de euros en ambas. Se pide:
a) ¿Qué beneficio presenta menor coeficiente de variación? y ¿Cuál es su covarianza? Explique el resultado.
b) La esperanza de los beneficios totales: X+Y
c) La desviación típica de los beneficios totales: X+Y
d) Explique qué sucede con la desviación típica si X e Y no son independientes.
a) Al ser las desviaciones típicas iguales, presenta menor coeficiente de variación la variable cuya media es mayor, esto es, la Y. Dado que las variables son independientes, su covarianza es cero.
b)
c) , de donde la desviación típica de X+Y será:
d)
Fuente: http://personal.telefonica.terra.es/web/imm/homestad.htm
Construcción de intervalos de confianza
0Supongamos que una compañía dedicada a la producción de piezas para el sector de automoción, quiere analizar la productividad de una de sus plantas industriales y para ello realiza un control de las piezas fabricadas. Mediante el control realizado sobre una muestra aleatoria de piezas, estima que el 10 % de todas las piezas son defectuosas. El gerente que se encuentra con este dato se hace la siguiente pregunta: ¿Puedo estar seguro de que el verdadero porcentaje de piezas defectuosas está entre 5 % y 15 %? Esta clase de preguntas requieren información que va más allá de la contenida en una simple estimación puntual; se trata de buscar un rango de valores entre los que posiblemente se encuentre la cantidad que se estima.
En una estimación por intervalo se define un intervalo dentro del cual puede estar el parámetro desconocido. El intervalo suele ir acompañado de una afirmación sobre el nivel de confianza que se puede asignar a su precisión, por ello se llama intervalo de confianza.
- Construcción e interpretación de los intervalos de confianza.
Podemos hacernos la siguiente pregunta; ¿Cómo podemos construir un intervalo y afirmar que confiamos al 95,5 % que ese intervalo contiene a , si ni siquiera sabemos cuál es al media poblacional?

Viendo el gráfico y recordando la valoración de normalidad que vimos, el 95,5 % de todas las medias muestrales se encontrarán entre . No debemos olvidar que a partir de cualquier población podemos obtener muchas muestras diferentes de un mismo tamaño determinado, cada una de ellas con su propia media
. Todas estas medias muestrales dan lugar a un intervalo de confianza, que podrá incluir o no a la media poblacional. Por consiguiente, si a partir de cualquier media muestral nos desplazamos dos errores típicos por encima y otros dos por debajo de esa media
, podemos tener una confianza del 95,5 % de que el intervalo resultante contiene a la media poblacional desconocida.
Si tomáramos 100 muestras aleatorias de tamaño de la misma población y calculáramos los extremos del intervalo para cada muestra, entonces esperamos que aproximadamente el 95,5% de los intervalos contendrán en su interior el verdadero valor del parámetro
y el 4,5% restante no lo contendrán. Pero como nosotros, en la práctica, sólo tomamos una muestra aleatoria y por tanto sólo tenemos un intervalo de confianza, no conocemos si nuestro intervalo es uno del 95,5% o uno del 4,5 %, por eso hablamos de que tenemos un nivel de confianza del 95,5 %.
El valor de 95,5 % recibe el nombre de nivel de confianza, es el nivel de confianza que tenemos en que el intervalo contiene el valor del parámetro desconocido. Al valor se le llama coeficiente de confianza. El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud y con una alta probabilidad de que el parámetro poblacional se encuentre en su interior. Así pues, elegiremos probabilidades cercanas a la unidad, que se representan por
, y cuyos valores más frecuentes suelen ser: 0,90, 0,95, 0,99., que corresponden al 99%, 95% y 90%
La precisión de la estimación por intervalos vendrá caracterizada por el nivel de confianza y por la amplitud del intervalo:
- Para un coeficiente de confianza fijo, cuanto más pequeño sea el intervalo de confianza más precisa será la estimación.
- Para una misma amplitud de intervalo, cuanto mayor sea el coeficiente de confianza mayor será la precisión.
Métodos de obtención de estimadores
0Los principales métodos de estimación de parámetros de un modelo probabilístico o de coeficientes de un modelos matemático son los siguientes
- Método de los momentos
- Método de máxima verosimilitud
- Mínimos cuadrados
Para la estimación de parámetros de distribuciones de probabilidad, los métodos empleados son los dos primeros, mientras que el segundo se usa principalmente en los estudios de regresión.
Método de los momentos
Es el método más sencillo y antiguo. Se suele utilizar para obtener una primera aproximación de los estimadores. Se igualan tantos momentos muestrales, como parámetros se tengan que estimar.
Propiedades de los estimadores obtenidos por el método de los momentos:
- Si los parámetros desconocidos son momentos poblacionales, entonces los estimadores obtenidos serán insesgados y asintóticamente normales
- Bajo condiciones bastantes generales, los estimadores obtenidos serán consistentes.
Método de la máxima verosimilitud
En esencia el método consiste en seleccionar como estimador del parámetro, de un modelo probabilístico, a aquél valor que tiene la propiedad de maximizar el valor de la probabilidad de la muestra observada. Es decir, encontrar el valor del parámetro que maximiza la función de verosimilitud.
Propiedades de los estimadores obtenidos por el método de máxima verosimilitud:
- Los estimadores de máxima verosimilitud son consistentes.
- En general no son insesgados, pero si no son insesgados son asintóticamente insesgados (el estimador
converge al parámetro θ, y en el límite coincide con su valor medio, que es el parámetro θ). - Todo estimador de máxima verosimilitud no es eficiente, pero sí son asintóticamente eficientes.
- Son asintóticamente normales.
- Son suficientes.
Estimación Puntual
0Objetivo y características fundamentales
En una estimación puntual se utiliza un solo número o valor para determinar una estimación del parámetro poblacional desconocido. En la estimación puntual se asume que el estadístico es un buen estimador del parámetro. Obviamente cualquier estadístico no sirve, es necesario que satisfaga ciertas propiedades:
Propiedades de los estimadores puntuales
1.- Estimador insesgado o centrado y de varianza mínima. Cota de Cramer-Rao
Se dice que un estimador es insesgado o centrado si la media de la distribución muestral del estadístico muestral coincide con el parámetro a estimar. Es decir, si repetimos el proceso de muestreo muchas vedes en promedio el valor que se obtiene de un estimador insesgado será igual al parámetro poblacional. Un estimador es insesgado cuando no existe sesgo entre la esperanza del estimador y el parámetro poblacional, o sea, la esperanza del estimador es el propio parámetro.
Para obtener un estimador insesgado de varianza mínima, hay que determinar las varianzas de todos los estimadores insesgados de y seleccionar el que posea la varianza más pequeña. La cota de Cramer Rao permite obtener una cota inferior de la varianza.
Siendo la función de verosimilitud.
La media, la varianza y las proporciones muestrales son estimadores insesgados de los correspondientes parámetros poblacionales.
No debemos olvidar que la varianza muestral la hemos definido , para que podamos obtener un estimador insesgado.
2.- Estimador eficiente
Un estimador es eficiente si se cumple que:
- Es insesgado.
- Posee varianza mínima. Para calcular si el valor adquirido por la varianza es mínimo, usamos la cota de Cramer-Rao.
Si se tienen dos estimadores insesgados, que siguen las mismas distribuciones, para un mismo tamaño muestral , se dice que uno es más eficiente que el otro cuando su varianza es menor.
El estimador 1 será más eficiente que el estimador 2. Al ser estimadores insesgados ambas distribuciones muestrales tienen la misma media, luego será más homogénea la distribución que posee menor varianza.
3.- Estimador consistente
La consistencia de un estimador está relacionada con el comportamiento del estimador cuando el tamaño de la muestra aumenta. Es decir, a medida que el tamaño de la muestra aumenta la información que nos proporciona sobre la población será mayor.
Se dice que un estimador es consistente cuando al aumentar el tamaño de la muestra, el valor medio de la distribución muestral del estadístico muestral tiende al parámetro a estimar.
Así cuando el tamaño de la muestra aumenta la información es más completa y la varianza del estimador suele ser menor, por tanto la distribución muestral de ese estimador tenderá a encontrarse más concentrada alrededor del parámetro que pretendemos estimar.
4.- Estimador suficiente
Este concepto de suficiencia fue introducido por Fisher en 1922, y puede decirse que:
Diremos que un estadístico es suficiente para un parámetro poblacional desconocido cuando recoge toda la información que la muestra contiene sobre el parámetro. Dicho de otra forma: Una vez que sabemos el valor que ha tomado el estadístico, la muestra ya no puede proporcionarnos mas información sobre dicho parámetro. Esto equivale a decir que, si el estadístico es suficiente, la distribución de probabilidad de la muestra condicionada a que conocemos el valor del estadístico , ha de ser independiente del parámetro.
Estimador invariante
Un estimador es invariante si se verifica que el estimador de una función del parámetro es igual a la función del estimador del parámetro.
Por ejemplo si la varianza muestral es estimador de la varianza poblacional, si el método de estimación es invariante, la desviación típica muestral será estimador de la desviación típica poblacional.
Existen estimadores invariantes a cambios de origen, cambios de escala, o cambios de origen y escala.
Estimador robusto
Un estimador es robusto cuando pequeños cambios en las hipótesis de partida del procedimiento de estimación considerado, no producen variaciones significativas en los resultados obtenidos.
Para estimaciones de la media poblacional, no conociendo la desviación típica muestral, utilizamos el estadística T- Student con grados de libertad, y con un tamaño de muestra relativamente grande:
Ante pequeñas variaciones en la distribución , no se producen cambios sustanciales en los procedimientos basados en este estadístico.
Si realizamos pequeñas variaciones en la distribución, sí se producen cambios sustanciales para procedimientos que se realicen sobre la varianza poblacional, basados en el estadístico
Muestreo
0Muestra aleatoria
Una muestra aleatoria simple de tamaño “ n “ consiste en n objetos (individuos) de una población de N objetos ( individuos ), escogidos de manera que cualquier conjunto de n objetos de la población tenga la misma oportunidad de convertirse en la muestra realmente seleccionada.
Una muestra aleatoria simple no sólo da a cada individuo la misma oportunidad de ser escogido evitando por tanto el sesgo en la selección (diremos que el diseño de un estudio es sesgado si favorece sistemáticamente ciertos resultados), sino que también da a cada posible muestra la misma oportunidad de ser escogida.
Puede pensarse en el proceso de muestreo aleatorio simple de la forma siguiente:
Supongamos que los N miembros de la población se introducen en un enorme sombrero y se mezclan concienzudamente. Una muestra aleatoria simple se obtiene extrayendo a n de ellos. En la práctica no es necesario hacerlo de este modo, los programas estadísticos pueden escoger una muestra aleatoria simple casi de forma instantánea de una lista de individuos de una población, o también se puede aleatorizar utilizando una tabla de dígitos aleatorios.
Por el momento nos limitaremos a muestras que hayan sido seleccionadas mediante esquemas de muestreo aleatorio simple. Sin embargo, debemos aclarar que este no es el único procedimiento que existe para elegir individuos de una población, y que, en determinadas circunstancias, pueden resultar preferibles esquemas de muestreo alternativos.
Parámetros poblacionales y estadísticos muestrales
Generalmente diremos que los parámetros poblacionales son las características numéricas de la población. En la estadística clásica un parámetro se puede considerar como una constante fija cuyo valor se desconoce. Uno de los problemas más comunes en la estadística inferencial es estudiar una población con una función de distribución donde la forma de la función de distribución es conocida pero depende de un parámetro
desconocido, ya que si fuese conocido tendríamos totalmente especificada la función de distribución.
Un estadístico es una variable aleatoria, que es función de las observaciones muestrales y no contiene ningún valor o parámetro desconocido. Continuando con la población de función de distribución , y considerando una muestra aleatoria simple
constituida por
variables aleatorias independientes e idénticamente distribuidas podemos definir como estadísticos:
… etc.
Por tanto, parámetro y estadístico son conceptos muy diferentes. Un parámetro es una constante que describe la población y cuando se conoce queda determinado el modelo probabilístico y un estadístico es una variable aleatoria cuyo valor depende de las observaciones muestrales.
Veamos el siguiente cuadro:
Dada una población finita de tamaño N, y una muestra aleatoria simple de tamaño n, , obtenida de la población de partida, tenemos:
| PARÁMETROS POBLACIONALES | ESTADÍSTICOS MUESTRALES | |
| MEDIA | ||
| VARIANZA | ||
| PROPORCIÓN |
Si la población de partida no es finita utilizaremos la misma notación para designar a estos parámetros poblacionales, pero estos no pueden ser calculados a partir de muestras finitas, sino que tendremos que recurrir al cálculo de valores esperados de variables aleatorias de tipo continuo.
La estadística inferencial o inductiva consiste en utilizar un estadístico para llegar a una conclusión o inferencia sobre el parámetro poblacional correspondiente. Por ejemplo, podemos calcular la media aritmética de una muestra, recurriendo al estadístico , y utilizarlo como estimación de la media aritmética de la población
; el estadístico se utiliza como estimador del parámetro.
Función de distribución empírica
La función de distribución empírica tiene las mismas propiedades que la función de distribución de la variable aleatoria, lo que implica que cuando el tamaño de la muestra crece, la gráfica de la función de distribución empírica se aproxima bastante a la de la función de distribución de la población, con lo que puede utilizarse como estimador de la misma.
Siendo el número de valores observados menores o iguales que
.
Distribución muestral de estadísticos
Es importante recordar que en el análisis estadístico tiene mucha importancia la información obtenida de una muestra representativa de la población: un director de una empresa elige una muestra representativa para determinar el grado de satisfacción que presentan los usuarios de su producto, un partido político selecciona una muestra de ciudadanos para analizar si su programa político producirá los resultados deseados, etc en estos casos los resultados obtenidos sólo son estimaciones de lo que ocurre en toda la población. El valor del estadístico es aleatorio porque depende de los elementos elegidos en la muestra seleccionada y, por lo tanto, el estadístico tiene una distribución de probabilidad la cual llamamos Distribución Muestral del Estadístico. Esta distribución dependerá del tamaño de la muestra, luego podemos decir que existe diferencia entre la distribución de la población de la cual se ha tomado la muestra y la distribución de alguna función de esa muestra.
La distribución muestral de un estadístico se puede obtener tomando todas las posibles muestras de la población de un tamaño fijado n calculando el valor del estadístico para cada una de las muestras y construyendo la distribución de estos valores. Como para cualquier distribución, las dos medidas fundamentales son la media y la desviación típica, también denominada error típico.
En esta asignatura estudiaremos las distribuciones muestrales del los estadísticos media, varianza y proporción muestral, pues son de bastante utilidad en diferentes aplicaciones estadísticas.
Distribución muestral del estadístico media muestral
Cuando se conoce la varianza poblacional
Si tenemos una muestra aleatoria de tamaño n procedente de una población con distribución normal entonces la distribución del estadístico media muestral será:
, si tipificamos
Si la distribución no es normal, basta que para que la media muestral siga una distribución normal, por el Teorema Central del Límite.
Cuando no se conoce la varianza poblacional
Calculamos la varianza muestral y la usamos como varianza poblacional (cuasi varianza)
Distribución muestral del estadístico varianza muestral
A partir de la definición de la cuasivarianza muestral, obtenemos:
Cuando no se conoce la media poblacional.
Cuando se conoce la media poblacional.
Estos estadísticos son independientes. Recordar que los grados de libertad, son los números de variables que integran, en este caso, el estadístico.
Distribución muestral del estadístico proporción muestral
Sea una muestra aleatoria simple de tamaño n procedente de una población con distribución B(1, p)
Si tipificamos:
Teorema Central del Límite
1No existe un único Teorema Central del Límite, sino un conjunto de teoremas, todos ellos dando condiciones para que una sucesión de variables aleatorias tienda a distribuirse según una distribución normal. Muchas variables aleatorias que se encuentran en la práctica son sumas o promedios de un número grande de variables aleatorias independientes.
Consideremos que es una sucesión de n variables aleatorias independientes e idénticamente distribuidas, con media
y varianza
(ambas finitas). Definimos una nueva variable:
Para cualquier variable aleatoria, al restar la media y dividir por la desviación típica se obtiene una variable aleatoria tipificada de media 0 y varianza 1:
. Cuando
, entonces podemos decir que
o bien
.
El teorema central del límite tiene un impacto sustancial en la práctica estadística. Afirma que cualquiera que sea la distribución común de un conjunto de variables aleatorias, suponiendo que la media y la varianza son finitas, la suma de un número moderadamente grande de ellas será una variable aleatoria con distribución parecida a la normal.
La validez del teorema central del límite no está limitado a variables aleatorias continuas y simétricas, se extiende también a variables aleatorias discretas y asimétricas. Así tenemos el Teorema de Moivre:- Si las variables aleatorias no son independientes o no tienen la misma distribución de probabilidad, en ese caso habrá que utilizar otras condiciones de mayor dificultad que no consideraremos en este caso.
Otro resultado interesante de este teorema es el siguiente, consideramos que es una sucesión de n variables aleatorias independientes e idénticamente distribuidas, con media
y varianza
(ambas finitas). Definimos una nueva variable
que es el promedio de estas variables aleatorias:
Para cualquier variable aleatoria, al restar la media y dividir por la desviación típica se obtiene una variable aleatoria tipificada de media 0 y varianza 1:
Cuando
entonces podemos decir que
o bien
Vídeo explicativo de los conceptos:
Distribución Normal
0Esta distribución resulta útil no sólo porque un gran número de distribuciones de frecuencias presentan formas aproximadamente normales, sino también por su gran significado teórico en el campo de la estadística inferencial. En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal:
- Caracteres morfológicos de individuos: talla, peso,..
- Caracteres sociológicos: consumo de un cierto producto por un grupo de individuos, puntuaciones de examen…
- Caracteres psicológicos: cociente intelectual, grado de adaptación a un medio,..
- Valores estadísticos muestrales: la media.
- Otras distribuciones como la binomial o la de Poisson son aproximaciones normales.
No obstante, hay que tener cuidado al suponer que un determinado conjunto de observaciones se puede aproximar por una distribución normal.
La distribución normal la obtuvo inicialmente De Moivre en 1733 como límite o aproximación de la distribución cuando
. Posteriormente Gauss en 1809 y Laplace en 1812 llegaron a obtenerla empíricamente al estudiar la distribución de errores accidentales en Astronomía y Geodesia.
Una justificación de la frecuente aparición de la distribución normal es el teorema central del limite, que veremos más tarde, que establece que cuando los resultados de un experimento son debidos a un conjunto muy grande de causas independientes, que actúan sumando sus efectos, siendo cada efecto individual de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribución normal
La curva normal responde al tipo de curva perfectamente simétrica, y unimodal basada en un número infinito de casos, por lo que sólo puede ser tratada de forma aproximada cuando se opera con datos reales. Por tratarse de una curva simétrica coinciden la media, la moda y la mediana.
Diremos que la variable aleatoria, de tipo continuo, sigue una distribución Normal de parámetros , si su función de densidad es:
, donde
y tales que
y
La función de densidad depende de dos parámetros: media y varianza de la distribución, y puede verse por la definición que no hay una única distribución normal sino una familia completa de distribuciones.
Abreviadamente esta distribución la indicaremos por:
Se observa que tiene forma de campana, de aquí que frecuentemente se le llame curva o campana de Gauss.
Los parámetros:
, es el centro de la distribución y también se corresponde con el punto máximo de la distribución.
, nos da una idea del grado de apertura de la distribución.
Veamos los siguientes ejemplos:
- En este caso tenemos dos curvas normales
y
que tienen distintas medias pero tienen la misma desviación típica, por tanto sus centros están en diferentes lugares pero el grado de apertura de ambas distribuciones es el mismo.
- En este segundo caso tenemos dos curvas normales
y
que tienen distintas desviaciones típicas pero tienen la misma media. Ahora las curvas están centradas en el mismo punto m pero su grado de apertura es distinto. Como d 1 < d 2 la curva de mayor desviación típica, en este caso d 2 tendrá una mayor dispersión.
Características de ésta distribución:
Función de distribución:
La integral correspondiente a esta función de distribución sólo puede calcularse mediante métodos numéricos aproximados. Una manera de simplificar estos cálculos es mediante el proceso de tipificación de una variable aleatoria normal, que nos permite pasar de una a una
La variable normal con media cero y desviación típica la unidad se denomina normal estándar $N(0,1)$; su función de distribución está tabulada. Para calcular probabilidades en el caso general, transformaremos la variable aleatoria normal en la variable normal estándar
, mediante:
Si aplicamos el cambio de variable tenemos como función de densidad:
y su función de distribución es:
Las características que presenta la normal tipificada son:
- No depende de ningún parámetro.
- La curva
es también es simétrica respecto del eje OY.
- Para realizar la representación gráfica de la función de densidad
correspondiente a la normal
procederíamos de forma análoga a como se hizo para la distribución
.
Media y Varianza
Cálculo de probabilidades
Sea una variable aleatoria normal
con función de distribución acumulada
, y sean
y
dos posibles valores que verifican que
. Entonces:
Cualquier probabilidad puede obtenerse a partir de la función de distribución acumulada, sin embargo, como vimos anteriormente calcular la integral correspondiente a esta función de distribución sólo puede hacerse mediante métodos numéricos aproximados. No obstante cualquier distribución normal puede expresarse como una normal estándar :
Donde es una variable aleatoria normal estándar que está tabulada. En esta tabla encontraremos los valores de:
No debemos olvidar que se trata de una distribución simétrica y que el área bajo la curva normal es igual a la unidad. Por tanto:
Valoración de la normalidad
La decisión de describir una distribución mediante una curva normal puede determinar el análisis que posteriormente se haga de los datos. Una forma de ver si los datos son aproximadamente normales es observando su histograma. Este nos puede revelar de forma clara características no normales de una distribución: las asimetrías prolongadas, los vacíos entre datos, etc.
Una forma de valorar si una distribución es normal es señalando los puntos en el eje de ordenadas y observando la probabilidad comprendida en estos intervalos. En el caso de una distribución normal
:
- El 68,3 % de las observaciones se encuentran entre
- El 95,5 % de las observaciones se encuentran entre
- El 97,7 % de las observaciones se encuentran entre
Propiedades de ésta distribución
- Si
son variables aleatorias independientes, distribuidas según una
, y si
, entonces la variable aleatoria:
, sigue una distribución:
- La suma de n variables aleatorias independientes,
y distribuidas según una
sigue una distribución:
- Si
son n variables aleatorias independientes e idénticamente distribuidas según una
, entonces la variable aleatoria suma de las n variables:
, sigue una distribución:
- Si
son n variables aleatorias independientes e idénticamente distribuidas según una
, entonces la variable aleatoria media aritmética de estas n variables:
, sigue una distribución:
Aproximación a la distribución normal la distribución binomial
El teorema de Moivre (1.756) permite realizar esta aproximación considerando que las variables aleatorias sigan una distribución binomial con: . Este teorema fue generalizado posteriormente por Laplace en 1.810 para distribuciones no simétricas
.
Vimos que la variable aleatoria binomial era el número de éxitos que tienen lugar cuando se realizan n repeticiones independientes de un experimento o prueba de Bernoulli. La variable aleatoria puede escribirse como la suma de n variables aleatorias de Bernoulli:
Si es una variable aleatoria binomial,
, con media
y desviación típica
entonces, cuando
la variable aleatoria:
, es decir:
En la práctica, decir que n es lo suficientemente grande, se traduce en:
Lo que se hace es aproximar una distribución discreta, como es la binomial, a una distribución normal que es continua, y ya que en el caso continuo la probabilidad o masa asociada a un valor concreto de la variable aleatoria es nulo, tendremos que utilizar la corrección de continuidad de Fisher para calcular la probabilidad deseada:
| Probabilidad en |
Corrección de continuidad |
Aproximación a la distribución normal la distribución de Poisson
En el caso de la distribución de Poisson, la variable aleatoria nos establece el número de veces que ocurre un suceso en un determinado intervalo de tiempo, sabemos que la media y la varianza de esta distribución coincide con el parámetro .
Si el número de ocurrencias esperadas es elevado y el intervalo de tiempo se divide en subintervalos de idéntica longitud. En ese caso, el número total de ocurrencias es la suma de las ocurrencias de cada subintervalo, y puede verse como la suma de un número moderadamente grande de variables aleatorias, cada una de las cuales representa el número de ocurrencias en un subintervalo del periodo de tiempo, puede utilizarse la distribución normal como una aproximación a la distribución de Poisson. En la práctica la aproximación es aceptable si
.
El procedimiento práctico es análogo al caso de la binomial, así pues si tenemos una variable aleatoria que se distribuye según una distribución de Poisson de parámetro
, entonces cuando
la variable aleatoria:
, es decir:
Al igual que en el caso de la distribución binomial es necesario aplicar la corrección de continuidad para calcular las probabilidades.
Distribución Uniforme Continua
0Es la más sencilla de las distribuciones continuas, surge al considerar una variable aleatoria que toma valores equiprobables en un intervalo finito. Su nombre se debe al hecho de que la densidad de probabilidad de esta variable aleatoria es uniforme sobre todo su intervalo de definición.
La distribución uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad.
Diremos que una variable aleatoria sigue una distribución uniforme en un intervalo , con
si la probabilidad de que la variable aleatoria tome un valor en cualquier subintervalo es proporcional a la longitud del subintervalo.
La función de densidad es:
Abreviadamente esta distribución la indicaremos por:
Características:
Función de distribución:
Media y Varianza
Distribución de Poisson
0Consideramos un experimento en el que observamos la aparición de sucesos puntuales sobre un soporte continuo. Suponemos que el proceso se caracteriza por:
- Es estable, produce a largo plazo un número medio de sucesos constante
por unidad de tiempo, espacio, área…
- Los sucesos aparecen aleatoriamente de forma independiente, es decir, el proceso no tiene memoria: conocer el número de sucesos en un intervalo no ayuda a predecir el número de sucesos en el siguiente.
Definimos una variable aleatoria de Poisson como el número de sucesos de un intervalo de longitud fija. En este caso, la distribución de probabilidad de la variable aleatoria de Poisson depende solamente del número de resultados que ocurren en un intervalo.
Diremos que la variable aleatoria x sigue una distribución de Poisson de parámetro , si su distribución es:
Características:
Función de distribución
Media y Varianza
Propiedad reproductiva
Si y
son dos variables independientes distribuidas según una distribución de Poisson,
y
respectivamente, entonces la variable aleatoria:
se distribuye según una distribución Poisson de parámetro
,
Distribución Binomial
0La repetición de un experimento juega un papel muy importante en probabilidad, y en estadística. Una generalización de la distribución de Bernoulli se obtiene cuando el experimento o prueba de Bernoulli se repite varias veces. Por tanto, estamos ante un experimento binomial cuando repetimos n veces de forma independiente un ensayo de Bernoulli. Conceptualmente la distribución B(n,p) describe situaciones que se pueden presentar si un mismo suceso dicotómico se observa o se repite n veces y si los posibles resultados en cada ocasión son independientes de los que puedan lograrse en las demás.
Definimos la variable aleatoria binomial x, como el número de éxitos que tienen lugar cuando se realizan en repeticiones independientes de un experimento o prueba de Bernoulli.
Para obtener su función de probabilidad, consideramos que al realizar n repeticiones independientes del experimento hemos obtenido x resultados de éxito (con probabilidad p) y n-x resultados de fracaso con probabilidad q=1-p
La probabilidad de x elementos de éxito en cualquier orden, requiere sumar las probabilidades de todos los sucesos mutuamente excluyentes que verifican esta condición.
Estos sucesos se obtienen permutando las letras anteriores de todas las posibles formas:
Diremos que una variable aleatoria x sigue una distribución binomial de parámetros n y p si su distribución de probabilidad está dada por:
Abreviadamente esta distribución la indicaremos por: o bien
Características:
Función de distribución
Media y Varianza
Para obtener la media y la varianza de la distribución tenemos que tener en cuenta que la variable aleatoria binomial tenemos que tener en cuenta que la variable aleatoria binomial esté definida como el número de éxitos que tienen lugar cuando se realizan n repeticiones independientes de un experimento o prueba de Bernoulli, es decir, como suma de n variables independientes:
Propiedad reproductiva:
Si y
son dos variables aleatorias independientes distribuidas:
y
, entonces la variable aleatoria
se distribuye según una
Distribución de Bernoulli
0Este modelo se utiliza principalmente en situaciones en las que solo pueden ocurrir dos resultados posibles mutuamente excluyentes, uno de ellos de probabilidad p y el otro de probabilidad q=1-p
Supongamos un experimento consistente en observar elementos de una población, con las siguientes características:
- Mediante esta observación los elementos sólo pueden clasificarse en dos categorías, que generalmente se llamarán "éxito" al suceso de probabilidad p y "fracaso" al suceso de probabilidad q=1-p
- La proporción de sucesos "éxito" y "fracaso" en la población es constante y no se modifica cualquiera que sea la cantidad observada. Esto implica que los elementos se reemplazan una vez observados en la población.
- Las observaciones son independientes, la probabilidad de "éxito" es siempre la misma, no se modifica.
Diremos que una variable aleatoria X sigue una distribución de Bernoulli de parámetro p si su distribución de probabilidad está dada por:
La variable aleatoria X quedará definida como:
Abreviadamente: ó
Características:
| I. Función de distribución: | |
| II. Media: | |
| III. Varianza: | |
| IV. Función generatriz de momentos: | |
Exámenes de Estadística II
0|
Partes del Temario al que corresponden las preguntas del examen. |
||
| Examen Resuelto: |
Teoría |
Práctica |
| 2008 – Febrero – 1ª Semana |
1, 3, 3, 3 |
1, 3 |
| 2008 – Febrero – 2ª Semana |
3, 1, 1, 3 |
1, 2 |
| 2008 – Septiembre |
1, 2, 3, 3 |
2, 3 |
| 2008 – Septiembre – Reserva |
1, 3, 1, 3 |
1, 3 |
| 2009 – Febrero – 1ª Semana |
1, 1, 1, 3 |
1, 2 |
| 2009 – Septiembre |
1, 2, 3, 3 |
2, 2 |
| 2010 – Febrero – 1ª Semana |
1, 1, 2, 3 |
2, 2 |
| 2010 – Febrero – 2ª Semana |
1, 3, 3, 3 |
3, 2 |
| 2010 – Septiembre |
1, 1, 3, 3 |
1, 2 |
|
Parte |
Nº Preguntas |
% del Total |
|
|
Teoría |
1 |
15 |
41,67% |
|
2 |
3 |
8,33% |
|
|
3 |
18 |
50,00% |
|
|
Práctica |
1 |
5 |
27,78% |
|
2 |
9 |
50,00% |
|
|
3 |
4 |
22,22% |
Regresión y correlación lineal simple
0Regresión lineal simple
La regresión lineal simple nos permitirá pasar de una dependencia estadística a una funcional con las siguientes características:
- La función a estimar es lineal
- Existe una variable explicativa o exógena
- En la exposición nos referimos a una tabla de correlación de frecuencias unitarias
- Se empleará el ajuste mínimo-cuadrático para estimar la ecuación de la recta:
Las rectas de regresión serán:
donde,
Correlación lineal simple
La teoría de la correlación estudia el grado de asociación existente entre las dos variables, es decir, la intensidad de la dependencia entre las mismas.
Relación entre las varianzas
| Varianza de la variable dependiente | |
| Varianza explicada por la regresión | |
| Varianza residual |
Coeficiente de determinación
Coeficiente de correlación simple
Estudio descriptivo de las series temporales
0Una serie temporal es un conjunto de datos de una determinada magnitud económica, ordenados a lo largo del tiempo.
Cada uno de los valores de una serie temporal puede considerarse el resultado de componer (mediante suma o multiplicación) una serie de valores entre los cuales los más importantes son:
- Componente secular o tendencia: Refleja la evolución de la serie a largo plazo.
- Componente estacional: Recoge las oscilaciones periódicas periódicas de periodo igual o inferior a un año. Si el periodo marco es el año, pueden observarse variaciones estacionales de periodo cuatrimestral, trimestral o mensual. Si el periodo marco es el mes, pueden observarse variaciones estacionales de periodo semanal o diario, etc…
- Componente cíclica: Recoge las oscilaciones periódicas no regulares de la serie, de periodo superior al año.
- Componente accidental: Recoge las oscilaciones ocasionales que se producen por cause de fenómenos imprevisibles.
Determinación de la tendencia
- Método gráfico: Representado en abscisas los periodos y en ordenadas los valores, basta unir con una poligonal los puntos obtenidos.
- Método de las medias móviles: Se obtiene la media aritmética de cada r periodos consecutivos. Si r es impar, dicha media se le asigna al periodo intermedio; si r es par, vuelven a promediarse cada dos medias consecutivas.
- Método de los mínimos cuadrados: Consiste en ajustar una recta de regresión mínimo cuadrática a la serie de promedios anuales.
Determinación de las variaciones estacionales
Su determinación se efectúa mediante la construcción de un índice, para lo cual existen diversos métodos según el que el carácter de la serie sea multiplicativo o aditivo.
Si es multiplicativo se utiliza el método de la razón a la media móvil mediante el que se eliminan de la serie las componentes tendencia, ciclo y accidental y seguidamente se construye el índice de variación estacional.
Si es aditivo se calcula la tendencia por ajuste mínimo cuadrático, se corrigen a continuación las medias estacionales y finalmente se construye el índice de variación estacional.
Determinación de las variaciones cíclicas
Los movimientos cíclicos no suelen ser regulares y su determinación comprende ciertas dificultades.
Aun así, se puede tratar de aislar el ciclo bajo la hipótesis multiplicativa dejándolo como residuo con la eliminación de la tendencia y la variación estacional. Los pasos serían:
- Estimar la tendencia
- Calcular los índices de variación estacional
- Se desestacionaliza la serie observada
- Se elimina la tendencia dividiendo cada valor desestacionalizado por la serie de tendencia
El proceso finalizaría intentando eliminar la componente accidental.
Medidas de concentración
0Índice de concentración de Gini
Consideramos la variable estadística donde cada valor
es la renta de los $n_i$ individuos, siendo
. Sea
, es decir, la renta total de los individuos con renta
y sea
el porcentaje que dicho total representa respecto de la renta total, a saber
.
Por otra parte, sea el porcentaje de individuos con renta
, es decir,
. Se define el índice de concentración de Gini:
Para obtener el Índice es conveniente construir la siguiente tabla:
Casos extremos:
La concentración de la renta es mínima, es decir, la renta está equidistribuida.
La concentración de la renta es máxima, es decir, un sólo individuo percibe toda la renta.
El índice de Gini permanece acotado entre 0 y 1. Se puede calcular en distribuciones de frecuencias unidimensionales de variable cuantitativa y da una medida de la mayor o menor concentración de los valores de la variable. La concentración no debe confundirse con lo contrario de la dispersión.
Curva de Lorentz
Es la representación gráfica del índice de Gini. La curva de Lorenz es la poligonal que une los puntos:
El caso de equidistribución corresponde de la renta, la curva corresponde a la diagonal (0,0)-(100,100), y el caso de concentración máxima corresponde a la curva que une (0,0), (100,0) y (100,100)
Medidas de asimetría y curtosis
0Coeficiente de asimetría de Fisher
Es una medida de asimetría para variables estadísticas. Se dice que una distribución es simétrica si el diagrama de barras que representa es simétrico respecto de la recta
La simetría implica que , si además es unimodal:
Casos:
- Si
la distribución puede ser simétrica.
- Si
la distribución es asimétrica negativa o a la izquierda.
- Si
la distribución es asimétrica positiva o a la derecha.
Coeficiente de curtosis de Fisher
La curtosis o apuntalamiento surge al comparar la forma de una variable estadística con respecto a la distribución normal.
Casos:
- Si
Distribución leptocúrtica.
- Si
Distribución mesocúrtica.
- Si
Distribución platicútica.
Medidas de dispersión
0Tratan de medir lo más o menos esparcida se encuentra la variable estadística.
Recorrido, rango o intervalo de variación
Intervalos intercuartílicos:
- Intervalo intercuartílico:
- Intervalo semiintercuartílico:
- Intervalo intercuartílico relativo:
- …
Medidas de dispersión respecto a la media aritmética:
- Desviación absoluta respecto a la media aritmética:
- Varianza:
- Desviación típica:
- Coeficiente de variación de Pearson:
La varianza:
Considerados los valores de una variable con frecuencias respectivas
, siendo
, cuya media aritmética representamos por
, denominamos varianza a
. Se trata de una medida dispersión puesto que expresa el promedio de los cuadrados de las desviaciones de cada valor respecto de su media aritmética.
Propiedades:
- Positividad:
- Si
, entonces
- La varianza no se afectada por los cambios de origen pero sí por los de escala. Es decir, si
, entonces
- Método abreviado de cálculo, en función a los momentos respecto del origen:
Distribuciones de frecuencias unidimensionales
0Distribuciones de frecuencias unidimensionales con los datos no agrupados
Definiciones:
Llamamos distribución de frecuencias unidimensional unitaria de la característica X al conjunto de los r datos distintos y ordenados de menor a mayor de forma que ninguno está repetido.
Llamamos distribución de frecuencias unidimensional de la característica X al conjunto de los r datos distintos, ordenados de menor a mayor, acompañados de sus respectivas frecuencias absolutas.
Llamamos frecuencia total o total de datos, y la denotaremos por N a la suma de todas las frecuencias absolutas:
Llamamos frecuencia relativa del valor de la variable al cociente entre la frecuencia absoluta de dicho valor y el número total de datos N:
Llamamos frecuencia absoluta acumulada ascendente de un determinado valor de la variable ordenado de menor a mayor al número de datos que son menores o iguales a él:
Llamamos frecuencia absoluta acumulada descendente de un determinado valor ordenado al número de datos que son mayores que él:
Las frecuencias relativas acumuladas tanto ascendentes como descendentes se definen igual sólo que se suman las en vez de las
Estos conceptos nos dan la siguiente tabla genérica, de la cuál pueden obtenerse las tablas parciales que se deseen.
Distribuciones de frecuencias unidimensionales con los datos agrupados en intervalos de clases
Recorrido de la variable X:
Una vez determinados los datos máximo y mínimo podemos agrupar los datos del siguiente modo:
Amplitud del intervalo: , se verifica que:
Amplitud común:
Llamamos marca de clase del intervalo a su punto medio:
Características de las variables aleatorias
0Valor Esperado o Esperanza Matemática
En el caso discreto representa la media ponderada de los posible valores que puede tomar la variable aleatoria X.
En el caso continuo representa el centro de la función de densidad.
Para ambos casos es necesaria la condición de convergencia absoluta, es decir, que tengan un valor finito.
· Caso Discreto:
· Caso Continuo:
Propiedades:
- La esperanza de una constante es la propia constante.
- Si tenemos dos funciones:
- Si X es una variable aleatoria con distribución simétrica respecto a un punto c, entonces si existe, su esperanza
Valor esperado de una función de una variable aleatoria
En este caso se calcula el valor esperado de una función, a diferencia del caso anterior en el que se calculaba el valor esperado de una variable.
· Caso Discreto:
· Caso Continuo:
Momentos
- Con respecto al origen:
- Con respecto a la media o momento central:
$latex
Importante:
Varianza
Es el momento central o con respecto a la media de orden dos. Es una medida de dispersión absoluta de los valores de la distribución con respecto a su media, nos indica cómo representa la media a la distribución. Como la varianza se encuentra representada en una unidad distinta a la media, se introduce la desviación típica:
La varianza está influenciada por el tamaño de los valores que toma y por la media.
PROPIEDADES:
- La variación de una constante es cero.
- Si X e Y son dos variables aleatorias independientes, cuyas varianzas existen, entonces se verifica:
- La varianza nunca es negativa.
Coeficiente de variación
Para eliminar la influencia que tiene la media con respecto a la varianza, se utiliza otra medida de dispersión, esta vez relativa, que expresa la dispersión de una variable aleatoria respecto a su media. Con el coeficiente de variación podemos comparar dos distribuciones distintas de probabilidad.
El coeficiente no tendrá sentido, cuando la variable aleatoria X, tome valores positivos y negativos, (la media puede quedar compensada), sólo cuando tome valores positivos.
Cambios de origen y escala
A veces es necesario para facilitar los cálculos, realizar cambios de origen y escala.
Con respecto a la varianza:
Por lo tanto, no le afectan los cambios de origen, pero si los de escala.
Con respecto a la coeficiente de variación:
Por lo tanto, no le afectan los cambios de escala, pero si los de origen, exceptuando que
Tipificación de una variable
Las distribuciones poseen en general distintas medidas de posición y de dispersión. Puede ocurrir que muchas distribuciones sean análogas, o sea, sólo se diferencian en sus orígenes o en sus escalas.
Cuando queremos comparar estas distribuciones debemos hacerlas homogéneas, a través de la normalización o tipificación.
Es necesario que Z no tiene asignada ninguna medida, con lo que puede compararse con otras variables tipificadas.
Otras medidas de posición y dispersión
- Cuantiles: medidas, deciles, percentiles
· Caso discreto:
· Caso continuo:
·
- Moda: Será aquel valor de la variable para el cual la función de probabilidad o la función de densidad se hace máxima:
- Desviación absoluta media respecto a la mediana
- Recorrido intercuartílico:
, dentro de este intervalo intercuartílico se encuentran el 50% de los valores centrales de la variable, prescindiendo del 25% de los valores más pequeños y el 25% de los valores más grandes.
Medidas de forma
- Coeficiente de asimetría de Fisher:
- Coeficiente de curtosis o apuntalamiento:
Teorema de Markov y desigualdad de Chebychev
Se utilizan cuando conocemos la media y varianza de una ditribución desconocida y queremos calcular cotas superiores de ciertas probabilidades o la probabilidad para algún intervalo relativo a la media.
Teorema de Markov: Sea X una variable aleatoria no negativa , cuya media existe. Para cualquier
Desigualdad de Chebychev: Sea X una variable aleatoria con media conocida y varianza finita, para cualquier
…
Si k crece, la probabilidad de que X se encuentre fuera del intervalo es menor. La cota de probabilidad es la misma para cualquier variable aleatoria, ya que solo depende de k. Ya la amplitud del intervalo depende de la
Para una menor, disminuye la amplitud del intervalo para una misma probabilidad.
Para una mayor aumenta la amplitud del intervalo para una misma probabilidad.
Si hacemos para cualquier
la desigualdad resulta:
Función generatriz de momentos
Se utiliza para calcular los momentos de la distribución de una variable aleatoria, y para obtener la distribución de una función de variables aleatorias. Sea t un número real, la función generatriz de X será:
· Caso discreto: , la serie debe ser convergente.
·Caso continuo: , la integral debe ser convergente.
Teorema de la unicidad de la función generatriz:
Si la función generatriz existe, es única y determina la distribución de probabilidad de la variable aleatoria.
Si dos variables tienen la misma función generatriz, entonces tienen la misma distribución de probabilidad y viceversa.
Valor esperado de una variable aleatoria bidimensional
· Caso Discreto:
· Caso Continuo:
Tanto la serie, como la integral deben ser absolutamente convergentes.
Propiedades:
- Rigen las misas propiedades que para el caso unidimensional.
- Si X e Y son variables independientes, cuyos calores esperados existen, entonces:
Momentos de una variable aleatoria bidimensional
- Con respecto al origen:
- Con respecto a la media:
Covarianza
Permite dar una medida de la fuerza de la relación lineal entre las variables, auqnue al ser el producto de las unidades de dos variables aleatorias, esto hace difícil determinar la fuerza de la relación.
, X disminuye/aumenta, cuando aumenta/disminuye Y
, cuando X e Y son independientes.
Propiedades:
- Si X e Y son dos variables aleatorias independientes, entonces
, No podemos decir que si la covarianza es nula entonces las variables son independientes, ya que es posible que pares de variables dependientes tengan covarianza cero, de la misma forma que si la covarianza es distinta de cero, ello no implica que las variables sean dependientes.
- Sean X e Y variables aleatorias, y también
, entonces:
En el caso de que las variables X e Y fuesen independientes, entonces:
- Un cambio de origen, no afecta a la covarianza, aunque sí le afecta los cambios de escala.
Coeficiente de Correlación
Para eliminar el problema que tiene la covarianza como medida de la fuerza de la relación lineal entre las variables, si dividimos la covarianza por sus desviaciones típicas, estandarizamos dichas medidas, surgiendo así el coeficiente de correlación lineal.
Propiedades:
- Si las variables X e Y son independientes, el coeficiente de correlación es nulo.
- Si X e Y son variables aleatorias cuyas varianzas existen y son distintas de cero, entonces:
Relación lineal perfecta, variables correlacionadas.
No existe relación lineal entre variables, Están incorrelacionadas.
Correlación positiva.
Correlación negativa.
- El coeficiente de correlación es invariante ante cambios de origen y escala.
Función generatriz
· Caso discreto:
· Caso continuo:
Variables aleatorias y sus distribuciones
0Variable Aleatoria Unidimimensional
Una variable aleatoria es una función que asigna un valor numérico a cada suceso elemental del espacio muestral.
Podemos encontrar variables aleatorias de dos tipos: Discretas y Continuas
Decimos que una variable aleatoria es discreta si toma un número finito o infinito, pero numerable de valores.
Será continua si puede tomar un número infinito no numerable de valores, o tomar valores en uno o más intervalos de la recta real.
Variables aleatorias discretas
Distribución de probabilidad, función de probabilidad o función de cuantía
Es una función que llamaremos P(x) y que asigna las probabilidades con la que la variable aleatoria toma los posibles valores, de tal forma que las probabilidades verifiquen:
Por lo tanto, la probabilidad no puede ser negativa y para todos los valores posibles los sucesos son excluyentes y exhaustivos (significa que de todos ellos sólo debe ocurrir y no pueden ocurrir dos de forma simultánea.)
Función de distribución
Una variable aleatoria queda definida cuando conocemos su campo de variación y el conjunto de probabilidades con que toma valores en ese campo. La probabilidad del suceso recibe el nombre de función de distribución de la variable aleatoria y la denominamos
La función de distribución, por definición, no puede ser negariva, al ser una probabilidad, ni decreciente, ya que es acumulativa. Además, por ser una probabilidad, está acotada
- Propiedades
- La función es monótona no decreciente.
- La función es continua por la derecha.
Variables aleatorias continuas
Función de densidad
Si X es una variable aleatoria de tipo continuo y se verifica:
diremos que f(x) es la función de densidad de la variable aleatoria continua.
Gráficamente, representa la curva límite correspondiente al histograma de frecuencias relativas.
En el caso continuo, la suma de densidades de probabilidad o área bajo la curva f(x) es igual a la unidad.
Como en el caso continuo no existen las probabilidades puntuales , entonces,
Función de distribución
La función de distribución conduce a la probabilidad a través de una longitud, mientras que si utilizamos la función de densidad, el valor es el mismo pero expresado como un área.
Función simétrica
Se dice que una distribución es simétrica respecto de un punto C se se verifica:
Diremos que es simétrica respecto del punto cero si:
Variable Aleatoria Bidimensional
Distribución de probabilidad bidimensional
Podemos encontrarnos con los dos casos ya mencionados, discretos y continuos.
En el caso discreto:
-
Distribución de probabilidad conjunta
-
Función de probabilidad conjunta
En el caso continuo
-
Función de densidad bidimensional
-
Función de distribución bidimensional
Distribuciones Marginales
Cuando queremos conocer por separado la distribución de alguna o de ambas variables partiendo de la información que nos da la distribución conjunta.
En el caso discreto:
-
Distribución de probabilidad marginal
-
Distribución de distribución marginal
En el caso continuo
-
Función de densidad marginal
-
Función de distribución marginal
Distribuciones condicionadas
Cuando nos interesa conocer como se distribuye una de las variables cuando se imponen condiciones a la otra.
En el caso discreto
-
Distribución de probabilidad condicionada
siempre que
-
Función de distribución condicionada
En el caso continuo
-
Función de densidad condicionada
-
Función de distribución condicionada
Independencia de variables aleatorias
Se dice que dos variables aleatorias son independientes si y sólo si se verifica que la función de distribución conjunta es igual al producto de sus distribuciones marginales: