Valor Esperado o Esperanza Matemática

En el caso discreto representa la media ponderada de los posible valores que puede tomar la variable aleatoria X.

En el caso continuo representa el centro de la función de densidad.

Para ambos casos es necesaria la condición de convergencia absoluta, es decir, que tengan un valor finito.

· Caso Discreto: E(X)=\displaystyle\sum_i x_iP(X_i)

· Caso Continuo: E(X)=\displaystyle\int_{-\infty}^{+\infty}x\cdot f(x)dx

Propiedades:

  • La esperanza de una constante es la propia constante.
  • E(a+b)=E(a)+E(b)
  • E(k\cdot X)=k\cdot E(X)
  • Si tenemos dos funciones:
    g(X)\leq H(X)\Rightarrow E[g(x)]\leq E[h(x)]
  • Si X es una variable aleatoria con distribución simétrica respecto a un punto c, entonces si existe, su esperanza E(X)=c

Valor esperado de una función de una variable aleatoria

En este caso se calcula el valor esperado de una función, a diferencia del caso anterior en el que se calculaba el valor esperado de una variable.

· Caso Discreto: E[g(x)]=\displaystyle\sum_i g(x_i)\cdot P(x_i)

· Caso Continuo: E[g(x)]=\displaystyle\int_{-\infty}^{+\infty}g(x)\cdot f(x)dx

Momentos

  • Con respecto al origen:
\alpha _r=E(X')\; r=1,2,3,\cdots ,n
  • Con respecto a la media o momento central:

$latex

Importante:

\alpha _1=E(X)=\bar{x}=\mu \mu _2=\sigma ^2=\alpha _2-(\alpha _1)^2

Varianza

Es el momento central o con respecto a la media de orden dos. Es una medida de dispersión absoluta de los valores de la distribución con respecto a su media, nos indica cómo representa la media a la distribución. Como la varianza se encuentra representada en una unidad distinta a la media, se introduce la desviación típica: \sigma=\sqrt{\sigma ^2}

La varianza está influenciada por el tamaño de los valores que toma y por la media.

PROPIEDADES:

  • \mu _2=\sigma ^2=\alpha _2-(\alpha _1)^2
  • La variación de una constante es cero.
  • V(kX)=k^2\cdot V(X)+0
  • Si X e Y son dos variables aleatorias independientes, cuyas varianzas existen, entonces se verifica: V(X\pm Y)=V(X)+V(Y)
  • La varianza nunca es negativa.

Coeficiente de variación

Para eliminar la influencia que tiene la media con respecto a la varianza, se utiliza otra medida de dispersión, esta vez relativa, que expresa la dispersión de una variable aleatoria respecto a su media. Con el coeficiente de variación podemos comparar dos distribuciones distintas de probabilidad.

CV=\dfrac{\sigma}{\mu}

El coeficiente no tendrá sentido, cuando la variable aleatoria X, tome valores positivos y negativos, (la media puede quedar compensada), sólo cuando tome valores positivos.

Cambios de origen y escala

A veces es necesario para facilitar los cálculos, realizar cambios de origen y escala.

Con respecto a la varianza: \sigma _r^2=V(\dfrac{X-O_r}{e})=\dfrac{1}{e^2}\cdot V(X)=\dfrac{\sigma _x^2}{e^2}

Por lo tanto, no le afectan los cambios de origen, pero si los de escala.

Con respecto a la coeficiente de variación: CV_r=\dfrac{\sigma _r}{\mu _r}=\dfrac{\frac{\sigma _x}{e}}{\frac{\mu _x - O}{e}}=\dfrac{\sigma x}{\mu _x-O}

Por lo tanto, no le afectan los cambios de escala, pero si los de origen, exceptuando que O_T=0

Tipificación de una variable

Las distribuciones poseen en general distintas medidas de posición y de dispersión. Puede ocurrir que muchas distribuciones sean análogas, o sea, sólo se diferencian en sus orígenes o en sus escalas.

Cuando queremos comparar estas distribuciones debemos hacerlas homogéneas, a través de la normalización o tipificación.

Z=\dfrac{X-\mu}{\sigma} \quad N(0,1)

Es necesario que \sigma > 0 Z no tiene asignada ninguna medida, con lo que puede compararse con otras variables tipificadas.

Otras medidas de posición y dispersión

  • Cuantiles: medidas, deciles, percentiles

· Caso discreto: P(X\leq x_q)\geq q\qquad P(X\geq x_q)\leq 1-q

· Caso continuo: P(X\leq x_q)=1\qquad F(x_q)=q

· 0\leq q\leq 1

  • Moda: Será aquel valor de la variable para el cual la función de probabilidad o la función de densidad se hace máxima: f'(M_o)=0 \; f''(M_o)<0
  • Desviación absoluta media respecto a la mediana
E[|X-M_e|]=\displaystyle\int_{-\infty }^{+\infty }|x-M_e|f(x)dx
  • Recorrido intercuartílico: R_Q=Q_3-Q_1, dentro de este intervalo intercuartílico se encuentran el 50% de los valores centrales de la variable, prescindiendo del 25% de los valores más pequeños y el 25% de los valores más grandes.

Medidas de forma

  • Coeficiente de asimetría de Fisher: \gamma _1=\dfrac{\mu _3}{\sigma ^3} \qquad \begin{array}{ll} \gamma _1=0 & \mbox(simetrica) \\ \gamma _1<0 & \mbox{asimetrica negativa} \\ \gamma _1>0 & \mbox{asimetrica positiva}\end{array}

 

  • Coeficiente de curtosis o apuntalamiento: \gamma _2=\dfrac{\mu _4}{\sigma ^4}-3 \qquad \begin{array}{ll} \gamma _2=0 & \mbox{mesocurtica o normal} \\ \gamma _1<0 & \mbox{platicurtica} \\ \gamma _1>0 & \mbox{leptocurtica}\end{array}

Teorema de Markov y desigualdad de Chebychev

Se utilizan cuando conocemos la media y varianza de una ditribución desconocida y queremos calcular cotas superiores de ciertas probabilidades o la probabilidad para algún intervalo relativo a la media.

Teorema de Markov: Sea X una variable aleatoria no negativa P(>\geq 0)=1, cuya media existe. Para cualquier k>0 \quad P(P\geq k)\leq \dfrac{E(X)}{k}

Desigualdad de Chebychev: Sea X una variable aleatoria con media conocida y varianza finita, para cualquier k>0

Si k crece, la probabilidad de que X se encuentre fuera del intervalo es menor. La cota de probabilidad es la misma para cualquier variable aleatoria, ya que solo depende de k. Ya la amplitud del intervalo depende de la \sigma

Para una \sigma menor, disminuye la amplitud del intervalo para una misma probabilidad.

Para una \sigma mayor aumenta la amplitud del intervalo para una misma probabilidad.

Si hacemos k=\lambda\sigma para cualquier \lambda >0 la desigualdad resulta:

P[|X-\mu |\geq \lambda\sigma ]\leq\dfrac{\sigma ^2}{\lambda ^2\sigma ^2}=\dfrac{1}{\lambda ^2} P[\mu -\lambda\sigma < X < \mu + \lambda\sigma ]\geq 1-\dfrac{1}{\lambda ^2}

Función generatriz de momentos

Se utiliza para calcular los momentos de la distribución de una variable aleatoria, y para obtener la distribución de una función de variables aleatorias. Sea t un número real, la función generatriz de X será:

g_x(t)=E(e^{tx})

· Caso discreto: E(e^{tx})=\displaystyle\sum P(x_i)e^{tx_i}, la serie debe ser convergente.

·Caso continuo: E(e^{tx})=\displaystyle\int_{-\infty }^{+\infty }e^{tx}f(x)dx, la integral debe ser convergente.

Teorema de la unicidad de la función generatriz:

Si la función generatriz existe, es única y determina la distribución de probabilidad de la variable aleatoria.

Si dos variables tienen la misma función generatriz, entonces tienen la misma distribución de probabilidad y viceversa.

Valor esperado de una variable aleatoria bidimensional

· Caso Discreto: E[g(X,Y)]=\displaystyle\sum\sum g(x_i,y_j)P[X=x_i,Y=y_j]

· Caso Continuo: \displaystyle\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty }g(x,y)f(x,y)dxdy

Tanto la serie, como la integral deben ser absolutamente convergentes.

Propiedades:

  • Rigen las misas propiedades que para el caso unidimensional.
  • Si X e Y son variables independientes, cuyos calores esperados existen, entonces: E[XY]=E(X)E(Y)

Momentos de una variable aleatoria bidimensional

  • Con respecto al origen: \alpha _{rs}=E[X^rY^s] \qquad r,s=0,1,2,\cdots

 

  • Con respecto a la media: \mu _{rs}=E[(X-\bar{X}^r)(Y-\bar{Y})^s] \qquad r,s=0,1,2,\cdots

Covarianza

Permite dar una medida de la fuerza de la relación lineal entre las variables, auqnue al ser el producto de las unidades de dos variables aleatorias, esto hace difícil determinar la fuerza de la relación.

COV(X;Y)>0, X aumenta/disminuye, cuando aumenta/disminuye Y

COV(X;Y)<0, X disminuye/aumenta, cuando aumenta/disminuye Y

COV(X;Y)=0, cuando X e Y son independientes.

Propiedades:

  • Si X e Y son dos variables aleatorias independientes, entonces COV(X;Y)=0, No podemos decir que si la covarianza es nula entonces las variables son independientes, ya que es posible que pares de variables dependientes tengan covarianza cero, de la misma forma que si la covarianza es distinta de cero, ello no implica que las variables sean dependientes.
  • Sean X e Y variables aleatorias, y también U=aX\quad V=bY, entonces: COV(U,V)=ab\cdot COV(X;Y)
  • COV(X;Y)=COV(Y;X)
  • COV(X,X)=V(X)
  • COV(X,a)=0
  • COV(X+Y;Z)=COV(Z,X+Y)=COV(X,Z)+COV(Y;Z)
  • V(X\pm Y)=V()+V()\pm 2\cdot COV(X;Y) En el caso de que las variables X e Y fuesen independientes, entonces: V(X\pm Y)=V(X)+V(Y)
  • Un cambio de origen, no afecta a la covarianza, aunque sí le afecta los cambios de escala.

Coeficiente de Correlación

Para eliminar el problema que tiene la covarianza como medida de la fuerza de la relación lineal entre las variables, si dividimos la covarianza por sus desviaciones típicas, estandarizamos dichas medidas, surgiendo así el coeficiente de correlación lineal.

\rho _{xy}=\dfrac{COV(X,Y)}{\sigma _X\cdot\sigma _Y}=\dfrac{\mu _{11}}{\sqrt{\mu _{20}}\cdot\sqrt{\mu _{02}}}

Propiedades:

  • Si las variables X e Y son independientes, el coeficiente de correlación es nulo.
  • Si X e Y son variables aleatorias cuyas varianzas existen y son distintas de cero, entonces: -1 \leq \rho _{xy} \leq 1
  • \rho _{xy}=1 Relación lineal perfecta, variables correlacionadas.
  • \rho _{xy}=0 No existe relación lineal entre variables, Están incorrelacionadas.
  • \rho _{xy}>0 Correlación positiva.
  • \rho _{xy}<0 Correlación negativa.
  • El coeficiente de correlación es invariante ante cambios de origen y escala.

Función generatriz

· Caso discreto: g(t_1,t_2)=E[e^{t_1x+t_2y}]=\displaystyle\sum e^{t_1x+t_2y}P(x,y)

· Caso continuo: g(t_1,t_2)=E[e^{t_1x+t_2y}]=\displaystyle\int_{-\infty }^{+\infty }\int_{-\infty }^{+\infty } e^{t_1x+t_2y} f(x,y)dxdy

Artículos relacionados:

  1. Variables aleatorias y sus distribuciones
  2. Medidas de dispersión
  3. Moda
  4. Media Armonica
  5. Media Geométrica