Tema 2 Variables Aleatorias

2.1 Introducción a las variables aleatorias

  • Hasta ahora nuestros sucesos han sido de varios tipos: \(\{C,+\}\) en la moneda, nombres de periódicos, ángulos en una ruleta, número de veces que sale cara en el lanzamiento de una moneda etc.
  • Necesitamos estandarizar de alguna manera todos estos sucesos. Una solución es asignar a cada suceso un cierto conjunto de números reales, es decir, convertir todos los sucesos en sucesos de números reales para trabajar con ellos de forma unificada.
  • Para conseguirlo utilizaremos unas funciones que transformen los elementos del espacio muestral en números; estas funciones son las variables aleatorias.

2.1.1 Definición de variable aleatoria

Comenzaremos dando una definición poco rigurosa, pero suficiente, de variable aleatoria.

Variable Aleatoria (definición práctica)

Una variable aleatoria (v.a.) es una aplicación que toma valores numéricos determinados por el resultado de un experimento aleatorio.

Notación:

  • Normalmente representaremos las v.a. por letras mayúsculas \(X,Y,Z\ldots\)
  • Los valores que “toman” las v.a. los representaremos por letras minúsculas (las mismas en principio) \(x,y,z\ldots\)

Example 2.1 Ejemplo: Dado seis caras

Lanzamos un dado convencional de parchís y el espacio muestral del experimento es

\[\Omega=\{1,2, 3, 4, 5, 6\}.\]

Una v.a. \(X:\Omega\to\mathbb{R}\) sobre este espacio queda definida por

\[\begin{equation*} \begin{split} X(1)&=1,X(2)=2,X(3)=3,\\ X(4)&=4,X(5)=5,X(6)=6. \end{split} \end{equation*}\]

  • Ahora el suceso \(A=\{2, 4, 6\}\), es decir “salir número par”, es equivalente a \(\{X=2,X=4,X=6\}\).
  • El suceso \(B=\{1,2,3\}\), es decir “salir número inferior o igual a \(3\)” es en términos de la v.a. \(\{X=1,X=2,X=3\}\) o también \(\{X\leq 3\}\).

Example 2.2 Ejemplo: Juego lanzamiento anilla

Consideremos el experimento lanzar una anilla al cuello de una botella. Si acertamos a ensartar la anilla en la botella, el resultado del experimento es éxito y fracaso en caso contrario.

El espacio muestral asociado a este experimento será \(\Omega=\{\mbox{éxito, fracaso}\}\). Construyamos la siguiente variable aleatoria:

\[X:\{\mbox{éxito, fracaso}\}\to\mathbb{R}\]

definida por

\[X(\mbox{éxito})=1 \mbox{ y } X(\mbox{fracaso})=0.\]

2.1.2 Tipos de variables aleatorias

Hay dos tipos fundamentales de variables aleatorias, las discretas y las continuas.

Damos a continuación una definición informal.

Variables Aleatorias Discretas y Continuas

  • Una variable aleatoria es discreta si sólo puede tomar una cantidad numerable de valores con probabilidad positiva.
  • Las variables aleatorias continuas toman valores en intervalos.
  • También existen las variables aleatorias mixtas; con una parte discreta y otra continua.

Example 2.3 Ejemplo: Tipos de variables aleatorias

Son variables aleatorias discretas:

  • Número de artículos defectuosos en un cargamento.
  • Número de clientes que llegan a una ventanilla de un banco en una hora.
  • Número de errores detectados en las cuentas de una compañía.
  • Número de reclamaciones de una póliza de un seguro médico.

Son variables aleatorias continuas:

  • Renta anual de una familia.
  • Cantidad de petróleo importado por un país.
  • Variación del precio de las acciones de una compañía de telecomunicaciones.
  • Porcentaje de impurezas en un lote de productos químicos.

2.2 Variables aleatorias discretas

2.2.1 Distribuciones de probabilidad para v.a. discretas.

  • Pasamos ahora a describir el comportamiento de la v.a. Para ello utilizaremos distintas funciones que nos darán algunas probabilidades de la variable aleatoria.
  • En el caso discreto, estas funciones son la de probabilidad y la función de distribución o de probabilidad acumulada.
  • En el caso discreto, la función de probabilidad es la que nos da las probabilidades de los sucesos elementales de la v.a. que definimos a continuación.

Función de Probabilidad

La función de probabilidad (probability mass function o incluso abusando de notación probability density function) de una variable aleatoria discreta \(X\) a la que denotaremos por \(P_{X}(x)\) está definida por \[P_{X}(x)=P(X=x),\] es decir, la probabilidad de que \(X\) tome el valor \(x\).

Si \(X\) no asume ese valor \(x\), entonces \(P_{X}(x)=0\).

Dominio de una variable aleatoria discreta

El conjunto \[D_X=\{ x\in\mathbb{R} \mid P_X(x)>0\}\] recibe el nombre de dominio de la v.a. y son los valores posibles de esta variable.

En el caso discreto lo más habitual es que \(X(\Omega)=D_X\).

Example 2.4 Ejemplo: Juego del parchís

Lanzamos un dado de parchís una vez, en esta ocasión representaremos los sucesos elementales por el número de puntos de la cara obtenida, tenemos que \[\Omega=\{\mbox{1-puntos,2-puntos,3-puntos,4-puntos,5-puntos,6-puntos}\},\] y la variable aleatoria \(X:\Omega\to \mathbb{R}\) viene definida por

\[X(\mbox{i-puntos})=i\mbox{ para } i=1,2,3,4,5,6.\]

Supongamos que el dado está bien balanceado. Entonces \[P_{X}(1)=P_{X}(2)=P_{X}(3)=P_{X}(4)=P_{X}(5)=P_{X}(6)=\frac16.\] Concretamente: \[ P_{X}(x)= \left\{ \begin{array}{ll} \frac16 & \mbox{si } x=1,2,3,4,5,6\\ 0 & \mbox{en otro caso. } \end{array} \right. \]

Su dominio es \[D_X=\{1,2,3,4,5,6\}.\]

Example 2.5 Ejemplo: Lanzamiento moneda

Sea \(X\) la v.a. asociada al lanzamiento de una moneda. Su espacio muestral es \(\Omega=\{c,+\}\), la v.a. queda definida por:

\[X(\omega)=\left\{\begin{array}{ll} 1 & \mbox{si } \omega=c, \\ 0 & \mbox{si }\omega=+.\end{array}\right.\]

Su función de probabilidad es:

\[P_{X}(x)=P(X=x)=\left\{\begin{array}{ll} \frac12, & \mbox{si } x=0,1,\\ 0, & \mbox{en otro caso.}\end{array}\right.\]

Finalmente su dominio es \(D_X=\{0,1\}.\)

Example 2.6 Ejemplo: Urna con bolas

Tenemos una urna con tres bolas rojas, una negra y dos blancas. Realizamos una extracción y observamos el color de la bola. Entonces, un espacio muestral es \[\Omega=\{roja, blanca, negra\}.\]

Una variable aleatoria asociada al experimento es:

\[X(\omega)=\left\{\begin{array}{ll} 1, & \mbox{si } \omega=roja, \\ 2, & \mbox{si }\omega=negra, \\ 3, & \mbox{si } \omega=blanca. \end{array}\right.\]

La función de probabilidad es

\[P_{X}(x)=\left\{\begin{array}{ll} \frac36, & \mbox{si } x=1,\\[1ex] \frac16, & \mbox{si } x=2,\\[1ex] \frac26, & \mbox{si } x=3,\\[1ex] 0, & \mbox{en otro caso.}\end{array}\right.\]

El dominio de la v.a. \(X\) es \(D_X=\{1,2,3\}.\)

Propiedades básicas de la función de probabilidad

Sea \(X\) una v.a. discreta \(X:\Omega\to\mathbb{R}\) con dominio \(D_X\). Su función de probabilidad \(P_{X}\) verifica las siguientes propiedades:

  • \(0\leq P_{X}(x)\leq 1\), para todo \(x\in\mathbb{R}\).
  • \(\sum\limits_{x\in D_X} P_{X}(x)=1\).

Example 2.7 Ejemplo: Lanzamiento moneda

Lanzamos al aire tres veces, de forma independiente, una moneda perfecta. El espacio muestral de este experimento es \[\Omega=\{ccc,cc+,c+c,+cc,c++,+c+,++c,+++\}\] (expresados en orden de aparición).

Este espacio tiene todos los sucesos elementales equiprobables.

Consideremos la variable aleatoria asociada a este experimento:

\[X=\mbox{ número de caras en los tres lanzamientos}.\]

Su función de probabilidad es:

\[ \begin{array}{l} P(X=0)=P(\{+++\})=\frac18,\\ P(X=1)=P(\{c++,+c+,++c\})=\frac38,\\ P(X=2)=P(\{cc+,c+c,+cc\})=\frac38,\\ P(X=3)=P(\{ccc\})=\frac18. \end{array} \]

Podemos reescribir la función de probabilidad de \(X\) de forma simplificada:

\[P_{X}(x)=\left\{\begin{array}{ll} \frac18, & \mbox{si } x=0, 3,\\[1ex] \frac38, & \mbox{si } x=1,2,\\[1ex] 0, & \mbox{en otro caso.}\end{array}\right.\]

Efectivamente los valores de la función de distribución suman 1:

\[\sum_{x=0}^3 P_X(x)= \frac18+\frac38+\frac38+\frac18=1.\]

Distribución de Probabilidad

La función de distribución de probabilidad (acumulada) de la v.a. \(X\) (de cualquier tipo; discreta o continua) \(F_{X}(x)\) representa la probabilidad de que \(X\) tome un menor o igual que \(x\), es decir,

\[F_{X}(x)=P(X\leq x).\]

Esta función también se denomina función de distribución de probabilidad o simplemente función de distribución de una v.a., y en inglés cumulative distribution function por lo que se abrevia con el acrónimo cdf.

Propiedades de la Función de Distribución

Sea \(X\) una v.a. y \(F_{X}\) su función de distribución:

  1. \(P(X>x)=1-P(X\leq x)=1-F_{X}(x).\)
  2. Sea a y b tales que \(a<b\), \(P(a<X\leq b)=P(X\leq b)-P(X\leq a)=F_{X}(b)-F_{X}(a).\)

Demostración:

Tenemos que el complementario de \(X\) mayor que \(x\) es: \(\overline{\left\{X>x\right\}}=\left\{X>x\right\}^c=\left\{X\leq x\right\}\). Además,

\[P(X>x)=1-P(\overline{\left\{X>x\right\}})=1-P(X\leq x)=1-F_{X}(x),\]

lo que demuestra la primera propiedad.

Por otro lado, que \(X\) se encuentre entre dos valores \(a\) y \(b\) es \(\left\{a< X \leq b\right\}= \left\{X\leq b\right\}-\left\{X\leq a\right\}\). Ahora podemos hacer

\[\begin{eqnarray*} P(a<X\leq b)&=&P(\left\{X\leq b\right\}-\left\{X\leq a\right\})\\ &=& P(\left\{X\leq b\right\})-P(\left\{X\leq a\right\})\\ &=& F_{X}(b)-F_{X}(a). \end{eqnarray*}\]

Más propiedades de la Función de Distribución

Sea \(F_{X}\) la función de distribución de una v.a. \(X\) entonces:

  • \(0\leq F_{X}(x)\leq 1\).
  • La función \(F_{X}\) es no decreciente.
  • La función \(F_{X}\) es continua por la derecha.
  • Si denotamos por \(F_X(x_0^{-})=\displaystyle \lim_{x\to x_0^{-}} F(x)\), entonces se cumple que \(P(X< x_0)=F_X(x_0^{-})\) y que \(P(X=x_0)=F_X(x_0)-F_X(x_0^{-})\).
  • Se cumple que \(\displaystyle \lim_{x\to\infty} F_{X}(x)=1\); \(\displaystyle \lim_{x\to-\infty}F_{X}(x)=0\).
  • Toda función \(F\) verificando las propiedades anteriores es función de distribución de alguna v.a. \(X\).
  • \(P(X>x)=1-F_{X}(x)\).
  • Dados \(a,b\in \mathbb{R}\) con \(a<b\), \[P(a<X\leq b)=F_{X}(b)-F_{X}(a).\]

Advertencia desigualdades estrictas

En las propiedades anteriores no se pueden cambiar, en general, las desigualdades de estrictas o no estrictas.

Veamos qué propiedades tenemos cuando se cambian estas desigualdades.

Dada una \(F_{X}\) una función de distribución de la v.a. \(X\) y denotamos por \[F_{X}(x_0^{-})=\displaystyle \lim_{x\to x_0^{-}} F_{X}(x),\] entonces se cumplen las siguientes igualdades:

  • \(P(X=x)=F_{X}(x)-F_{X}(x^{-})\).
  • \(P(a< X< b)=F_{X}(b^{-})-F_{X}(a)\).
  • \(P(a\leq X< b)=F_{X}(b^{-})-F_{X}(a^{-})\).
  • \(P(X<a)=F_{X}(a^{-})\).
  • \(P(a\leq X\leq b)=F_{X}(b)-F_{X}(a^{-})\).
  • \(P(X\geq a)=1-F_{X}(a^{-})\).
  • Si \(F_X\) es continua en \(x\) se tiene que \(P(X=x)=0\). Así que si la v.a. es continua \(P(X\leq a)=P(X< a)+P(X=a)=P(X<a)\) y propiedades similares.
  • Sea \(X\) una variable aleatoria discreta que con dominio \(D_X\) y que tiene por función de probabilidad \(P_{X}(x)\) entonces su función de distribución \(F_{X}(x_0)\) es \[F_{X}(x_0)=\sum_{x\leq x_0} P_{X}(x),\] donde \(\sum\limits_{x\leq x_0}\) indica que sumamos todos los \(x \in D_X\) tales que \(x\leq x_0\).

Demostración:

Si \(X\) es continua \[P(X=a)=F(a)-F(a^{-})=F(a)-F(a)=0,\] por lo tanto \[P(X\leq a)=P(X<a)+P(X=a)= P(X<a)+0= P(X<a),\] lo que demuestra la primera propiedad.

Para demostrar la segunda basta hacer \[ F_{X}(x_0)= P(X\leq x_0)=P\left(\bigcup_{x\leq x_0; x\in D_X} \{x\}\right)= \sum_{x\leq x_0}P(X=x)= \sum_{x\leq x_0}P_{X}(x). \]

Example 2.8 Ejemplo: dado (continuación)

En el experimento del dado se tiene que:

\[P_{X}(x)=\left\{\begin{array}{ll} \frac16, & \mbox{si } x=1,2,3,4,5,6,\\ 0, & \mbox{en el resto de casos.}\end{array}\right.,\]

por lo tanto, \[F_{X}(x)=P(X\leq x)=\left\{\begin{array}{ll} 0, & \mbox{si } x<1,\\[1ex] \frac16, &\mbox{si } 1\leq x<2,\\[1ex] \frac26, &\mbox{si } 2\leq x<3,\\[1ex] \frac36, &\mbox{si } 3\leq x<4,\\[1ex] \frac46, &\mbox{si } 4\leq x<5,\\[1ex] \frac56, &\mbox{si } 5\leq x<6,\\[1ex] 1, &\mbox{si } 6\leq x.\end{array}\right.\]

Calculemos más detalladamente algún valor de \(F_{X}\), por ejemplo:

\[\begin{eqnarray*} F_{X}(3.5) & = & P(X\leq 3.5)= P(\{X=1\}\cup\{X=2\}\cup \{X=3\})\\ &=& P(\{X=1\})+P(\{X=2\})+P(\{X=3\})\\ &=& \frac16+\frac16+\frac16=\frac36 =\frac12, \end{eqnarray*}\] o de otra forma, \[\begin{eqnarray*} F_{X}(3.5)&=&\sum_{x\leq 3.5} P_X(x)=\sum_{x=1}^3 P(X=x)\\&=&\sum_{x=1}^3 \frac16= 3 \cdot \frac16=\frac12. \end{eqnarray*}\]

Propiedades de la función de distribución

Sea \(X\) una variable con función de distribución \(F_{X}\) entonces:

  • \(0\leq F_{X}(x)\leq 1\), para todo \(x\).
  • Si \(x<x'\), entonces \(F_{X}(x)\leq F_{X}(x'),\) es decir, es una función creciente, no necesariamente estrictamente creciente.
  • \(\displaystyle \lim_{x\to -\infty}F_{X}(x)=0\) y \(\displaystyle \lim_{x\to +\infty}F_{X}(x)=1\).
  • Es continua por la derecha: \(\displaystyle \lim_{x\to x_0^{+}}F_{X}(x)=F_{X}(x_0)\).

2.2.2 Valores esperados o esperanza

Al igual que en la estadística descriptiva se utilizan distintas medidas para resumir los valores centrales y para medir la dispersión de una muestra, podemos definir las correspondientes medidas para variables aleatorias.

A estas medidas se les suele añadir el adjetivo poblacionales mientras que a las que provienen de la muestra se las adjetiva como muestrales.

Por ejemplo, podemos buscar un valor que resuma toda la variable. Este valor es el que “esperamos” que se resuma la v.a. o esperamos que las realizaciones de la v.a. queden cerca de él. Veamos su definición formal.

Esperanza de una variable aleatoria discreta

El valor esperado o esperanza (expected value en inglés) \(E(X)\) de una v.a. discreta \(X\), se define como

\[ E(X)=\sum_{x\in X(\Omega)} x P_{X}(x). \]

En ocasiones se denomina media (mean en inglés) poblacional o simplemente media y muy frecuentemente se la denota \(\mu_{X}=E(X)\) o simplemente \(\mu=E(X)\).

Example 2.9 Ejemplo: lanzamiento de un dado \(n\) veces

Supongamos que lanzamos un dado \(n\) veces y obtenemos unas frecuencias absolutas \(n_{i}\) para el resultado \(i\) con \(i=1,\ldots,6\). Sea \(X\) la v.a. que nos representa el valor de una tirada del dado.

Calculemos la media aritmética (o media muestral) de los datos

\[ \overline{x}=\frac{1\cdot n_1+2\cdot n_2+3\cdot n_3+4\cdot n_4+5\cdot n_5+6 \cdot n_6}{n}=\sum_{x=1}^6 x\cdot \frac{n_{x}}{n}. \] Si \(n\to \infty\) se tiene que \(\displaystyle\lim_{n\to \infty} \frac{n_{x}}{n}=P_{X}(x).\)

Por lo tanto \(E(X)=\displaystyle \lim_{n\to\infty}\sum_{x=1}^6 x\cdot \frac{n_{x}}{n}.\)

Entonces el valor esperado en una v.a. discreta puede entenderse como el valor promedio que tomaría una v.a. en un número grande de repeticiones.

Example 2.10 Ejemplo: Erratas en un texto

Sea \(X\) el número de erratas en una página de un texto, con dominio \(D_X=\{0,1,2\}\).

Resulta que

\[ P(X=0)=0.42,\ P(X=1)=0.4,\ P(X=2)=0.18. \]

entonces

\[ E(X)=0\cdot 0.42+ 1\cdot 0.4 + 2 \cdot 0.18=0.76. \]

Elegida una página del texto al azar esperamos encontrar \(0.76\) errores por página.

Supongamos que el editor nos paga \(2\) euros por cada página que encontremos con \(1\) error y \(3\) euros por cada página con dos errores (y nada por las páginas correctas) ¿Cuánto esperamos cobrar si analizamos una página?

\[0\cdot 0.42 + 2\cdot 0.4 + 3\cdot 0.18=1.34.\]

Esperanzas de funciones de variables aleatorias discretas

Sea \(X\) una v.a. discreta con función de probabilidad \(P_{X}\) y de distribución \(F_{X}\). Entonces el valor esperado de una función \(g(x)\) es :

\[E(g(X))=\sum_{x}g(x)\cdot P_{X}(x).\]

Propiedades de los valores esperados

  • \(E(k)=k\) para cualquier constante \(k\).
  • Si \(a\leq X\leq b\) entonces \(a\leq E(X)\leq b\).
  • Si \(X\) es una v.a. discreta que toma valores enteros no negativos entonces \(E(X)=\sum_{x=0}^{+\infty}(1- F_X(x)).\)

Exercise 2.1 Ejercicio

La demostración de las propiedades anteriores se deja como ejercicio.

Example 2.11 Ejemplo: paleta de colores aleatoria

Supongamos que estamos sentados delante de nuestro ordenador con un amigo y le decimos que en dos minutos podemos programar una paleta para poner colores a unos gráficos.

Queremos que la paleta tenga dos botones con las opciones color rojo y color azul. Como hemos programado a gran velocidad resulta que el programa tiene un error; cada vez que se abre la paleta los colores se colocan al azar (con igual probabilidad) en cada botón, así que no sabemos en qué color hemos de pinchar.

Además, como nos sobraron \(15\) segundos para hacer el programa y pensando en la comodidad del usuario, la paleta se cierra después de haber seleccionado un color y hay que volverla a abrir de nuevo.

La pregunta es: ¿cuál es el valor esperado del número de veces que hemos pinchar el botón de color azul antes de obtener este color?

Llamemos \(X\) al número de veces que pinchamos en el botón azul (y nos sale rojo) hasta obtener el primer azul. La variable \(X\) toma valores en los enteros no negativos. Su función de probabilidad queda determinada por

\[ P_X(x)=P(X=x)=P(\stackrel{x \mbox{ veces}}{\overbrace{rojo, rojo,\ldots,rojo},azul}) =\left(\frac12\right)^{x+1}. \]

Series geométricas

Una progresión geométrica de razón \(r\) es una sucesión de la forma
\[ r^0, r^1,\ldots,r^n,\ldots. \] La serie geométrica es la suma de todos los valores de la progresión geométrica \(\displaystyle\sum_{k=0}^{+\infty} r^k\).

Propiedades

  • Las sumas parciales desde el término \(n_0\) al \(n\) de una progresión geométrica valen \[ \sum_{k=n_0}^n r^k=\frac{r^{n_0}- r^n r}{1-r}. \]

  • Si \(|r|<1\) la serie geométrica es convergente y \[\sum_{k=0}^{+\infty } r^k=\frac1{1-r}\].

  • En el caso en que se comience en \(n_0\) se tiene que \[\sum_{k=n_0}^{+\infty} r^k=\frac{r^{n_0}}{1-r}.\]

  • Si \(|r|<1\) también son convergentes las derivadas, respecto de \(r\), de la serie geométrica y convergen a la derivada correspondiente. Así tenemos que

\[\begin{eqnarray*} \left(\sum_{k=0}^{+\infty} r^k\right)'= & \sum_{k=1}^{+\infty}k r^{k-1} = \left(\frac1{1-r}\right)'=\frac1{(1-r)^2}\\ \left(\sum_{k=0}^{+\infty} r^k\right)^{''}=& \sum_{k=2}^{+\infty}k (k-1) r^{k-2} = \left(\frac1{1-r}\right)^{''}=\frac2{(1-r)^3}. \end{eqnarray*}\]

Example 2.12 Ejemplo: paleta de colores (continuación)

Si seguimos con el ejemplo de la paleta de colores, su esperanza es:

\[\begin{eqnarray*} E(X)&=&\sum_{x=0}^{+\infty} x\cdot P(X=x)=\sum_{x=0}^{+\infty} x\cdot \left(\frac12\right)^{x+1}\\ &= & \left(\frac12\right)^2\sum_{x=1}^{+\infty} x\cdot \left(\frac12\right)^{x-1}=\left(\frac12\right)^2 \frac1{\left(1-\frac12\right)^2}=1. \end{eqnarray*}\]

Ahora calculemos su función de distribución

\[\begin{eqnarray*} F_X(x)&=& P(X\leq x)=\sum_{k=0}^x P(X=k)=\sum_{k=0}^x \left(\frac12\right)^{k+1}\\ &=& \frac{\frac12-\frac12^{x+1}\cdot \frac12}{1-\frac12}=1-\left(\frac12\right)^{x+1}. \end{eqnarray*}\]

Como la variable toma valores enteros positivos, podemos calcular su valor esperado de esta otra manera

\[E(X)=\sum_{x=0}^{+\infty} (1-F_X(x))=\sum_{x=0}^{+\infty}\left(\frac12\right)^{x+1}=\frac12\cdot \frac1{1-\frac12}=1.\]

Exercise 2.2 Ejercicio

Calculad el valor esperado de la variable

\[ Y=\mbox{número de intentos para conseguir el color azul.} \]

Momentos de orden \(m\)

Llamaremos momento de orden \(m\) respecto al punto \(C\) a \[E\left((X-C)^m\right).\]

  • Cuando \(C=0\) los momentos reciben el nombre de momentos respecto al origen.
  • Cuando \(C=E(X)\) reciben el nombre de momentos centrales o respecto de la media. Luego la esperanza es el momento de orden \(1\) respecto al origen. Estos momentos son la versión poblacional de los momentos que vimos en el curso de estadística descriptiva, recibiendo estos último el nombre de momentos muestrales.

Resumen de conceptos

  • Hemos descrito el comportamiento aleatorio de una v.a. discreta mediante sus funciones de probabilidad \(P_{X}\) y de distribución \(F_{X}\).
  • También tenemos un valor central; el valor esperado \(E(X)\).
  • Como medida básica nos queda definir una medida de lo lejos que están los datos del valor central, \(E(X)\). Una de estas medidas es la varianza de \(X\).

2.2.3 Medidas de la variabilidad

Varianza

Sea \(X\) una v.a. Llamaremos varianza de \(X\) a

\[Var(X)=E((X-E(X))^2).\]

Por lo tanto, la varianza es el momento central de orden \(2\).

De forma frecuente se utiliza la notación \[\sigma_{X}^2=Var(X).\]

A la raíz cuadrada positiva de la varianza \[\sigma_{X}=+\sqrt{Var(X)},\]

se la denomina desviación típica o estándar de \(X\).

Propiedad

  • Si \(X\) es una v.a. discreta con función de probabilidad \(P_X\) su varianza es \[\sigma_{X}^2=Var(X)=E((X-E(X))^2)=\sum_{x}(x-E(X))^2 \cdot P_{X}(x).\]
  • Sea \(X\) una v.a. \[Var(X)=E(X^2)-(E(X))^2=\sum_{x} x^2\cdot P_{X}(X)-(E(X))^2\]

Demostración de b)

\[\begin{eqnarray*} Var(X)&= & \sum_{x}(x-E(X))^2 \cdot P_{X}(x) = \sum_{x}(x^2 -2 x E(X)+(E(X)^2)\cdot P_{X}(x)\\ &=& \sum_{x}x^2 \cdot P_{X}(x) - E(X)\sum_{x}2 x\cdot P_{X}(x) + (E(X)^2)\sum_{x} P_{X}(x)\\ &=& E(X^2)- 2 E(X)\cdot E(X) + (E(X))^2=E(X^2)-(E(X))^2. \end{eqnarray*}\]

Example 2.13 Ejemplo: número de errores (continuación)

Calculemos en el ejemplo anterior la varianza del número de errores.

Recordemos que:

\[ P(X=0)=0.42,\ P(X=1)=0.4, \ P(X=2)=0.18, \] y que \[ E(X)=0.76. \] Entonces:

\[ Var(X)=E(X^2)-(E(X))^2 = E(X^2)-(0.76)^2. \] Ahora necesitamos calcular

\[E(X^2)= 0^2 (0.41)+ 1^2 (0.4)+ 2^2 (0.18)=0.4+0.72=1.12,\] y por lo tanto

\[Var(X)= E(X^2)-(0.76)^2=1.12-0.5776=0.542,\] y \[\sqrt{Var(X)}=\sqrt{0.542}.\]

En resumen \(\sigma_{X}^2=0.542\) y \(\sigma_{X}=\sqrt{0.542}.\)

Más propiedades de la varianza

  • \(Var(X)\geq 0\).
  • \(Var(cte)=E(cte^2)-(E(cte))^2= cte^2 - cte^2=0\).
  • El mínimo de \(E((X-C)^2)\) se alcanza cuando \(C=E(X)\) y es \(Var(X)\). Esta propiedad es una de las que hace útil a la varianza como medida de dispersión.

Exercise 2.3 Ejercicio

Se deja como ejercicio la demostración de estas propiedades.

2.2.4 Transformaciones lineales.

Transformación lineal

Un cambio de variable lineal o transformación lineal de una v.a. \(X\) es otra v.a. \(Y= a+ b X\) donde \(a,b\in\mathbb{R}\).

Esperanza de una transformación lineal

Sea \(X\) una v.a. con \(E(X)=\mu_{X}\) y \(Var(X)=\sigma_{X}^2\) y \(a,b\in\mathbb{R}\). Entonces si \(Y=a+b X\):

  • \(E(Y)=E(a + b X)=a+ b\cdot E(X)= a + b\cdot \mu_{X}\).
  • \(Var(Y)=Var(a+bX)=b^2\cdot Var(X)= b^2 \cdot \sigma_{X}^2\).
  • \(\sigma_{Y}=\sqrt{Var(Y)}=\sqrt{b^2\cdot Var(X)}=|b|\cdot \sigma_{X}\).

Demostración:

\[\begin{eqnarray*} E(Y)&=& E(a+bX)=\sum_{x}(a+b\cdot X)\cdot P_{X}(x)\\ &=& a \sum_{x} P_{X}(x) + b \sum_{x} x\cdot P_{X}(x)\\ &=& a + b\cdot E(X)=a + b \mu_{X}. \end{eqnarray*}\]

Exercise 2.4 Ejercicio

Las demostración de las demás propiedades se dejan como ejercicio.

2.3 Variables aleatorias continuas

Como ya hemos dicho las variables aleatorias continuas toman valores en intervalos o áreas.

Lo más habitual es que estas variables tengan función de distribución continua y derivable (salvo a los mejor en una cantidad finita o numerable de puntos).

En lo que sigue supondremos que la función de distribución de variables aleatorias continuas cumplen estas propiedades.

Notemos que si \(X\) es una v.a. con función de distribución continua se tiene que \(P(X=x_0)=F_X(x_0)-F(x_0^{-})=0\). Por lo que no tiene sentido definir función de probabilidad.

En general tendremos que \(P(X<x_0)=P(X\leq x_0)\).

Por otra parte podemos utilizar una regla parecida del cociente entre casos favorables y casos posibles de Laplace pero en este caso el conteo se hace por la medida de los casos posibles partida por la medida de los casos favorables.

Veamos un ejemplo de v.a. continua, que ampliaremos en el tema siguiente, en el que se utilizan todos estos conceptos.

Example 2.14 Ejemplo: distancia de un dardo al centro de la diana

Supongamos que lanzamos un dardo a una diana de radio \(1\), de forma que sea equiprobable cualquier distancia al centro (¡Cuidado! esto no es equivalente a que cualquier punto de la diana sea equiprobable).

Consideremos la v.a. continua \(X=\) distancia del dardo al centro de la diana.

Su función de distribución es

\[ F_{X}(x)= \left\{ \begin{array}{ll} 0, & \mbox{si } x\leq 0,\\ x, & \mbox{si } 0<x<1,\\ 1, & \mbox{si } x\geq 1. \end{array} \right. \]

  • C.F. longitud favorable es \(x-0\).
  • C.P. longitud posible es \(1-0\).
  • Luego \[P(X\leq x)=\frac{C.F.}{C.P.}=\frac{x-0}{1-0}=x.\]
curve(punif(x,0,1),xlim=c(-1,2),col="blue",
      main="Función de distribución de una v.a. uniforme en el intervalo unidad.")

2.3.1 Propiedades

En las variables continuas los sucesos del tipo \(\{X\leq x \}\) y \(\{X< x \}\) tendrán la misma probabilidad, y otros tipos de sucesos similares también. Algunas de estas propiedades se explicitan en la siguiente proposición.

Propiedades

Dada una v.a. continua \(X\) se tiene que:

  • \(P(X\leq b)=P(X<b)\).
  • \(P(X<b)=P(X<a)+P(a<X<b)\).
  • \(P(a<X<b)=P(X<b)-P(X<a)\).

Demostración:

La primera es evidente \(P(X\leq b)=P(X<b)+P(X=b)=P(X<b)\).

Para demostrar la segunda, tenemos

\[\{X\leq a\}\cap \{a<X<b\}=\emptyset,\] \[\{X\leq a\}\cup \{a<X<b\}=\{X<b\},\] entonces \[\begin{eqnarray*} P(X< b) & = & P(\{X\leq a\}\cup \{a<X<b\})\\ & = & P(X\leq a)+P(a<X<b) \\ & = & P(X< a)+P(a<X<b). \end{eqnarray*}\]

Exercise 2.5 Ejercicio

La demostración de la tercera propiedad es similar a la segunda pero aplicando la primera. La dejamos como ejercicio.

Propiedades de la función de distribución

Las propiedades anteriores y combinaciones de ellas se pueden escribir utilizando la función de distribución de \(X\):

Propiedades de la Función de Distribución

Dada una variable aleatoria continua se tiene que:

  • \(F_{X}(b)=F_{X}(a)+P(a<X<b)\).
  • \(P(a<X<b)=F_{X}(b)-F_{X}(a)\).
  • \(P(a\leq X\leq b)=F_{X}(b)-F_{X}(a)\).

Exercise 2.6 Ejercicio Se deja la demostración como ejercicio.

Example 2.15 Ejemplo: diana (continuación)

En el ejemplo de la diana:

\[P(0.25<X<0.3)=F_{X}(0.3)-F_{X}(0.25)=0.3-0.25=0.05.\]

2.3.2 Función de densidad

Función de densidad

Una función \(f:\mathbb{R}\to\mathbb{R}\) es una función de densidad sobre \(\mathbb{R}\) si cumple que

  • \(f_{X}(x)\geq 0\) para todo \(x \in\mathbb{R}.\)
  • \(f\) es continua salvo a lo sumo en una cantidad finita de puntos sobre cada intervalo acotado de \(\mathbb{R}\).
  • \(\displaystyle\int\limits_{-\infty}^{+\infty} f_{X}(x) dx=1.\)

Función de distribución de una variable aleatoria

Sea \(X\) una v.a. con función de distribución \(F_X\). Sea \(f:\mathbb{R}\to\mathbb{R}\) una función de densidad tal que

\[F_X(x)=\displaystyle\int_{-\infty}^{x} f_X(t)\,dt,\mbox{ para todo } x\in\mathbb{R}.\]

Entonces \(X\) es una variable aleatoria continua y \(f_X\) es la densidad de la v.a. \(X\).

El conjunto \(D_X=\{x\in\mathbb{R}| f_x(x)>0\}\) recibe el nombre de soporte o dominio de la variable aleatoria continua y se interpreta como su conjunto de resultados posibles.

Ejemplo: diana (continuación)

En nuestro ejemplo, la función \(f\) es una densidad

\[ f_{X}(x)=\left\{ \begin{array}{ll} 0, & \mbox{si } x\leq 0,\\ 1, & \mbox{si } 0 < x < 1,\\ 0, & \mbox{si } 1\leq x, \end{array}\right. \] que es la densidad de \(X\). En efecto:

  • Si \(x \leq 0\), entonces \(\displaystyle\int_{-\infty}^x f_X(t) dt = 0.\)

  • Si \(0\leq x\leq 1\), entonces \(\displaystyle\int_{-\infty}^x f_X(t) dt = \int_0^x 1\, dt = x.\)

  • Si \(x\geq 1\), entonces \(\displaystyle\int_{-\infty}^x f_X(t) dt = \int_0^1 1\, dt = 1.\)

Por lo tanto, \(F_X(x)=\displaystyle\int_{-\infty}^x f_X(t) dt\) para todo \(x\in\mathbb{R}.\)

curve(dunif(x,0,1),xlim=c(-0.5,1.5),col="blue",
      main="Densidad de la distribución uniforme en [0,1]")

2.3.3 Utilidad de la función de densidad

La función de densidad nos permite calcular diversas probabilidades.

Propiedades de la función de densidad

  • Sea \(X\) una v.a. continua con función de distribución \(F_X\) y de densidad \(f_X\), entonces \[\begin{eqnarray*} P(a< X< b) &=& P(a<X\leq b)= P(a\leq X< b)=\\ & & P(a\leq X\leq b)= \displaystyle\int_{a}^b f_X(x) dx. \end{eqnarray*}\]

  • Si \(A\) es un subconjunto de \(\mathbb{R}\) entonces

\[ P(X\in A)=\displaystyle\int_{A} f(x) dx=\displaystyle\int_{A\cap D_X} f(x) dx. \]

Propiedades de la función de densidad

Sea \(X\) una v.a. continua con función de distribución \(F_X\) y de densidad \(f_X\), entonces:

  • Si \(f_x\) es continua en un punto \(x\), \(F_X\) es derivable en ese punto y \(F_X'(x)=f_X(x).\)
  • \(P(X=x)=0\) para todo \(x\in\mathbb{R}.\)

Exercise 2.7 Ejercicio

Comprobar estas propiedades en el ejemplo de la diana.

Example 2.16 Ejemplo: tiempo ejecución de un proceso.

Sea \(X=\) tiempo de ejecución de un proceso. Se supone que \(X\) sigue una distribución uniforme en dos unidades de tiempo, si tarda más el proceso se cancela.

Calculemos la función de densidad y de distribución de la v.a \(X\).

Entonces

\[ F_{X}(x)=P(X\leq x)=\frac{\mbox{Casos Favorables}}{\mbox{Casos Posibles}}=\frac{x}2. \]

Luego su función de distribución es:

\[ F_{X}(x)=\left\{\begin{array}{ll} 0, & \mbox{si } x\leq 0,\\[1ex] \frac{x}2, & \mbox{si } 0<x<2,\\[1ex] 1, & \mbox{si } 2\leq x. \end{array}\right. \]

Su función de densidad por su lado es: \[ f_{X}(x)=F_{X}'(x)=\left\{\begin{array}{ll} 0, & \mbox{si } x\leq 0,\\[1ex] \frac12, & \mbox{si } 0<x\leq 2,\\[1ex] 0, & \mbox{si } 2\leq x. \end{array}\right. \]

Efectivamente

  • \(f_{X}(x)\geq 0,\) y tiene un conjunto finito de discontinuidades: \(\{0,2\}\).

  • \(F_X(x)=\int_{-\infty}^x f_X(t) dt,\) para todo \(x\in \mathbb{R}\). (Ejercicio: resolverlo gráficamente.)

  • \(\displaystyle\int\limits_{-\infty}^{+\infty}f_{X}(x)dx=\int\limits_0^2\frac12dx=\left[\frac{x}2\right]_0^2=\frac22-\frac02=1.\)

Exercise 2.8 Ejercicio: tiempo de un proceso

Calcular la probabilidad de que uno de nuestros procesos tarde más de una unidad de tiempo en ser procesado. Calcular también la probabilidad de que dure entre \(0.5\) y \(1.5\) unidades de tiempo.

2.3.4 Esperanza y varianza para variables aleatorias continuas

Los mismos comentarios y definiciones que se dieron en la sección correspondiente del tema de estadística descriptiva son aplicables aquí.

Así que sólo daremos las definiciones, la forma de cálculo y algunos ejemplos.

En lo que sigue, salvo que diagamos lo contrario, \(X\) es una v.a. continua con función de densidad \(f_{X}(x)\)

Esperanza v.a. continuas

  • Su esperanza es: \[E(X)=\displaystyle\int\limits_{-\infty}^{+\infty} x\cdot f_{X}(x)dx.\]
  • Si \(g(x)\) es una función de la variable \(X\) entonces: \[E(g(X))=\displaystyle\int\limits_{-\infty}^{+\infty} g(x)\cdot f_{X}(x)dx.\]

Varianza v.a. continuas

  • Su varianza es: \[ Var(X)=\sigma_{X}^2=E((X-\mu_{X})^2)= \displaystyle\int\limits_{-\infty}^{+\infty} (x-\mu_{X})^2 f_{X}(x)dx. \]
  • Su desviación típica es: \[\sigma_{X}=+\sqrt{\sigma_{X}^2}.\]

Propiedades

  • \(\sigma_{X}^2\geq 0\).
  • \(Var(cte)=E(cte^2)-(E(cte))^2= cte^2 - cte^2=0\).
  • \(\displaystyle Var(x)=E(X^2)-\mu_{X}^2=\int\limits_{-\infty}^{+\infty}x^2 f_{X}(x)dx - \mu_{X}^2.\)
  • El mínimo de \(E((X-C)^2)\) se alcanza cuando \(C=E(X)\) y es \(Var(X)\).

Example 2.17 Ejemplo: diana (continuación)

Calcular \(\mu_{X}\) y \(\sigma_{X}^2\) en el ejemplo de la diana.

Resultado \[\mu_{X}=\frac12,\ E(X^2)=\frac13,\ Var(X)=\frac1{12}.\]

Proposición

Sea \(X\) una v.a. continua con \(E(X)=\mu_{X}\) y \(Var(X)=\sigma_{X}^2\) sea \(Y=a+b\cdot X\), donde \(a,b\in\mathbb{R}\), es una nueva v.a. continua obtenida mediante una transformación lineal de \(X\). Se verifican las mismas propiedades que en el caso discreto:

  • \(E(Y)=E(a+b\cdot X)=a+b\cdot E(X)\).
  • \(Var(Y)=Var(a+b\cdot X)=b^2\cdot Var(X)\).
  • \(\sigma_{Y}=|b|\cdot \sigma_{X}\).
  • \(Z=\frac{X-\mu_{X}}{\sigma_{X}}\) es una transformación lineal de \(X\) de forma que \[E(Z)=0 \mbox{ y } Var(Z)=1.\]

Example 2.18 Ejemplo: venta de vinos

En una empresa de venta de vinos por internet, sea \(X\) el número de litros de vino del país vendidos en un año. Supongamos que sabemos que \(E(X)=10000\) y que \(Var(X)=100\). Supongamos que los gastos fijos de distribución son 50.000 € y el beneficio por litro es de 10 € por botella. Definimos \(T=10 X-50000\) que será el beneficio después de gastos.

Entonces la esperanza del beneficio es \[E(T)=10 E(X)-50000 = 50000,\] y \[Var(T)=10^2 Var(X)= 10000.\]

2.4 Transformaciones de variables aleatorias

Muchas variables aleatorias son funciones de otras v.a. En lo que sigue resumiremos diversas técnicas para dada una v.a. \(X\) y una transformación \(Y=h(X)\) encontrar \(F_{Y}\) a partir de \(F_{X}\).

Tranformaciones de v.a. discretas

Sea \(X\) una v.a. discreta con \(X(\Omega)=\{x_1,x_2,\ldots,x_{n},..\}\) y sea \(h:\mathbb{R}\to\mathbb{R}\) una aplicación. Entonces \(Y=h(X)\) es también una v.a. discreta. Además si \(P_X\) y \(F_{X}\) son las funciones de probabilidad y de distribución de \(X\) entonces

  • \(\displaystyle P_{Y}(y)=\sum_{x_{i}|h(x_{i})=y}P_X(x_{i}).\)
  • \(\displaystyle F_{Y}(y)=\sum_{x_{i}|h(x_{i})\leq y} P_X(x_{i}).\)

Desafortunadamente para variables no discretas, el resultado no es tan sencillo como la expresión anterior, pues la transformación de, por ejemplo, una v.a. continua puede ser continua, discreta, mixta, \(\ldots\)

Transformación de v.a. continuas en continuas

Sea \(X\) una v.a. continua cuya función de densidad es \(f_{X}\). Sea \(h:\mathbb{R}\to\mathbb{R}\) una aplicación estrictamente monótona y derivable; por lo tanto, \(h'(x)\not=0\) para todo \(x\in\mathbb{R}\). Sea \(Y=h(X)\) la transformación de \(X\) por \(h\). Entonces \(Y\) es una v.a. continua con función de densidad

\[f_{Y}(y)=\left.\frac{f_{X}(x)} {\left|h'(x)\right|}\right|_{x=h^{-1}(y)}.\]

Densidad de una transformación de una v.a. continua

Sea \(X\) una v.a. continua cuya función de densidad es \(f_{X}\). Sea \[h:\mathbb{R}\to\mathbb{R},\] una aplicación, no necesariamente monótona tal que :

  • sea derivable con derivada no nula,
  • la ecuación \(h(x)=y\) tiene un número finito de soluciones \(x_1,x_2,..,x_{n}\),

entonces:

\[ \displaystyle f_{Y}(y)=\left.\sum_{k=1}^{n} \frac{f_{X}(x)} {\left|h'(x)\right|}\right|_{x=x_{k}}. \]

Método general de transformación de v.a.

Cuando no podamos aplicar las propiedades anteriores intentaremos calcular primero la función de distribución de la transformación y luego su densidad.

Notemos que en general si \(Y=g(X)\) es una v.a. transformación de la v.a. \(X\) entonces

\[ F_{Y}(y)=P(Y\leq y)=P(g(X)\leq y). \]

Por ejemplo, si \(g\) es estrictamente creciente y continua,

\[ F_{Y}(y)=P(g(X)\leq y)=P(X\leq g^{-1}(y))=F_{X}(g^{-1}(y)), \] y si \(g\) es estrictamente decreciente y continua, \[ F_{Y}(y)=P(g(X)\leq y)=P(X\geq g^{-1}(y))=1-F_{X}(g^{-1}(y)). \]

2.5 Desigualdades de Markov y de Chebychev

En esta sección veremos distintas desigualdades que acotan determinadas probabilidades de una variable aleatoria.

Estas desigualdades sirven en algunos casos para acotar probabilidades de determinados sucesos.

También son útiles desde el punto de vista teórico, por ejemplo para justificar que la varianza es una medida de la dispersión de los datos.

2.5.1 Desigualdad de Markov

Desigualdad de Markov

Sea \(X\) una v.a. positiva con \(E(X)\) finita. Entonces

\[P(X\geq a)\leq \frac{E(X)}{a},\mbox{ para todo }a>0.\]

Demostración:

Si \(X\) es continua y solo toma valores positivos

\[\begin{eqnarray*} E(X) &=& \int_{-\infty}^{+\infty} x\cdot f_{X}(x) dx= \int_0^{+\infty} x\cdot f_{X}(x) dx= \int_0^{a} x\cdot f_{X}(x) dx +\int_{a}^{+\infty} x\cdot f_{X}(x) dx \\ & &\geq \int_{a}^{+\infty} x\cdot f_{X}(x) dx \geq a \int_{a}^{+\infty} f_{X}(x) dx = a \cdot P(X\geq a), \end{eqnarray*}\] de donde se sigue que \[P(X\geq a)\leq \frac{E(X)}{a}.\]

Corolario

Sea \(X\) una v.a. con \(E(X)\) finita entonces para todo \(a>0\)

\[P(|X|\geq a )\leq \frac{E(|X|)}{a}.\]

Exercise 2.9 Ejercicio

Demuestra el corolario anterior a partir de la desigualdad de Markov.

2.5.2 Desigualdad de Chebychev

Desigualdad de Chebychev

La desigualdad de Chebychev también se denomina de Chebyshov y en inglés Chebyshev.

Sea \(X\) una v.a. con \(E(X)=\mu\) y \(Var(X)=\sigma^2\) entonces para todo \(a>0\),

\[P(|X-\mu|\geq a)\leq \frac{\sigma^2}{a^2}.\]

Demostración

Apliquemos la consecuencia de la desigualdad de Markov a la v.a. no negativa \(Y^2=(X-\mu)^2\). Entonces

\[ P(Y^2\geq a^2) \leq \frac{E(Y^2)}{a^2}=\frac{E((X-\mu)^2)}{a^2} = \frac{Var(X)}{a^2}=\frac{\sigma^2}{a^2}. \] Por otra parte

\[ P(Y^2\geq a^2)=P(|Y|\geq a)= P(|X-\mu|\geq a), \] hecho que, junto con la desigualdad anterior, demuestra el resultado.

Utilidad básica de la desigualdad de Chebychev

Supongamos que \(X\) es una v.a. con \(Var(X)=0\). Entonces, aplicando la desigualdad anterior, \[P(|X-E(X)|\geq a )=0,\mbox{ para todo }a>0,\] lo que implica que \[P(X=E(X))=1,\] por lo que probabilidad de que \(X\) sea constantemente \(E(X)\) es 1, hecho que nos confirma la utilidad de la varianza como una medida de la dispersión de los datos.

Example 2.19 Ejemplo: tiempo de respuesta

Se sabe que el tiempo de respuesta medio y la desviación típica de un sistema multiusuario son 15 y 3 unidades de tiempo, respectivamente. Entonces: \[ P(|X-15|\geq 5)\leq \frac9{25}=0.36. \]

Si substituimos \(a\) por \(a\cdot \sigma\) en la desigualdad de Chebychev, nos queda:

\[ P(|X-\mu|\geq a \sigma)\leq \frac{\sigma^2}{(a\sigma)^2}=\frac1{a^2}, \] que es otra manera de expresar la desigualdad de Chebychev.

Más formas de la desgualdad de Chebychev

La desigualdad de Chebychev también se puede escribir de al menos dos maneras más:

\[ P(\mu-a\leq X\leq \mu+a)\geq 1-\frac{\sigma^2}{a^2}, \] y tomado como \(a=k\cdot \sigma\), \[ P(\mu-k\cdot \sigma\leq X\leq \mu+ k \cdot \sigma)\geq 1-\frac1{k^2}. \]

Tomando la segunda expresión que hemos visto para la desigualdad de Chebychev para distintos valores de \(k>0\), tenemos la siguiente tabla:

k \(P(|X-E(X)|\geq k \cdot \sigma)\)
1 \(\leq 1\)
2 \(\leq 0.25\)
3 \(\leq 0.111\)
4 \(\leq 0.0025\)

Por ejemplo para \(k=2\), esta desigualdad se puede interpretar como que, dada una v.a. \(X\) con cualquier distribución que tenga \(E(X)\) y \(Var(X)\) finitos, la probabilidad de que un valor se aleje de la media \(\mu\) más de \(a=2\) desviaciones típicas es menor o igual que \(0.25\).

Es decir sólo el 25% de los valores estarán alejados de la media más de \(2\sigma\), ¡sea cual sea la distribución de la v.a.!

2.6 Cuantiles de variables aleatorias

Si \(X\) es una v.a. con dominio \(D_X\) y \(0<p<1\), llamaremos cuantil de orden \(p\) al menor valor perteneciente al dominio \(x_p\in D_X\) tal que: \[P(X\leq x_p)\geq p.\]

En R, cada distribución \(X\) tiene la función qX(p,...) que devuelve precisamente el cuantil \(x_p\) tal que \(P(X\leq x_p)\geq p.\)

Dada una variable aleatoria \(X\), si existe la inversa de la función de distribución de \(X\), \(F_X^{-1}\), el cuantil de orden \(p\) sería el valor que tiene la función \(F_X^{-1}\) en \(p\): \(x_p=F^{-1}(p)\).

En caso de no existir la inversa, dado \(p\), definimos el conjunto \(A_p\) como:

\[ A_p =\{x\in\mathbb{R},\ |\ F_X(x)\geq p\}. \]

Entonces el cuantil \(p\) es el mínimo del conjunto \(A_p\) considerando sólo valores del dominio de la variable: \(x_p =\displaystyle\min_{x\in D_X}(A_p)\). Este mínimo siempre existirá y nos da una fórmula explícita para calcular los cuantiles de cualquier variable aleatoria.

Example 2.20 Ejemplo: variable aleatoria que nos da el resultado del lanzamiento de un dado

Sea \(X\) la variable aleatoria uniforme discreta que nos da el número de puntos obtenidos en el lanzamiento de un dado (seis caras numeradas del 1 al 6).

Su dominio es \(D_X=\{1,2,3,4,5,6\}\) y su función de probabilidad es \[ P_X(x)=P(X=x)= \left\{ \begin{array}{ll} \frac{1}{6}, & \mbox{ si } x=1,2,3,4,5,6, \\ 0, & \mbox{ en otro caso. }. \end{array} \right. \] Su función de distribución es: \[ F_X(x)= P(X\leq x)= \left\{ \begin{array}{ll} 0, & \mbox{ si } x<1, \\ \frac{k}{6} & \mbox{ si } k\leq x< k+1 \mbox{ para } x= 1,2,3,4,5, \\ 1, & \mbox{si } x \geq 6. \end{array} \right. \]

La función siguiente llamada ddado nos define la función de probabilidad de \(X\) para un dado de \(n\) caras:

ddado=function(x,n=6) {
  sapply(x,FUN=function(x) {
    if( x %in% c(1:n)){return(1/n)} else {return(0)}})
  }

Por ejemplo, el valor de \(P_X(0.5)\) sería:

ddado(0.5,n=6)
[1] 0

y los valores de \(P_X(i)\) para \(i=1,\ldots 10\) sería:

ddado(1:10,n=6)
 [1] 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 0.0000000
 [8] 0.0000000 0.0000000 0.0000000

La función pdado nos da la función de distribución de \(X\):

pdado=function(x,n=6) 
  {
  sapply(x,FUN=function(y){ if (y<1){ return(0)}else{if(y>=n){return(1)} else
  {return(sum(ddado(c(1:(floor(y))),n=n)))}}})
  }

Los valores de \(F_X(i)\) para \(i=0,\ldots, 11\) serían:

pdado(0:11,6)
 [1] 0.0000000 0.1666667 0.3333333 0.5000000 0.6666667 0.8333333 1.0000000
 [8] 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000

A continuación, construímos la función qdado que nos calcula el cuantil \(p\), para \(0\leq p\leq 1\), de la variable \(X\) como el mínimo del conjunto \(A_p\):

qdado=function(p,n=6){
sapply(p,FUN=function(pp=p,nn=n) 
  {
  if(pp<0 | pp>1) {return(NA)}
  else {
  aux=pp>=pdado(1:n,nn)
  aux
  ifelse(all(!aux),return(1),return(max(which(pp>=pdado(1:n,nn)))))}}
)
}

Si \(p=1.5\) o \(p=-1\), la función anterior nos devuelve NA ya que ni 1.5 ni -1 están entre 0 y 1:

qdado(1.5)
[1] NA
qdado(-1)
[1] NA

Los cuantiles \(x_{0.1}\), \(x_{0.5}\) \(x_{0.6}\) y \(x_1\) son:

qdado(c(0.1,0.5,0.6,1))
[1] 1 3 3 6