Ejemplo
Tirar un dado de 6 caras y anotar el número de puntos de la cara superior.
Ejemplo
Los sucesos elementales del ejemplo anterior serían:
Ejemplo
El espacio muestral del ejemplo anterior del dado es\(\Omega=\Big\{\), , , , , \(\Big\}\)
pero por comodidad, a partir de ahora pondremos \[\Omega = \{1,2,3,4,5,6\}\]
Alguno sucesos notables que merece la pena nombrar son:
Ejercicio
¿Cuantos elementos contiene el conjunto de partes de \(\Omega\) del experimento anterior?
Se define un \(n\)-grama de una palabra como el conjunto de \(n\) letras consecutivas de la misma (contando los blancos de inicio y final de palabra que marcamos como “_”).
Ejemplo
Consideremos el experimento aleatorio que consiste en escoger al azar un 3-grama de la palabra “_Baleares_”. Vamos a escribir el espacio muestral y algunos sucesos elementales del mismo.
En este caso, si consideramos la palabra “_Baleares_”, el espacio muestral del experimento sería:
\[\Omega=\{\_Ba, Bal, ale, lea, ear, are, res, es\_\}\]
Algunos sucesos serían:
Si tenemos dos sucesos \(A,B\subseteq \Omega\), podemos definir:
Ejemplo
Supongamos que el sexo se divide entre Mujeres y Hombres. Vamos a definir el espacio muestral, los sucesos elementales y a realizar algunas operaciones entre ellos.
Algunas operaciones entre los conjuntos:
\[A\cup B=B\cup A, \quad A\cap B=B\cap A\]
\[A\cup(B\cup C)=(A\cup B)\cup C, \quad A\cap(B\cap C)=(A\cap B)\cap C\]
\[A\cap(B\cup C)=(A\cap B)\cup (A\cap C), \quad A\cup(B\cap C)=(A\cup B)\cap (A\cup C)\]
\(A\) | \(B\cap C\) | \(A\cup (B\cap C)\) |
---|---|---|
\(A\cup B\) | \(A\cup C\) | \((A\cup B)\cap (A\cup C)\) |
---|---|---|
\(A\) | \(A^c\) | \((A^c)^c\) |
---|---|---|
\[(A\cup B)^c=A^c\cap B^c\]
\(A\cup B\) | \((A\cup B)^c\) |
---|---|
\[(A\cup B)^c=A^c\cap B^c\]
\(A^c\) | \(B^c\) | \(A^c\cap B^c\) |
---|---|---|
\[(A\cap B)^c=A^c\cup B^c\]
\(A\cap B\) | \((A\cap B)^c\) |
---|---|
\[(A\cap B)^c=A^c\cup B^c\]
\(A^c\) | \(B^c\) | \(A^c\cup B^c\) |
---|---|---|
La probabilidad de un suceso es una puntuación (score) numérico entre 0 y 1 que mide la verosimilitud de que este evento se produzca.
Esta verosimilitud puede estar justificada por:
Estimación personal
Estimación de expertos
La frecuencia con la que se da
Cálculo formal
Sea \(\Omega\) el espacio muestral de un experimento aleatorio. Supongamos que el número de posibles resultados, por el momento, es finito.
Una probabilidad sobre \(\Omega\) es una aplicación \(P:\mathcal{P}(\Omega)\to [0,1]\) con las siguientes propiedades:
\[ P(A_1\cup A_2\cup \cdots \cup A_n)=P(A_1)+P(A_2)+\cdots +P(A_n) \]
Si \(a\in \Omega\) es un suceso elemental cometeremos el abuso de notación de poner \(P(a)\) en lugar de \(P(\{a\})\)
Ejemplo
En la página de la Fundación Banco de Sangre y Tejidos de las Islas Baleares podemos encontrar información sobre los porcentajes de tipos de sangre de los donantes de las Islas Baleares:
\[A: 46\%;\ B: 7.5\%;\ AB: 3.5\%;\ O: 43\%.\]
¿Cuál es la probabilidad de que un balear donante de sangre no sea del tipo O?
Experimento aleatorio: tipo de sangre de un paciente humano
\[\Omega=\{\mbox{A,B,AB,O}\}\]
Probabilidad de un suceso: se asimila al porcentaje observado de individuos
Suceso: \(\{\mbox{O}\}^c=\{\mbox{A,B,AB}\}\)
\[P(\{\mbox{O}\}^c)\!=\!P(\{\mbox{A,B,AB}\})\!=\! P(\mbox{A})+P (\mbox{B})+P(\mbox{AB})\!=\!0.57\]
\(P(\emptyset)=0\).
\(P(A-B)=P(A)-P(A\cap B)\) porque \(P(A)=P(A-B)+P(A\cap B)\).
Si \(B\subseteq A\), entonces \(0\leq P(B)\leq P(A)\).
\(P(A^c)=1-P(A)\).
\[\begin{eqnarray*} P(A)+P(B)-P(A\cap B) &=& P(A-B)+P(A\cap B)+\\ & & P(B-A)+ P(A\cap B)-P(A\cap B)\\ &=& P(A-B)+P(A\cap B)+ P(B-A) \\ &=& P(A\cup B). \end{eqnarray*}\]
\[P(A\cup B\cup C)=P(1)+P(2)+P(3)+P(4)+P(5)+P(6)+P(7).\]
Si \(A=\{a_1,a_2,\ldots,a_k\}\), entonces \[ P(A)=P(a_1)+P(a_2)+\cdots+P(a_k). \]
Si todos los sucesos elementales tienen la misma probabilidad, \[ P(A)=\frac{|A|}{|\Omega|}\Big(=\frac{\mbox{casos favorables}}{\mbox{casos posibles}}\Big). \]
Ejemplo
Los porcentajes de vocales de un determinado idioma (de alfabeto latino) según la Wikipedia son:
\[A: 18.7\%;\ E: 26.1\%;\ I: 25.7\%;\ O: 24.4\%;\ U: 5.1\%.\]
¿Cuál es la probabilidad que una vocal escogida al azar de este idioma sea una E o una O?
El espacio muestral del experimento es \(\Omega=\{A,E,I,O,U\}\).
El suceso que deseamos analizar es \(\{E,0\}\).
Y su probabilidad es
\[P(\{E,O\})=P(E)+P(O)=0.261+0.244=0.505.\]
Segun un árticulo de El País, en un control especial de la policía el \(0.1\%\) de todos los conductores analizados en un control de tráfico dan positivo en un el test en cocaína, y el \(1\%\) da positivo en cannabis. Un \(1.05\%\) da positivo en alguno de los dos test.
¿Cuál es la probabilidad que un individuo analizado en el control de drogas escogido al azar no de positivo en ninguno de lo dos test?
Los sucesos elementales del enunciado del problema son:
En este caso nos interesa estudiar los sucesos:
por tanto: \[P((A\cup B)^c)=1-P(A\cup B)=1-0.0105=0.9895.\]
Ejemplo
En un control especial de la policía el \(0.1\%\) de todos los conductores analizados en un control de tráfico dan positivo en un el test en cocaína, y el \(1\%\) da positivo en cannabis. Un \(1.05\%\) da positivo en alguno de los dos test.
¿Cuál es la probabilidad que un analizado al azar de positivo en los dos test en cocaína y cannabis?
Los sucesos elementales son:
En este caso nos interesa estudiar los sucesos:
de donde, por tanto:
\[\begin{array}{rl} {P(A\cap B)} &{=P(A)+P(B)-P(A\cup B)}\\ &{=0.001+0.01-0.0105=0.0005}. \end{array}\]
Ejemplo
En un control especial de la policía el \(0.1\%\) de todos los conductores analizados en un control de tráfico dan positivo en un el test en cocaína, y el \(1\%\) da positivo en cannabis. Un \(1.05\%\) da positivo en alguno de los dos test.
¿Cuál es la probabilidad de que un conductor analizado de positivo en cocaína pero no en cannabis?
Los sucesos elementales son:
En este caso nos interesa estudiar los sucesos:
de donde, por tanto:
\[P(A-B) =P(A)-P(A\cap B) =0.001-0.0005=0.0005.\]
Se calcula a través de la definición:
\[ P(B|A)=\frac{P(A\cap B)}{P(A)}. \]
Ejemplo
En una clase de 20 hombres y 30 mujeres, 15 hombres y 18 mujeres llevan gafas. Contestemos las siguientes preguntas:
\[ \frac{33}{50} \]
\[ \frac{18}{50} \]
Ejemplo
En una clase de 20 hombres y 30 mujeres, 15 hombres y 18 mujeres llevan gafas. Contestemos las siguientes preguntas:
\[ \frac{18}{30}=\frac{18/50}{30/50}=\frac{P(\mbox{mujer y gafas})}{P(\mbox{mujer})}. \]
\[ \frac{18}{30}. \]
Ejemplo
En una clase de 20 hombres y 30 mujeres, 15 hombres y 18 mujeres llevan gafas. Contestemos las siguientes preguntas:
\[ \frac{18}{33}=\frac{18/50}{33/50}=\frac{P(\mbox{mujer y gafas})}{P(\mbox{gafas})}. \]
Hay que distinguir bien entre
Probabilidad de que sea mujer y lleve gafas.
Probabilidad de que, si es mujer, lleve gafas.
Cuando utilizamos probabilidad condicional \(P(A|B)\) estamos restringiendo el espacio muestral a \(B\).
La probabilidad condicionada es una probabilidad
Sea \(A\subseteq \Omega\) un suceso tal que \(P(A)>0\), entonces
\[ \begin{array}{rccl} P(-|A):& \mathcal{P}(\Omega) & \to & [0,1]\\ &B & \mapsto & P(B|A). \end{array} \] satisface las propiedades de las probabilidades, como por ejemplo:
\[ \begin{array}{l} P(B^c|A)=1-P(B|A),\\ P(B_1\cup B_2|A)=P(B_1|A)+P(B_2|A)-P(B_1\cap B_2|A). \end{array} \]
Ejercicio
Escribid el resto de propiedades que cumpliría una probabilidad condicionada al evento \(A\).
Ejemplo
Un 15% de los adultos son hipertensos, un 25% de los adultos creen que son hipertensos, y un 9% de los adultos son hipertensos y creen que lo son.
Si un adulto cree que es hipertenso, ¿cuál es la probabilidad que lo sea?
Sean los sucesos
entonces podemos definir el suceso:
de donde, la probabilidad condicionada de ser hipertenso creyéndonos que lo somos es:
\[P(A|B)=\dfrac{P(A\cap B)}{P(B)}=\dfrac{0.09}{0.25}=0.36.\]
Ejemplo
Un 15% de los adultos son hipertensos, un 25% de los adultos creen que son hipertensos, y un 9% de los adultos son hipertensos y creen que lo son.
Si un adulto es hipertenso, ¿cuál es la probabilidad que crea que lo es?
Si tenemos los sucesos:
entonces buscamos la probabilidad \(P(B|A)\):
\[ \begin{array}{rl} P(B|A) & =\dfrac{P(A\cap B)}{P(A)}=\dfrac{0.09}{0.15}= 0.6 \end{array} \]
Ejemplo
Un dígito de control de error toma el valor 0 en el 99% de los casos en que hay un error. Si la probabilidad de error en un mensaje es del \(0.5\%\). ¿cuál es la probabilidad de que el mensaje sea erróneo y el código de error tenga valor 0?
entonces: \[P(A\cap B)=P(B)\cdot P(A|B)=0.005\cdot 0.99=0.00495.\]
Ejemplo: SPAM
Un 50% de correos recibidos en un servidor llevan adjuntos y un 65% son publicidad no deseada (SPAM). Sólo un 15% de estos correos no llevan adjuntos y no son SPAM.
Ejemplo
Un 50% de correos recibidos en un servidor llevan adjuntos y un 65% son publicidad no deseada (SPAM). Sólo un 15% de estos correos no llevan adjuntos y no son SPAM.
\[P(A|S)=\dfrac{P(A\cap S)}{P(S)}=?\]
Ejemplo
Un 50% de correos recibidos en un servidor llevan adjuntos y un 65% son publicidad no deseada (SPAM). Sólo un 15% de estos correos no llevan adjuntos y no son SPAM.
\(P(A)=0.5, P(S)=0.65, P(A^c\cap S^c)=P((A\cup S)^c)=0.15\),
\(P(A\cup S)=1-P((A\cup S)^c)=0.85\),
\(P(A\cap S)=P(A)+P(S)-P(A\cup S)=0.3\),
\[P(A|S)=\dfrac{P(A\cap S)}{P(S)}=\dfrac{0.3}{0.65}\approx 0.46.\]
Ejemplo
Un 50% de correos recibidos en un servidor llevan adjuntos y un 65% son publicidad no deseada (SPAM). Sólo un 15% de estos correos no llevan adjuntos y no son SPAM.
\[P(A^c|S^c)=\dfrac{P(A^c\cap S^c)}{P(S^c)}=\dfrac{P(A^c\cap S^c)}{1-P(S)}=\dfrac{0.15}{0.35}\approx 0.43.\]
Dados dos sucesos \(A\) y \(B\) se tiene que
\[ \begin{array}{rl} P(B)&= P(B\cap A) +P(B\cap A^c)\\ & =P(A)\cdot P(B|A)+ P(A^c)\cdot P(B|A^c). \end{array} \]
Los sucesos \(A_1,A_2,\ldots, A_n\) son una partición del espacio muestral \(\Omega\) de un determinado experimento aleatorio, si cumplen las condiciones siguientes:
Sea \(A_1,A_2,\ldots,A_n\) una partición de \(\Omega\). Sea \(B\) un suceso cualquiera. Entonces
\[ \begin{array}{rl} P(B)&= P(B\cap A_1)+\cdots +P(B\cap A_n)\\ & =P(A_1)\cdot P(B|A_1)+\ldots+P(A_n)\cdot P(B|A_n). \end{array} \]
Ejemplo
Un dígito de control de error toma el valor 0 en un \(99\%\) de los casos en que hay un error y en un \(5\%\) de los mensajes sin error. La probabilidad de error en un mensaje es del \(0.5\%\).
¿Cuál es la probabilidad de que un mensaje escogido al azar tenga el dígito de control a 0?
Sean los sucesos del enunciado:
entonces obtenemos las probabilidades a partir del enunciado:
y por tanto,
\[ \begin{array}{rl} P(A) & =P(B)\cdot P(A|B)+P(B^c)\cdot P(A|B^c)\\ & =0.005\cdot 0.99+0.995\cdot 0.05=0.0547. \end{array} \]
Consideremos alguna de las siguientes situaciones:
Nos ceñiremos a la casuística más elemental el algoritmo de clasificación o la diagnosis solo da dos resultado Positivo (sí tienes la enfermedad, sí es un fraude) o Negativo (en caso contrario).
En todas estas situaciones podemos calcular lo que se llama matriz de confusión que representa todas las situaciones posibles. En el caso de estudiar una condición de tipo binario,
El Test da Positivo | El Test da Negativo | |
---|---|---|
Condición Positiva | Correcto | Error |
Condición Negativa | Error | Correcto |
En general los modelos y algoritmos de clasificación suelen aportar puntuaciones (scores) que determinan el grado de pertenencia a una clase, o que miden si dos objetos están en la misma clase.
Así el resultado del clasificador o del diagnóstico puede ser:
Un ejemplo aproximado de un problema real es el siguiente: consideremos una prueba diagnóstica que persiga determinar si una persona tiene una cierta enfermedad.
En un diagnósticos de una cierta condición (por ejemplo, test embarazo, test de enfermedad), tenemos dos tipos de sucesos:
Ejemplo
Un test diseñado para diagnosticar una determinada enfermedad tiene un coeficiente de falsos negativos de 0.06, y un coeficiente de falsos positivos de 0.04. En un estudio masivo se observa que un 15% de la población da positivo al test.
¿Cuál es la probabilidad que una persona escogida aleatoriamente tenga esta enfermedad?
Los datos del problema son:
\[ P(T) =P(M)\cdot P(T|M)+P(M^c)\cdot P(T|M^c). \]
donde
\[ \begin{array}{l} P(T|M)=1-P(T^c|M)=0.94 \\ P(M^c)=1-P(M). \end{array} \]
Por lo tanto
\[ \begin{array}{rl} 0.15 & = P(M)\cdot 0.94+(1-P(M))\cdot 0.04\\ & =0.04+0.9\cdot P(M)\\ P(M) & =\dfrac{0.11}{0.9}\approx 0.1222. \end{array} \]
Sean \(A\) y \(B\) dos sucesos. Si \(P(B)>0\), entonces
\[ \begin{array}{rl} P(A|B) & =\dfrac{P(A)\cdot P(B|A)}{P(B)} &=\dfrac{P(A)\cdot P(B|A)}{P(A)\cdot P(B|A)+P(A^c)\cdot P(B|A^c)}. \end{array} \]
Ejercicio
Demostrar el teorema de Bayes utilizando que
\[P(A|B) =\dfrac{P(A\cap B)}{P(B)}=\cdots\]
Sea \(A_1,A_2,\ldots,A_n\) una partición de \(\Omega\). Sea \(B\) un suceso tal que \(P(B)>0\). entonces(para cualquier \(i=1,2,\ldots,n\)):
\[ \begin{array}{rl} P(A_i|B) & =\dfrac{P(A_i)\cdot P(B|A_i)}{P(B)}\\ & =\dfrac{P(A_i)\cdot P(B|A_i)}{P(A_1)\cdot P(B|A_1)+\cdots+P(A_n)\cdot P(B|A_n)}, \end{array} \]Ejercicio
Demostrar el teorema de Bayes utilizando que
\[P(A_i|B) =\dfrac{P(A_i\cap B)}{P(B)}=\cdots\]
Ejemplo
Un test para detección de VIH da positivo un 99% de los casos en los que está presente y en un 5% de los casos en los que el virus está ausente. En una población con un \(0.5\%\) de infectados por VIH, ¿cuál es la probabilidad que un individuo que haya dado positivo en el test esté infectado?
Los sucesos del ejemplo son:
de donde podemos calcular:
\[ \begin{array}{rl} P(A|B) & =\dfrac{P(B|A)\cdot P(A)}{P(B|A)\cdot P(A)+P(B|A^c)\cdot P(A^c)}\\ &=\dfrac{0.99\cdot 0.005}{0.005\cdot 0.99+0.995\cdot 0.05}=0.09.\end{array} \]
Ejemplo
Un test para detección de VIH da positivo un 99% de los casos en los que está presente y en un 5% de los casos en los que el virus está ausente. En una población con un \(0.5\%\) de infectados por VIH, ¿cuál es la probabilidad de que un individuo que haya dado negativo en el test no esté infectado?
Los sucesos del ejemplo son:
de donde podemos calcular:
\[ \begin{array}{rl} P(A^c|B^c)& =\dfrac{P(B^c|A^c)\cdot P(A^c)}{P(B^c|A)\cdot P(A)+P(B^c|A^c)\cdot P(A^c)}\\ & =\dfrac{0.95\cdot 0.995}{0.01\cdot 0.005+0.95\cdot 0.995}=0.999947.\end{array} \]
Ejercicio
Se ha observado que los cientes de una empresa de ventas por internet son de tres tipos, A, B y C, disjuntos dos a dos. La probabilidad que ser de cualquiera de cada uno de los tipos es \(1/3\), pero la probabilidad de compra de cada tipo es diferente: si es de tipo A compra un 50% de las veces, si de tipo B, un 75% de las veces, y de tipo C, un 60%.
Supongamos que llega un cliente ¿cuál es la probabilidad de que si ha comprado sea del tipo B?
\[P(A)=P(B)=P(C)=1/3.\]
Buscamos estudiar el suceso \(E\): el cliente compra, se tiene que:
\[P(E|A)=0.5, P(E|B)=0.75, P(E|C)=0.6.\]
\[P(B|E)\!=\!\dfrac{P(E|B)\cdot P(B)}{P(E|A)\!\cdot\! P(A)\!+\!P(E|B)\!\cdot\! P(B)\!+\!P(E|C)\!\cdot\! P(C)}\!=\!\ldots\]
Ejercicio
Un test de detección precoz de abandono de clientes de una empresa de telefonía da positivo el 97.5% de las ocasiones en las que, posteriormente, el cliente se da de baja, y un 12% de las veces en que no se dio de baja. La probabilidad que un cliente escogido al azar se dé de baja es de un 2%.
Definimos los sucesos y datos del ejercicio:
\[P(B)=0.02, P(T|B)=0.975, P(T|B^c)=0.12.\]
\[ \begin{array}{rl} P(T) = & P(B)\cdot P(T|B)+P(B^c)\cdot P(T|B^c)\\[1ex] & =0.02\cdot 0.975+0.98\cdot 0.12=0.1371. \end{array} \]
\[P(B\cap T)= P(B)\cdot P(T|B)=0.02\cdot 0.975=0.0195.\]
\[P(B)=0.02, P(T|B)=0.975, P(T|B^c)=0.12.\]
\[ \begin{array}{rl} P(B|T^c)= &\displaystyle \frac{P(B\cap T^c)}{P(T^c)}= \frac{P(B)-P(B\cap T)}{1-P(T)}\\[2ex] & \displaystyle = \frac{0.02-0.0195}{1-0.1371}\approx 0.00058 \end{array} \]
donde
\[ \begin{array}{l} P(T^c|B)=1-P(T|B)=0.025,\\[1ex] P(T^c|B^c)=1-P(T|B^c)=0.88. \end{array} \]
Diremos que los sucesos \(A\) y \(B\) son independientes si \(P(A\cap B)=P(A)\cdot P(B)\).
\(A_1,\ldots, A_n\) son sucesos independientes cuando, para toda subfamilia \(A_{i_1},\ldots,A_{i_k}\), \[ P(A_{i_1}\cap \cdots\cap A_{i_k})=P(A_{i_1})\cdots P(A_{i_k}). \]
Dados dos sucesos \(A\) y \(B\) con \(P(A),P(B)>0\), las siguientes afirmaciones son equivalentes:
Las siguientes afirmaciones son equivalentes:
Ejemplo
En la web de viajes WEBTravel, el 55% de los clientes compra billete de avión, el \(20\%\) alojamiento en hotel, y el \(60\%\) billete de avión o alojamiento en hotel. ¿Son los sucesos comprar billete de avión y comprar alojamiento en hotel independientes?
Los sucesos y datos del ejemplo son:
por tanto, podemos calcular las probabilidades siguientes
\[ \begin{array}{rl} P(A\cap B) & =P(A)+P(B)-P(A\cup B)\\ & =0.55+0.2-0.6=0.15,\\ P(A)\cdot P(B) & = 0.55\cdot 0.2=0.11. \end{array} \]
Concluimos que son dependientes, ya que \(P(A\cap B)\neq P(A)\cdot P(B)\).
Ejercicio