probabilidad - dma.etsisi.upm.es€¦ · tema 2 probabilidad 2.1 ¿por qu´e estudiar probabilidad...

14
Tema 2 Probabilidad 2.1 ¿Por qu´ e estudiar Probabilidad en Computaci´ on? El ser humano ha convivido desde siempre con la incertidumbre. Estamos tan acostumbrados a aceptar hechos que conocemos de manera fragmentaria, a razonar a partir de premisas incompletas, a tomar decisiones basadas en creencias subjetivas, que la presencia de la incertidumbre nos resulta natural. Si salimos a la calle, lo m´ as probable es que, antes de decidir qu´ e ropa ponernos, consideremos las posibilidades de lluvia, quiz´ as s´ olo observando el trozo de cielo que nos deja ver la ventana, quiz´ as recordando la estaci´ on del a˜ no y el tiempo que hizo en los ´ ultimos d´ ıas. En todo caso, lo ´ unico que hemos hecho es decidir en base a un razonamiento aproximado y cargado de incertidumbre. La causa de esa presencia ubicua de la incertidumbre es la extraordinaria complejidad de la realidad, la multitud de causas que se esconden detr´as de hechos simples y que nos resulta dif´ ıcil de comprender. Sin embargo, sobrevivimos en medio de esa sopa de incertidumbre que nos rodea: tomamos decisiones, creamos modelos para explicar la realidad, nos esforzamos por comprender esa aleatoriedad, por tratarla y sacar provecho de ella, razonamos en su presencia e incluso acumulamos conocimiento a su pesar. Hay muchos fen´ omenos f´ ısicos gobernados por la incertidumbre, como por ejemplo los fen´ omenos microsc´ opicos. Pensemos en el comportamiento de los gases, formados por much´ ısimas part´ ıculas cuyo comportamiento se describe teniendo en cuenta las interacciones aleatorias entre ellas. A pesar de esto, hay una teor´ ıa de los gases que predice con bastante exactitud el comportamiento macrosc´ opico, lo cual no deja de sorprendernos. Sin duda, donde reina la incertidumbre por sus fueros es en la Mec´anica Cu´antica, entronizada por el principio de Heisenberg enunciado en el a˜ no 1927. Este principio afirma que cuanto m´ as precisa es la medida de la posici´ on de un electr´ on, m´ as imprecisa es la medida de su velocidad, de modo que no es posible conocer ambos con precisi´ on absoluta. ¿Hay una afirmaci´on m´as rotunda de la incertidumbre? Las consecuencias de este principio son profund´ ısimas y alcanzan a la ciencia y la t´ ecnica de nuestros d´ ıas, pues termina con una manera determinista de concebir el conocimiento. No s´ olo en los fen´omenos cu´anticos aparece la incertidumbre; quiz´ as en este campo es as patente a causa del principio de incertidumbre, pero a medida que el progreso cient´ ıfico exigi´ o un conocimiento en profundidad de los fen´ omenos, con m´ as capacidad de predicci´on, la incertidumbre empieza a aparecer de modo natural. Antes del desarrollo de la probabilidad y 21

Upload: others

Post on 01-May-2020

18 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

Tema 2

Probabilidad

2.1 ¿Por que estudiar Probabilidad en

Computacion?

El ser humano ha convivido desde siempre con la incertidumbre. Estamos tan acostumbradosa aceptar hechos que conocemos de manera fragmentaria, a razonar a partir de premisasincompletas, a tomar decisiones basadas en creencias subjetivas, que la presencia de laincertidumbre nos resulta natural. Si salimos a la calle, lo mas probable es que, antes de decidirque ropa ponernos, consideremos las posibilidades de lluvia, quizas solo observando el trozo decielo que nos deja ver la ventana, quizas recordando la estacion del ano y el tiempo que hizo enlos ultimos dıas. En todo caso, lo unico que hemos hecho es decidir en base a un razonamientoaproximado y cargado de incertidumbre. La causa de esa presencia ubicua de la incertidumbrees la extraordinaria complejidad de la realidad, la multitud de causas que se esconden detras dehechos simples y que nos resulta difıcil de comprender. Sin embargo, sobrevivimos en medio deesa sopa de incertidumbre que nos rodea: tomamos decisiones, creamos modelos para explicarla realidad, nos esforzamos por comprender esa aleatoriedad, por tratarla y sacar provecho deella, razonamos en su presencia e incluso acumulamos conocimiento a su pesar.

Hay muchos fenomenos fısicos gobernados por la incertidumbre, como por ejemplo losfenomenos microscopicos. Pensemos en el comportamiento de los gases, formados pormuchısimas partıculas cuyo comportamiento se describe teniendo en cuenta las interaccionesaleatorias entre ellas. A pesar de esto, hay una teorıa de los gases que predice con bastanteexactitud el comportamiento macroscopico, lo cual no deja de sorprendernos. Sin duda, dondereina la incertidumbre por sus fueros es en la Mecanica Cuantica, entronizada por el principiode Heisenberg enunciado en el ano 1927. Este principio afirma que cuanto mas precisa es lamedida de la posicion de un electron, mas imprecisa es la medida de su velocidad, de modoque no es posible conocer ambos con precision absoluta. ¿Hay una afirmacion mas rotundade la incertidumbre? Las consecuencias de este principio son profundısimas y alcanzan a laciencia y la tecnica de nuestros dıas, pues termina con una manera determinista de concebir elconocimiento.

No solo en los fenomenos cuanticos aparece la incertidumbre; quizas en este campo esmas patente a causa del principio de incertidumbre, pero a medida que el progreso cientıficoexigio un conocimiento en profundidad de los fenomenos, con mas capacidad de prediccion, laincertidumbre empieza a aparecer de modo natural. Antes del desarrollo de la probabilidad y

21

Page 2: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

22 Probabilidad

la estadıstica los analisis de los problemas eran deterministas, y sus conclusiones, limitadas. Laincertidumbre, entre otros muchos campos, aparece en:

• Economıa y Ciencias Sociales: comportamiento de mercados, ındices bursatiles,tendencias sociales, resultados de elecciones, etc.

• Ingenierıa: procesos de fabricacion, control de calidad, planificacion de tareas, medicionesde caracterısticas, etc.

• Informatica y Computacion: trafico en redes de comunicaciones, tiempo de ejecucion deprogramas, accesos a paginas web, comportamiento de estructuras de datos, gestion derecursos, etc.

Esa incertidumbre es consecuencia de que los fenomenos que estudiamos vienen dados porun alto numero de causas, muchas de ellas de pequeno efecto, interdependientes de un mododesconocido, y de comportamiento difıcil de explicar o modelizar. De esto se sigue la necesidadde incorporar la incertidumbre al razonamiento, a la deduccion, en suma, al metodo cientıfico. Sipretendemos tener modelos que expliquen la realidad, entonces no podemos ignorar ese aspecto.La Teorıa de la Probabilidad es la rama de las Matematicas que materializa tal incorporacion.Podrıamos decir que la probabilidad es la logica de la incertidumbre.

Feller (1906 - 1970), uno de los grandes probabilistas del siglo XX, resaltaba de laprobabilidad tres caracterısticas, que a su juicio, le proporcionan su utilidad y belleza1:

• Intuicion. La probabilidad es intuitiva porque la usamos en el razonamiento cotidiano.Nos sirve para cuantificar el conocimiento subjetivo que tenemos de un hecho y tomardecisiones.

• Formalismo logico. La probabilidad es de suma importancia para el metodo cientıfico. Apartir de Kolmogorov, que introduce la definicion axiomatica de probabilidad, esta se unecon la logica, esto es, con las leyes del pensamiento. Esto permitio que la probabilidad,ahora con el soporte de la logica, se desarrollase como una rama del conocimientoplenamente independiente. Esta union de la logica y la intuicion parece que es lo quedesconcierta al estudiante en un primer momento.

• Aplicaciones. Son muchas y en los ambitos mas diversos. Nombrar todas sus aplicacionesserıa largo, pero, dado que este material esta dirigido a alumnos de Informatica, merecela pena nombrar algunas de las mas relevantes. Sin embargo, dejamos al alumno que lasbusque el por su cuenta; vease el problema mas abajo 2.1.1.

Problema 2.1.1 Buscad en internet aplicaciones de la probabilidad a la Computacion. Almenos deberıais encontrar cinco grandes aplicaciones, de relevancia. No traigais a clase nadaque no entendais.

1Cita tomada de su famoso libro An Introduction to Probability Theory and Its Applications, cuya primeraedicion es de 1963.

Page 3: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

2.2. Razonamiento probabilıstico 23

2.2 Razonamiento probabilıstico

El razonamiento probabilıstico debe estar presente en la formacion de un cientıfico o un tecnicopor la sencilla razon de que es parte del metodo cientıfico. ¿Justifica esto que haya que incluirel estudio de la probabilidad? Para contestar a esto querrıamos examinar el informe TheJoint Task Force for Computing Curricula 2005, publicado en 2005 por la ACM americana, laasociacion mas importante de Informatica2. En dicho informe daba la siguiente definicion decomputacion (nuestra traduccion):

De modo general, podemos dar el significado de computacion a toda actividadque especıficamente requiera ordenadores, se beneficie de ellos o los cree. Asıpues, la computacion incluye: el diseno de sistemas hardware y software para unamplio rango de objetivos; procesamiento, estructuracion y gestion de varios tiposde informacion; la realizacion de estudios cientıficos; hacer que los ordenadoresse comporten inteligentemente; crear y usar comunicaciones y entretenimientomultimedia; buscar y recopilar informacion relevante para cualquier objetivoparticular, entre otros. La lista es virtualmente interminable y las posibilidadesson infinitas. Computacion tiene otros significados que son mas especıficos, basadosen el contexto en que se usa el termino. Por ejemplo, un especialista en sistemasde informacion vera el termino computacion de modo diferente al de un ingenierode software. Con independencia del contexto, hacer computacion de calidadpuede ser complicada difıcil y complicado. Porque la sociedad necesita gente quehaga computacion de calidad, concebimos la computacion no solamente como unaprofesion sino como una disciplina cientıfica.

Dentro de esta definicion se encuentran varios conceptos importantes. Resaltarıamosdos: la concepcion de la computacion como una disciplina cientıfica, la cual, como todadisciplina, requiere de capacidad de abstraccion y rigor; y la definicion de computacion comoprocesamiento de la informacion en contextos muy generales y dispares. La definicion dedisciplina cientıfica incluye el uso del metodo cientıfico, y dentro de este se encuentra elrazonamiento probabilıstico y estadıstico. Respecto al procesamiento, este a su vez descansaen otros dos conceptos relevantes: el de algoritmo o procedimiento finito de resolucion de unproblema y las estructuras de datos u organizacion eficiente de la informacion implicada endicho problema (en los proximos temas se ampliaran estos conceptos).

Vamos a desarrollar un ejemplo (informatico) que mostrara la utilidad y, a la vez, el caracterdel razonamiento probabilıstico. Consideremos un problema muy frecuente en informatica: laordenacion. Supongamos que tenemos una matriz de n numeros distintos M = {a1, · · · , an}.Un algoritmo muy conocido para ordenar es el llamado quicksort. Es este un algoritmo recursivoque funciona del siguiente modo: toma a1, que llamaremos el pivote, y subdivide la matriz Men dos submatrices I1 = {ai, · · · , ak} y D1 = {ak+1, · · · , aj} de tal manera que a1 es menorque cualquier elemento de I1 y mayor que cualquiera de los de D1. El algoritmo, despues deesta primera operacion, se llama a sı mismo sobre las submatrices I1 y D1. Si alguna submatriztiene tamano uno o cero, la recursion se para. Es claro que tras la particion de M en I1 y D1, elelemento a1 esta ordenado correctamente; vease la figura 2.4 para ver ilustrada esta explicacion.

2ACM Computing Curricula. The Joint Task Force for Computing Curricula 2005. http://www.acm.org/education/curricvols/CC2005-March06Final.pdf,2005.

Page 4: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

24 Probabilidad

!"#"$"%"&"'"(")"*

#"$"%"' &"(")"*!$"%"' "

%"' #

$%&

' (")"*

)"*

(%)

*

Figura 2.1: Ejecucion del algoritmo quicksort

Cabe preguntarse por la velocidad de este algoritmo. La velocidad o tiempo de ejecucionde un algoritmo es una de las principales variables a la hora de compararlo con otro algoritmoque resuelva el mismo problema. Otras variables que influyen son la cantidad de memoria, lasencillez conceptual del algoritmo, el uso de estructuras de datos simples, etc. Y aquı aparecela incertidumbre: la velocidad depende del numero de datos y del orden en que aparezcan.Ciertamente, la expresion exacta de la velocidad del algoritmo sera compleja. Tendra quellevar la cuenta del numero de comparaciones, de intercambios, del paso de parametros en lasllamadas recursivas, etc., y todas estas cantidades varıan de una entrada de datos a otra. Porsimplificar el analisis, nos detendremos solo en el numero de comparaciones. Llamemos T (n) aese numero, donde n es el numero de datos de entrada.

¿Que ocurre si los numeros de M estan ordenados? En ese caso, la submatriz I1 esta vacıade elementos, ya que no existen elementos menores que el pivote, y D1 tiene n� 1 elementos.Queda entonces la siguiente ecuacion recursiva:

T (n) = O(n� 1) + T (n� 1),

cuya solucion es T (n) cn2 (c > 0 es una constante que no tiene importancia en este momento.)En este caso, tenemos un algoritmo cuadratico. Demonos cuenta de que este analisis haconsiderado solo la peor situacion posible, que los datos vengan ordenados, sin hacer otrasconsideraciones. Por ejemplo, no revela la frecuencia con que aparece ese caso mas desfavorablee ignora la incertidumbre del problema. Este tipo de analisis se llama del peor caso y es detipo determinista.

Cambiemos el enfoque e introduzcamos la incertidumbre y, detras de ella, el razonamientoprobabilıstico. El comportamiento del algoritmo dependera de como se hagan las particionessucesivas de las matrices. Si el pivote deja dos submatrices de aproximadamente el mismotamano, el algoritmo ira rapido; si deja una submatriz con muchos elementos y la otra conpocos, el algoritmo sera lento. Ahora tendremos en cuenta la eleccion del pivote y el tiempo deejecucion que resulta de ese pivote. Calculamos como medida de la velocidad del algoritmo elpromedio de todos esos tiempos. Este analisis se llama analisis en media y es mas difıcil queel analisis en el peor de los casos visto antes. La ecuacion de recurrencia que sale en el analisisen media es (su obtencion no es relevante en este momento):

T (n) =1

n

T (1) + T (n� 1) +

n�1X

i=1

(T (i) + T (n� i))

!+O(n),

cuya solucion es T (n) = n log n, c > 0. Es sorprendente que la velocidad en media sea mucho

Page 5: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

2.3. Problemas preliminares 25

menor que la velocidad en el peor de los casos.

¿Que conclusiones podemos sacar de los dos analisis anteriores? En primer lugar, espreferible usar un algoritmo O(n log n) para ordenar que uno O(n2) porque es mucho masrapido. En segundo, lugar, podrıamos pensar en modificar el algoritmo para que las llamadasrecursivas se produjesen sobre matrices del mismo tamano aproximadamente. Esto, claro, harıamas complicado el algoritmo; esta idea ya se ha puesto en practica a traves de los arboles AVL oarboles equilibrados. Pero siendo mas finos en el analisis, nos damos cuenta de que el algoritmoen media ya corre en tiempo O(n log n). En la practica este algoritmo es de los mas usados yse implementa tal cual esta descrito arriba. Por ejemplo, compiladores de C o C++ lo traenimplementado entre sus funciones basicas.

Este ejemplo muestra como funciona el razonamiento probabilıstico: un analisisdeterminista, el del peor de los casos, arrojo unos resultados mas bien conservadores, pesimistasdirıamos; el analisis probabilıstico dio resultados mas precisos, si bien fueron mas difıciles deobtener.

2.3 Problemas preliminares

Problema 2.3.1 El nombre de la paradoja viene por el nombre del presentador del concursoLet’s make a deal. En el concurso se presenta al concursante con tres puertas donde detras deuna ellas hay un coche y detras de las otras dos una cabra. El concursante elige una puerta y enese momento Monty Hall, el presentador, abre otra que siempre corresponde a la de una cabra.En este momento el presentador ofrece al concursante la posibilidad de cambiar su eleccion.¿Debe el concursante mantener su eleccion original o escoger la otra puerta? ¿Supone algunadiferencia?

Ejercicio 2.3.2 De una urna que contiene 10 bolas distintas, se extraen 3 al azar conreemplazamiento. Determinar la probabilidad de que aparezcan:

(a) Las tres iguales;

(b) Dos iguales;

(c) Las tres distintas.

Ejercicio 2.3.3 De una urna que contiene 10 bolas, 6 son rojas y 4 negras. Se extraen 3 bolassin reemplazamiento. Determinar la probabilidad de que aparezcan: (a) las tres del mismocolor; (b) al menos una de cada color.

Problema 2.3.4 Dos jugadores tiran una moneda no cargada. El que saque cara la primeravez sera el ganador. ¿Cual es la probabilidad de que el primer jugador gane?

2.4 Espacios de probabilidad

Definicion 2.4.1 Experimento aleatorio. Un experimento aleatorio es cualquier operacionque cumple las condiciones:

Page 6: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

26 Probabilidad

(1) Antes de realizar el experimento no se sabe cual va a ser el resultado del mismo.

(2) El conjunto de los resultados posibles sı es conocido a priori.

(3) El experimento debera ser repetible en identicas condiciones.

Ejemplo 2.4.2 Por ejemplo, tirar un dado no cargado es un experimento aleatorio. En efecto,conocemos sus posibles resultados, los elementos del conjunto {1, . . . , 6}, pero no conocemos elresultado particular de una tirada antes de hacerla; y ademas podemos tirarlo cuantas vecesqueramos.

Definicion 2.4.3 Espacio muestral. El conjunto de los posibles resultados de unexperimento aleatorio se llama espacio muestral. Lo designaremos por E. Los elementos de Ereciben el nombre de sucesos elementales.

Ejemplo 2.4.4 En el caso del dado de mas arriba, el espacio muestral es E = {1, . . . , 6}. Cadaelemento de E es un suceso elemental.

Definicion 2.4.5 Espacio de sucesos. El espacio de sucesos es una coleccion de subconjuntosdel espacio muestral. Lo designaremos por ⌦.

Cuando el espacio muestral sea finito elegiremos P(E) como espacio de sucesos. En general,querremos que el espacio muestral sea cerrado con respecto a la union, interseccion y tomade complementarios de sucesos. Cuando el espacio muestral es infinito la eleccion del espaciomuestral es mas delicada y lo estudiaremos mas adelante.

Definicion 2.4.6 Sucesos compuestos. Llamaremos suceso compuesto a los sucesos noelementales, esto es, a los subconjuntos de dos o mas elementos del espacio muestral.

Definicion 2.4.7 Suceso seguro y suceso imposible El suceso E se llama suceso seguro yel suceso ; se llama suceso imposible.

Ejercicio 2.4.8 Siguiendo con el experimento aleatorio de tirar un dado, dad ejemplos desucesos elementales, sucesos compuestos. Describidlos por enumeracion y comprension.

Problema 2.4.9 Dado que los sucesos son subconjuntos de un conjunto (del espacio muestralE), aplicad la teorıa de conjuntos para obtener propiedades de los sucesos.

Definicion 2.4.10 Sucesos incompatibles. Dos sucesos A,B ✓ E se dicen que son sucesosincompatibles si A \ B = ;, o dicho de otro modo, no pueden ocurrir a la vez.

Definicion 2.4.11 Espacio de probabilidad. Definicion axiomatica de Kolmogorov.Sea una aplicacion P : ⌦ :�! R tal que cumple los siguientes tres axiomas:

Axioma 1: Para todo suceso A ✓ E, se tiene que P (A) � 0.

Axioma 2: P (E) = 1.

Axioma 3: Sea {Ai | i 2 I} un conjunto de sucesos disjuntos, esto es, tales que Ai \ Aj = ;si i 6= j. Entonces se tiene que:

P

[

i2I

Ai

!=X

i2I

P (Ai)

Page 7: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

2.4. Espacios de probabilidad 27

A la terna (E,⌦, P ) se le llama espacio de probabilidad.

Ejercicio 2.4.12 En los problemas de la seccion 2.3 identifica el espacio muestral, el espaciode sucesos y la funcion de probabilidad.

Teorema 2.4.13 Sea (E,⌦, P ) un espacio de probabilidad.

(1) Si A,B son dos sucesos cualesquiera y A ✓ B, entonces P (A) P (B).

(2) La probabilidad es un numero entre 0 y 1.

(3) Para todo A 2 P, se tiene que P (A) = 1� P (A).

(4) Si A,B son dos sucesos cualesquiera, entonces

P (A [ B) = P (A) + P (B)� P (A \B)

Nota 2.4.14 La propiedad (4) del teorema anterior se puede generalizar a mas sucesos y esuna consecuencia inmediata del principio de inclusion-exclusion.

?

Ejemplo 2.4.15 He aquı varios ejemplos de espacios de probabilidad donde se detalla la ternade un espacio de probabilidad.

(1) Tirar una moneda una vez. Llamaremos E = {C,X} al conjunto de resultados posiblesde tirar una moneda, donde C es cruz y X cara. El espacio de sucesos es, como fijamosmas arriba, P(E). Si la moneda no esta cargada, entonces P (C) = P (X) = 1

2 .

(2) Tirar una moneda dos veces. Ahora el espacio muestral sera E1 = E ⇥ E, donde E ={C,X}. Al usar el producto cartesiano distinguimos el orden en que se tiran las monedas.Un posible espacio de probabilidad podrıa ser el que asigna estas probabilidades a lossucesos elementales:

P ((C,C)) = P ((C,X)) = P ((X,C)) = P ((X,X)) =1

4

Otro espacio distinto del anterior podrıa asignar las probabilidades como sigue:

P ((C,C)) =1

5, P ((C,X)) = P ((X,C)) =

3

10, P ((X,X)) =

1

5

(3) Tirada de dos dados. Se tiran dos dados y se observa la suma de los valores. Es unexperimento aleatorio, suponiendo que el dado no esta cargado. El espacio muestrales E = {2, . . . , 12}. En este ejemplo, en realidad, tenemos la concatenacion de dosexperimentos aleatorios, donde el segundo experimento, observar la suma de los puntos,depende de los resultados del primer experimento, que es tirar los dados. Para el primerexperimento aleatorio su espacio muestral es E1 = {(1, 1), (1, 2), . . . , (6, 6)}. A cada unode estos sucesos elementales les asignamos 1

36 (hay otras maneras posibles de hacerlo; estaes la que mejor refleja la idea de que los dados no estan cargados). Las probabilidadespara el segundo espacio son estas:

Page 8: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

28 Probabilidad

P (2) =1

36P (6) =

5

36P (10) =

3

36

P (3) =2

36P (7) =

6

36P (11) =

2

36

P (4) =3

36P (8) =

5

36P (12) =

1

36

P (5) =4

36P (9) =

4

36

Nota 2.4.16 Para comprobar que son espacios de probabilidad, hay que verificar que cumplenlos axiomas 1-3 dados mas arriba. En estos casos basta con observar que las probabilidades sonno negativas y que la suma de las probabilidades de los sucesos elementales es uno.

2.4.1 Regla de Laplace

En las aplicaciones de la probabilidad a la computacion, hay un caso que aparece con muchısimafrecuencia y es de la probabilidad discreta. Aquı por discreta queremos decir que el espaciomuestral es o bien finito o bien infinito numerable (el infinito de N). Vamos a estudiar ese casoen detalle.

Supongamos que tenemos un espacio muestral finito E = {a1, . . . , an}. Si A es un suceso,entonces A es la union finita de k sucesos elementales, pongamos A = {ai1} [ . . . [ {aik}. Lossucesos elementales son disjuntos y entonces en virtud del axioma 3 de la probabilidad, tenemosque

P (A) = P ({ai1} [ . . . [ {aik}) =kX

j=1

P ({aij})

En el caso de que todos los sucesos sean equiprobables, es decir, que tengan todos la mismaprobabilidad, la formula anterior se transforma en esta:

P (A) =kX

j=1

P ({aij}) =kX

j=1

1

n=

k

n=

|A||E|

Esta formula se llama regla de Laplace y se enuncia con frecuencia, en las condicionesque hemos expuesto aquı, diciendo que la probabilidad de A es el numero de casos favorablespartido por el numero de casos posibles. Los casos favorables se reducen al recuento de loselementos de A, en suma, al calculo de su cardinal. Aquı es donde entra la combinatoria enjuego, como herramienta para conseguir ese calculo.

2.5 Problemas de probabilidad - I

Ejercicio 2.5.1 Se escoge un entero entre 0 y 100. ¿Cual es la probabilidad de que no sea nidivisible por 2 ni por 5?

Page 9: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

2.6. Probabilidad condicionada 29

Ejercicio 2.5.2 Un dado esta cargado de modo que la probabilidad de que una cara salgaarriba es proporcional al numero de puntos que tiene. ¿Cual es la probabilidad de obtener unnumero par en una tirada?

Problema 2.5.3 ¿Cual eso mınimo numero de personas que tiene que haber en una habitacionde modo que la probabilidad de que dos cumplan anos el mismo dıa sea superior a 1/2?

Problema 2.5.4 Se tiene un experimento aleatorio que solo puede dar dos resultados, digamosA y B. La probabilidad de sacar A es p, con 0 < p < 1. Se realiza el experimento n veces.Calculad la probabilidad de que A ocurra k veces. Comprobad que con esas probabilidadestenemos un espacio de probabilidad.

Ejercicio 2.5.5 A veces se oye preguntarse a los jugadores de poquer por que una mano depoquer tiene mas valor que un full. Una mano de poquer consta de 5 cartas tomadas de unabaraja francesa (52 cartas). Una mano es un poquer si tiene 4 cartas del mismo valor y un fullson tres cartas del mismo valor seguidas de una pareja. ¿Podrıas justificar por que esto es ası?¿O habrıa que cambiar las reglas del poquer?

2.6 Probabilidad condicionada

El concepto de probabilidad condicionada formaliza la idea de como afecta a la probabilidadde un suceso tener informacion extra. Si esta informacion no es relevante para el suceso,nada deberıa cambiar. Si, en cambio, esa informacion modifica el conocimiento del suceso, laprobabilidad deberıa cambiar. Pero ¿como? El concepto de probabilidad condicionada es unode los mas importantes en teorıa de la probabilidad, pero tambien es un concepto resbaladizoy delicado, el cual requiere a menudo una cuidadosa interpretacion.

Pongamos un ejemplo para introducir este concepto. Consideremos el experimentoconsistente en tirar un dado no cargado una vez; sea su espacio muestral D = {1, 2, . . . , 6}.Nos interesa el suceso A sacar un 6. Como el dado es equiprobable, entonces P (A) = 1/6.Supongamos que se tira el dado y antes de decirnos el resultado nos informan de que numeroobtenido es mayor o igual que cuatro (llamemos B a este suceso). ¿Modifica el conocimientode B la probabilidad asignada al suceso A? Parece que sı. De pronto, el espacio de resultadosse ha restringido a {4, 5, 6} y, manteniendo las probabilidades iniciales, todas iguales, ahorala probabilidad de A sabiendo B es 1/3. La siguiente definicion formaliza el concepto deprobabilidad condicionada.

Definicion 2.6.1 Probabilidad condicionada. Sea E una espacio muestral y A,B dossucesos tal que P (B) > 0. La probabilidad de A condicionada a B, escrito P (A|B), se definepor

P (A|B) =P (A \ B)

P (B)

Problema 2.6.2 Consideremos un espacio muestral finito E. Justifica la formula de ladefinicion anterior. En particular, describe que hipotesis se han hecho para llegar a esa formula.

Page 10: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

30 Probabilidad

Teorema 2.6.3 Teorema de la probabilidad total. Sea E un espacio muestral.Supongamos que existen un conjunto de sucesos H1, H2, . . . , Hn tales que:

• La union de los sucesos Hi, i = 1, . . . , n es el espacio muestral;

• Los sucesos de Hi, Hj son disjuntos dos a dos

• Se cumple que P (Hi) > 0.

Entonces se tiene que, para cualquier suceso A:

P (A) =nX

i=1

P (Hi)P (A|Hi)

Ejercicio 2.6.4 Dad una interpretacion del teorema anterior. Dad tambien una interpretaciongrafica del mismo.

Nota 2.6.5 El teorema de la probabilidad total es todavıa valido cuando el numero deconjuntos Hi es infinito. El conjunto {H1, . . . , Hn} recibe a veces el nombre de hipotesisy tambien de particion del espacio muestral.

Ejercicio 2.6.6 Se sabe que el 65% de los accidentes de trafico que se producen durante lanoche de los sabados se deben a la ingesta excesiva de alcohol, el 25% se deben a la imprudenciadel conductor (sobrio) y el resto a otras causas, (fallo mecanico...etc.). En estos accidentes, elresultado es nefasto (herida grave o muerte) el 30% de las veces en el primer caso, el 20% en elsegundo y el 5% en el tercero. Calculad la probabilidad de que uno de estos accidentes tengaresultado nefasto. (Problema de la PAU).

Definicion 2.6.7 Sucesos independientes. Decimos que dos sucesos A,B sonindependientes si P (A|B) = P (A).

Teorema 2.6.8 Dos sucesos A,B son independientes si y solo si

P (A \ B) = P (A)P (B)

Ejercicio 2.6.9 Sea una moneda que tiene probabilidad p, 0 < p < 1 de sacar cara y q = 1� pde sacar cruz. Se tira la moneda dos veces. Se consideran los sucesos A,B consistentes en sacarcruz en la primera tirada y sacar cara en la segunda tirada, respectivamente.

(a) Probad o refutad que A y B son independientes.

(b) ¿Son independientes los sucesos A y sacar el mismo resultado en ambas tiradas? Probado refutad.

(c) Si C es el suceso sacar dos cruces, ¿son A y C independientes?

Problema 2.6.10 Probad que si A y B son dos sucesos independientes, entonces tambien loson A y B, A y B y A y B.

Problema 2.6.11 Dados los sucesos A y B, con P (A) = 1/4, P (B|A) = 1/2 y P (A|B) = 1/2,probad o refutad las siguientes afirmaciones:

Page 11: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

2.7. Teorema de Bayes 31

(a) A ⇢ B;

(b) A y B son independientes;

(c) A y B son incompatibles;

(d) P (A/B) = 1/2.

El concepto de suceso independiente se puede generalizar a mas de dos sucesos. La definicionde abajo no es sencilla y requiere una lectura cuidadosa.

Definicion 2.6.12 Sucesos mutuamente independientes. Sea {A1, . . . , An} un conjuntode sucesos en un espacio de probabilidad. Diremos que son mutuamente independientes si paracualquier subconjunto {Ai, Aj, . . . , Am} se cumple que

P (Ai \ Aj \ . . . \ Am) = P (Ai)P (Aj) . . . P (Am)

Problema 2.6.13 Las probabilidades de que funcionen los nodos 1, 2 y 3 de la red de la figuraadjunta son 0,9, 0,8 y 0,7, respectivamente. Suponiendo que el funcionamiento de los nodoses independiente, hallar la probabilidad de que un mensaje que sale de A llegue a B en lossiguientes casos:

(a) El mensaje intenta llegar por cualquier lado.

(b) El mensaje intenta ir primero por el camino con menos nodos.

(c) La probabilidad anterior (apartado b) suponiendo que cuando el mensaje intenta ir porun camino que no funciona, hay una probabilidad 0.2 de que se pierda.

!Figura 2.2: Red del problema

2.7 Teorema de Bayes

El teorema de Bayes es la base de la llamada inferencia bayesiana. Es un metodo de inferenciaestadıstica en el cual se usa el teorema de Bayes para actualizar las probabilidades de ciertashipotesis sobre un suceso en base a la realizacion de mas experimentos que implican dichosuceso.

Conceptualmente, la inferencia bayesiana empieza por considerar un suceso de interes A.A la vez hay una serie de hipotesis sobre el suceso, a las que llamaremos H1, . . . , Hn y cuyas

Page 12: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

32 Probabilidad

probabilidades son conocidas. Ademas, por la experiencia previa, se tiene una estimacion decomo se comporta A cuando se asume que una hipotesis Hi es cierta. Esto es equivalente a decirque conocemos las probabilidades condicionadas P (A|H1), . . . , P (A|Hn). Estas probabilidadesse llaman probabilidades a priori y el nombre refleja el hecho de que se estiman antesde realizar el experimento que actualizara nuestro conocimiento sobre A. En este momentose observa el suceso A. La probabilidad de A es una nueva evidencia que deberıa modificarlas probabilidades de las hipotesis. Las nuevas probabilidades son P (H1|A), . . . , P (Hn|A) y sellaman probabilidades a posteriori (el nombre de posteriori viene porque se calculan despuesdel experimento).

En Informatica las aplicaciones de la inferencia bayesiana son ubicuas y numerosas. Quizaslos campos donde mas sobresalgan sean en Inteligencia Artificial y Sistemas Expertos, dondela inferencia bayesiana empezo a usarse a finales de los anos 50 del siglo XX. Los filtros delcorreo basura, por ejemplo, se basan en los clasificadores de Bayes ingenuos.

Teorema 2.7.1 Sea E un espacio muestral en un espacio de probabilidad y sean hipotesisH1, H2, . . . , Hn tales que:

• La union de los sucesos Hi, i = 1, . . . , n es el espacio muestral;

• Los sucesos de Hi, Hj son disjuntos dos a dos.

• Se cumple que P (Hi) > 0.

Si A es un suceso, entonces las probabilidades a posteriori P (Hi|A), para i = 1, . . . , n, son

P (Hi|A) =P (A|Hi)P (Hi)Pnj=1 P (Hj)P (A|Hj)

Problema 2.7.2 Un doctor esta tratando de averiguar si un paciente tiene una de tresenfermedades, E1, E2, E3. Le hara dos tests al paciente, que o bien dan positivo (+) o negativo(-). Los registros de la enfermedad indican en una muestra de 10.000 personas la distribuciony los resultados de los tests son los que aparecen en el cuadro 8.2.2

Personas Resultados de los tests

Enfermedad enfermas ++ +� �+ ��E1 3215 2110 301 704 100

E2 2125 396 132 1187 410

E3 4660 510 3586 73 509

Tabla 2.1: Datos de las enfermedades

Se pide lo siguiente:

(a) Identificad las probabilidades a priori.

(b) En vista de los datos, ¿cual es la enfermedad mas probable que el paciente puede tener?

(c) Calculad las probabilidades a posteriori e interpretadlas en el contexto del problema.

Page 13: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

2.8. Problemas de probabilidad - II 33

2.8 Problemas de probabilidad - II

Problema 2.8.1 Mediante un programa de ordenador se generan independientemente tresnumeros de dos dıgitos cada uno. Los dıgitos pueden ser cualquiera de 0 a 9. Calculad:

(a) Probabilidad de que el primer numero generado sea menor que 40.

(b) Probabilidad de que 2 de los numeros generados sean menores que 40.

(c) Sabiendo que alguno de ellos ha sido menor que 40, la probabilidad de que hayan sidoexactamente dos los numeros generados menores que 40.

Problema 2.8.2 Dos companeros de estudios, Pedro y Juan comparten piso. Han decididoque, durante el primer semestre, el primero prepare la comida 3 de los 5 dıas laborables de cadasemana y el resto lo haga el segundo. A Pedro se le olvida hacer la comida el 5% de las veces,mientras que a Juan se le olvida un 8%. Se pide:

(a) Calculad la probabilidad de que un dıa laborable, elegido al azar, no haya comidapreparada.

(b) Si hoy hay preparada comida, calculad la probabilidad de que la haya preparado Pedro.

Problema 2.8.3 Se sacan a la vez dos cartas de una baraja espanola y, a continuacion, selanza un dado por cada carta de oros que haya salido. Calculad la probabilidad de que:

(a) El resultado de que el (los) dado(s) sume 4.

(b) Haber sacado un oro, sabiendo que los dados suman 4.

Problema 2.8.4 Construid el mapa conceptual del tema 2 entero.

2.9 Recordatorio de Combinatoria

2.9.1 Principio basicos

Definicion 2.9.1 Principio de la suma. Sean {A1, . . . , Ak} k conjuntos disjuntos dos ados. Supongamos que el primero tiene r1 objetos distintos, el segundo r2 objetos distintos, yası sucesivamente. El numero de maneras de seleccionar un objeto de entre los k conjuntos{A1, . . . , Ak} es r1 + . . .+ rk.

Definicion 2.9.2 Principio del producto. Si un cierto proceso se puede descomponer enn1, . . . , nk tareas independientes, que no se pueden realizar al mismo tiempo, entonces el procesototal se puede realizar de n1 · . . . · nk maneras.

Definicion 2.9.3 Principio de inclusion-exclusion para tres conjuntos. Sean tres conjuntosA1, A2, A3 ✓ U . Probar que

|A1 [ A2 [ A3| =|A1|+ |A2|+ |A3|� |A1 \ A2|� |A2 \ A3|� |A1 \ A3|+ |A1 \ A2 \ A3|

Page 14: Probabilidad - dma.etsisi.upm.es€¦ · Tema 2 Probabilidad 2.1 ¿Por qu´e estudiar Probabilidad en Computacion? El ser humano ha convivido desde siempre con la incertidumbre. Estamos

34 Probabilidad

2.9.2 Selecciones sobre conjuntos

Uno de los problemas mas fundamentales y comunes en combinatoria es el de contar seleccionesde elementos de un conjunto. La manera de contar dependera de seleccionar sus elementos. SiA es un conjunto de n elementos, el numero de formas distintas de seleccionar k elementos deA es funcion de los siguientes criterios:

(1) Si el orden de los elementos es importante en la seleccion. Dicho de otro modo, si unareordenacion de la seleccion produce una nueva seleccion.

(2) El tamano de la seleccion, esto es, cuantos elementos del conjunto total se seleccionan.

(3) Si se permiten la repeticion de los elementos.

Definicion 2.9.4 Permutaciones sin repeticion de conjuntos. Se llaman permutacionessin repeticion de conjuntos a las listas ordenadas formadas con los elementos de un conjuntodado, donde se supone que en el conjunto no hay elementos repetidos. Se designaran por Pn.

Definicion 2.9.5 Variaciones sin repeticion. Se llaman variaciones sin repeticion deconjuntos a las listas ordenadas de longitud k formadas con los elementos de un conjuntodado, donde se supone que en el conjunto no hay elementos repetidos. Se designaran por Vn,k.

Definicion 2.9.6 Combinaciones sin repeticion. Se llaman combinaciones sin repeticionde conjuntos a los subconjuntos de tamano k formados con los elementos de un conjunto dado,donde se supone que en el conjunto no hay elementos repetidos. Se designaran por Cn,k o por�nk

�.

Definicion 2.9.7 Permutaciones con repeticion de conjuntos. Se llaman permutacionescon repeticion de conjuntos a las listas ordenadas formadas con los elementos de un conjuntodado en que se permiten elementos repetidos. Se designaran por PRn.

Definicion 2.9.8 Variaciones con repeticion. Se llaman variaciones con repeticion deconjuntos a las listas ordenadas de longitud k formadas con los elementos de un conjuntodado en que se permiten elementos repetidos. Se designaran por V Rn,k.