Hace poco estaba leyendo una discusión en Twitter acerca
de Educación Privada Vs Pública, y leyendo los argumentos de ambos lados, que
mas bien era opiniones, me di cuenta que podía aprovechar este caso para
mostrar otro de los Comunes Errores que cometemos en la vida diaria y en la
forma en que pensamos, simplemente porque somos Terribles calculando
probabilidades.
Independientemente de la ideología o pragmatismo de
cada postura, la verdad es que con frecuencia cometemos errores calculando
probabilidades, entonces las extrapolaciones que hacemos basadas en esas
probabilidades erróneas simplemente serán engañosas e incorrectas. Cuidado, no
estoy defendiendo ninguna postura, porque no creo que ninguna de las dos sea
correcta o incorrecta per se, porque al final las dos buscan mas o menos lo
mismo: una mejor educación. El error es que se están basando en probabilidades
mal planteadas.
El problema que existe aquí es al que yo llamo la indiferencia del denominador según
el teorema de Bayes P(A|B) = P(A∩B)/P(B). Le llamo indiferencia porque el común
error es que quienes calculan la probabilidad para un evento A dada la
probabilidad de un evento B, casi siempre olvidan que la condición necesaria
para poder calcular esta probabilidad condicional (y por ende hacer una correcta extrapolación) es que ambos eventos
sean dependientes o en términos sencillos, que se intersecten, ie, que en algún
punto al menos uno de sus elementos coincida. Por ejemplo, el Super Bowl y la
Bolsa. Aunque han tenido una buena correlación, la verdad es que el Super Bowl
y la Bolsa son eventos independientes por mas que tengan coincidencias. Si calculamos
la probabilidad de que la Bolsa (A) suba dado que la NFC (B) ganó, la verdad es
que al ser eventos independientes la P(B) del numerador se elimina con la P(B)
del denominador como si nunca hubieran existido y entonces sólo nos queda la probabilidad
de A o P(A). Si queremos calcular bien la probabilidad condicional en necesario
que los eventos Ay B se intersecten, si no de nada sirve ni ayuda conocer la
probabilidad de un evento que ya pasó.
En la discusión que leí sobre educación Pública o
Privada estaban cometiendo el mismo error de la indiferencia del denominador, estaban queriendo calcular la
probabilidad condicional de eventos independientes aunque a simple vista parecía
que tienen mucha relación porque ambas tiene el prefijo escuela.
Concluían que si los resultados de PISA de las
escuelas privadas eran buenos entonces lo mejor era convertir las escuelas públicas
en privadas. Su argumento principal era que si las privadas tienen mas
probabilidad de obtener buenos resultados en PISA entonces una escuela publica
convertida en privada tendría mas probabilidad de tener buenos resultados
también. Suena razonable, pero primero vamos a traducirlo a probabilidad
condicional: La probabilidad de que una
escuela pública si llegase a ser convertida a privada (Evento A) obtenga
mejores resultados de PISA dado que las escuelas privadas que siempre han sido
privadas (Evento B) han obtenido buenos resultados de PISA.
Podrá parecer contraintuitivo, pero el conjunto de
escuelas privadas y el conjunto de escuelas públicas son dos conjuntos que son independientes
por más que ambas sean escuelas y tengan alumnos. El conjunto de las escuelas
públicas no se intersecta con las privadas porque las públicas aun siguen siendo
públicas Hoy. Si alguna pública llega a convertirse en privada entonces ya
habrá intersección, pero eso está en el futuro y no en Hoy y por lo tanto esta
probabilidad condicional no tiene sentido porque en la probabilidad condicional
al menos una probabilidad es conocida Hoy y no en el futuro y además los
conjuntos de eventos se intersectan.
La forma de plantear esto es: La probabilidad de que una
escuela privada (Evento A) obtenga buen resultado de PISA dado que antes era
pública (Evento B). Aquí Sí hay intersección y sólo respondiendo está
pregunta y no la anterior podremos saber qué probabilidad de éxito hay, claro
sin olvidar el Complemento, que no es otra cosa que la probabilidad de fracaso.
Para explicarlo de otra forma. No es lo mismo
preguntar cuál es la probabilidad de que la bolsa suba (Evento A) dado que yo
acabo de comprar (Evento B); a preguntar cuál es lo probabilidad de que mi
compra suba (Evento A) dado que la Bolsa ha subido (Evento B). Los eventos son
parecidos, pero en la primera pregunta son independientes porque a la Bolsa le
importa un comino que yo haya comprado y además mi compra no tiene influencia
sobre la Bolsa; en cambio en la segunda pregunta a mi si me importa qué haga la
Bolsa porque sí que puede tener influencia sobre mi compra.
En temas políticos, sociales y económicos no
existen respuestas correctas (aunque
muchos ingenuos piensen que sí), porque están a merced de la irracionalidad
y la suerte mucho mas que otras. Pero aunque no haya respuestas correctas,
jamás podremos acercarnos a la mejor alternativa o a la que mas probabilidades
de éxito tiene si no somos capaces de plantear correctamente las probabilidades.
En otras palabras, si hacemos malas preguntas únicamente obtendremos malas respuestas
o engañosas.