INICIO

DISTRIBUCIÓN NORMAL | DEFINICIÓN, TABLA Y EJERCICIOS RESUELTOS

Contexto: Probabilidad y Estadística | Bloque: Distribuciones de Probabilidad

Es muy normal querer saber qué es la distribución normal.

Pero antes hay que saber dónde estamos.

Estamos en el ámbito de las matemáticas que se encarga de analizar probabilidades.

Antes de saber qué es la distribución normal, hay que saber que una distribución es un reparto.

¿Reparto de qué?

De la probabilidad.

Y la distribución normal pues es la distribución de probabilidades más frecuente de los fenómenos de la realidad.

Información sobre la Distribución Normal

Tiene dos parámetros:

Nota: Si no dominas estos conceptos quizás te interese repasar estos apuntes de estadística.

Forma: Tiene forma de campana, porque los datos centrales (en torno a la media) se toman con más probabilidad que los datos externos.

Para entenderlo mejor hay que observar un ejemplo super mega común.

Ejemplo de Distribución Normal

No vamos a olvidarnos de que las distribuciones están asociadas a una variable aleatoria.

Nota: Recordar que una variable aleatoria es una función que coge resultados de un experimento aleatorio y le asigna valores.

Harry Potter sale a correr todos los días.

Y la variable aleatoria que vamos a imaginarnos es el tiempo que este es capaz de correr hasta que se le cansan los pulmones y se para.

Pues eso es una distribución normal de media 30 y desviación típica 5.

Las probabilidades de correr x minutos se distribuyen así:

distribucion-normal

Es muy probable que la variable aleatoria X: “Tiempo que correrá Harry Potter en su próxima carrera” tome valores en torno a los 30 minutos, que es la media de la distribución.

Y la desviación típica de los valores es de 5, por lo que la probabilidad de tomar valores alejados en cinco puntos de la media también es bastante alta.

Otros valores tienen menor probabilidad.

Muy bonito, pero…

Cómo calcular probabilidad en una Normal

Las probabilidades están tabuladas, hay que mirarlas en unas tablas que han sido calculadas previamente.

Pero como hacer una tabla para cada posible distribución Normal sería una cosa bastante poco práctica, pues basta con tener una tabla con una única distribución estándar.

Es la que llamaremos distribución Normal Estándar, y cada vez que tengamos que calcular una probabilidad lo que haremos es estandarizar nuestra distribución para poder mirar en la tabla.

El proceso de estandarizar una distribución normal cualquiera se denomina tipificación.

¿Cómo tipificar una distribución normal?

Siempre igual: Restando la media y dividiendo por la desviación típica.

Por ejemplo: Tengo una variable aleatoria X que sigue una distribución normal de media 8 y desviación típica tres medios.

Pregunta: ¿Cuál es la probabilidad de que la variable aleatoria X tome valores inferiores a 6?

Pues vamos a tipificar la distribución a una Normal Estándar, que es la que tiene media cero y desviación típica uno.

¿Cómo?

Restando la media y diviendo por la desviación típica.

tipificar-ejemplo-resuelto

Ni te asustes ni te pierdas, vamos a re-leer la expresión:

Bien.

Solo hemos trasladado el problema para poder mirar la tabla de la normal estándar y ver la probabilidad.

¿Qué tabla?

Esta.

Tabla de la distribución Normal Estándar

Busca en internet y vas a encontrar muchas, todas son lo mismo pero algunas son más bonitas que otras.

tabla-tipificada-normal

Lo normal es que así a simple vista no sepa interpretarse la tabla.

Vamos a observar el gráfico de la campana que presenta una distribución normal estándar:

distribucion-normal-campana

Los valores están centrados en el cero (hemos dicho que tiene media cero) y se desvían típicamente una unidad arriba o abajo (entre menos uno y más uno), pues hemos dicho que tiene desviación típica 1.

Eso hay que saberlo y es una cosa muy simple.

¿Y qué pinta el cuatro a ambos lados?

Pues ese es el valor práctico extremo que tomaría la variable aleatoria en esta distribución, aunque teóricamente puede tomar desde menos infinito hasta más infinito.

Pero bueno, los valores por ahí tan alejados tienen una probabilidad tan pequeñísima que podemos considerarla nula.

Por eso en la tabla estandarizada el valor máximo que veremos será normalmente el 3.99 (justo antes del 4).

Bien.

En la tabla que he puesto yo los valores van hasta el 1.4 porque nosotros no necesitamos más para este ejemplo.

Las columnas representan decimales, para darle más precisión al asunto.

Entonces, contestando a la pregunta del problema.

¿Cuál es la probabilidad de que esa variable aleatoria Z de distribución normal estándar tome valores menores que -1.33?

Miramos en la fila de z = 1.3 y luego en la columna hasta la centiunidad 0.03, para tener el valor de probabilidad en el punto 1.33

El valor en esa casilla es 0.9082

Ok, pero ahora vamos a interpretarlo.

Esa es la probabilidad de que la z tome valores inferiores a 1.33, es decir, toda este área:

ejemplo-resuelto-normal

Pero no es esa la que queremos, nosotros queremos esta:

distribucion-normal-ejemplo

¡Anda!

¿Y ahora que pasa?

Pues que la tabla generalmente está pensada para darnos el semiárea positiva desde cero hasta 3.99

Nosotros tenemos que jugar con los conceptos para averiguar los casos del otro lado.

Sabemos que la probabilidad total es uno.

Es decir, al área total bajo la campana es uno.

Entonces ya lo tenemos.

Si miras el ejemplo de antes, ves que lo que falta para llegar al final es justo lo que estamos necesitando.

ejemplo-resuelto-normal-facil

Es decir, uno menos 0.9082, que es 0.0918

La probabilidad de que la normal tipificada tome valores inferiores a -1.33 es de apenas el 1% (0.0918).

Naturalmente la probabilidad de que la distribución original del ejemplo tome valores inferiores a 6 es la misma, pues para eso hemos hecho todo esto.

Para que no te estreses demasiado, aquí tienes la tabla completa:

tabla-normal-tipificada

Las probabilidades van hasta 0.5 porque solo se considera el semiárea positiva.

Es decir, esta tabla muestra probabilidades desde 0 hasta el valor z.

Pero es que con eso es bastante para calcular cualquier probabilidad, porque sabemos que el área total es uno, la probabilidad más alta.

Vamos a ver otro ejemplo.

Problema resuelto de distribución Normal

Soy el alcalde de Super Ciudad, y tengo que contratar una empresa para que ilumine las calles durante dos semanas de fiesta con veinte mil bombillas estroboscópicas fiesteras.

He encontrado una empresa que me ofrece unas bombillas muy baratas pero que tienen una duración media de 302 horas, con una desviación típica de 40 horas.

Pero yo que soy un alcalde muy probabilista, pues me río.

¿Cuántas bombillas puedo esperar que sobrevivan durante al menos 400 horas que dura la fiesta?

A ver, tenemos entre manos una variable aleatoria que está midiendo el tiempo que duran las bombillas, y que sigue una distribución Normal de media 302 y de desviación típica 40.

La pregunta principal radica en calcular la probabilidad de que una bombilla dure más de 400 horas.

Se hace necesario tipificar para observar desde la prespectiva de una normal estándar.

Tipificar: restar la media y partir por la desviación típica.

Entonces ese 400 se nos quedaría en un (400-302)/40 = 2.45

Mirando en la tabla, la probabilidad de que z tome valores entre cero y dos con cuarenta y cinco es de: 0.4929

Pero eso no es lo que nos interesa, nosotros queremos saber cuánta es la probabilidad de los valores que quedan por encima, los que duran más de ese 2.45 tipificado.

En este caso sería el resto de la mitad del área, es decir 0.5 – 0.4929 = 0.0071

¿Por qué?

Vale, ¿Y qué pasa con ese 0.0071?

Esa es la probabilidad de que una de las bombillas aguante más de 400 horas encendidas.

Entonces, de 20 mil, pues tenemos que una media del 0.71% de bombillas aguantarán al menos 400 horas, y eso son tan solo 142 bombillas.

Muy poquitas.

Lo barato sale caro así que mejor voy a buscar otra empresa bombillera.