El valor de p: un concepto sobrevalorado

Una población

El valor de p es una cosa bastante interesante.Mucha gente tiene ideas equivocadas al respecto y en este blog intento aclararlas.

Vamos a poner un ejemplo sencillo. Supongamos que tengo un congelador que está ajustado a una temperatura de -7 grados Celcius. Imaginen que tengo en ese congelador, con un termómetro adentro que mide la temperatura cada 5 minutos, durante 100 minutos. El congelador está en buen estado, no hay fluctuaciones de voltaje y cambios en la temperatura externa. Es posible que por errores de medición haya fluctuaciones de temperatura.

Utilizando R, puedo simular este experimento con la siguiente línea de comandos

> temperatura <- rnorm(n=1000, mean= -7, sd=0.05)

Si corremos la función summary en R para el vector temperatura (como es un vector al azar y podemos tener valores diferentes:

> summary(temperatura)
Min.      1st Qu.    Median
-7.196     -7.034     -7.003
Mean     3rd Qu.     Max
-7.002    -6.968     -6.847

Como vemos el termómetro no siempre marca -7.0000 grados, en realidad va desde -7.196 hasta 6.847.

Ok, vamos a dibujar un histograma a ver como se ve…

> hist(temperatura, main="Histograma de medidas de temperatura", ylab="Frecuencia")

h
Lo que indica el gráfico es que tenemos cierta incertidumbre con respecto a las medidas de temperatura. Aunque ajustamos la temperatura a -7 grados Celsius, el termómetro marca esos valores que vemos en el histograma.

Diferencia entre 2 poblaciones

Ahora vamos a poner un termómetro en dos congeladores ambos ajustados a -7 grados Celsius. ¿Habrá alguna diferencia entre los mismos? Supongamos que vamos a comparar las medidas de ambos termómetros y que cada uno toma, de la misma manera que el experimento anterior una medida cada 5 minutos hasta completar 1000 medidas cada uno. ¿cómo comparamos ambas medidas?

Lo que usualmente se hace es primero es ver la distribución de ambos juegos de medidas. Si la distribución de ambas es normal, procedemos a valorar el promedio. Si la distribución no es normal, pero es similar en ambas poblaciones procedemos a valorar la mediana. Si las distribuciones son distintas entre ambas poblaciones de medidas, simplemente no podemos compararlas.

Luego de hacer estas valoraciones, procedemos a medir la diferencia entre los promedios o las medianas, de acuerdo al caso, tomando en cuenta la dispersión. Las pruebas que miden a diferencia entre los promedios se llaman pruebas paramétricas y las que miden la diferencia entre las medianas se llaman pruebas no paramétricas. En uno u otro caso, se va a obtener una medida que en sí es irrelevante llama “estadístico”. Dicha medida se va relacionar con los tamaños de las muestras y su dispersión. Al poner en contexto al estadístico con el tamaño de la muestra y su dispersión aparece el susodicho valor p.

El valor p representa la probabilidad de que la medida de tendencia central (sea la mediana o el promedio) sean iguales o no. No nos dice más nada… Es ese el peligro de ese valor, sin un contexto adecuado no tenemos ni la más remota idea de qué rayos hablando. Una diferencia significativa de 0.5 unidades (de lo que fuere) puede ser idéntica a una de mil unidades. Ese es el problema de hablar de valores de p fuera de contexto…

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

w

Connecting to %s