Significación en Estadística significa algo así como fiabilidad. Un resultado significativo es un resultado por el que podemos apostar. Ante una afirmación estadísticamente significativa podemos pensar que si volviésemos a hacer lo mismo, si volviésemos a empezar todo lo que habíamos hecho y que nos ha llevado a tales afirmaciones, y lo hiciésemos en las mismas circunstancias, pero con otra muestra, acabaríamos diciendo algo similar, algo equivalente.
Podemos pensar, pues, que estamos ante una muestra tipo, ante una buena muestra de muestras, una muestra representativa del conjunto de muestras que hubiéramos podido tener.
Una afirmación si es estadísticamente significativa representa que
La significación estadística se mide mediante el p-valor. Éste es un valor que va del 0 al 1, con dos sectores bien diferenciados: del 0 al 0,05 y del 0,05 al 1. Una metáfora posible, en esta situación, es la de las notas: En nuestro sistema educativo las notas van del 0 al 10, y es bien distinto el sector de notas que va del 0 al 5 que el que va del 5 al 10. Esto mismo sucede con el p-valor. La frontera del 0,05 en el p-valor es, en cierto modo, equivalente al 5 en las notas. Pero cuidado: 0,05, no 0,5.
Por ejemplo: Una correlación será significativa si su p-valor es inferior a 0,05. Si no es significativa hemos de presuponer que r = 0. Siguiendo la metáfora de las notas, es como si se examinara la afirmación r = 0: si el p-valor es igual o superior a 0,05 aprueba, si el p-valor es inferior a 0,05 suspende, decidimos, entonces, que la r no es 0 y nos quedamos con el signo y la magnitud de la r calculada. De esta forma podemos decir que una r = 0,8 con un p-valor de 0,26 es, en realidad, una correlación más baja que una r = 0,4 con p = 0,001. Porque, en este caso, la r = 0,8, al no ser significativa, no podemos fiarnos de ella. Puede ser un efecto del azar del muestreo. Esto quiere decir que de la misma forma que en esta muestra hemos calculado una r = 0,8 en otra muestra tomada en las mismas condiciones podríamos tener r = -0,8. Por eso ante esta posibilidad la técnica estadística nos dice: “Ante la duda mejor afirmar que no hay relación; o sea, que r es igual a
Al basarse la decisión en un número entre 0 y 1 y en una frontera (0,05), el paralelismo con la enseñanza es claro: En la enseñanaza, en España, las notas son un número del 0 al 10, con una frontera muy clara en el 5. Como puede verse la frontera en el p-valor está relativamente mucho más a favor del aprobado. Esto es para que cuando suspenda r = 0 tengamos muy pocas posibilidades de errar. Observemos que el margen de la afirmación r = 0 es muy amplio (0,95). Esto es lo que permite hablar de "significativo" cuando suspende. Por eso, entonces, hablamos de correlación significativa. Porque le hemos dado mucho margen a r = 0 y acabamos viendo que no es coherente mantener esta afirmación a la luz de lo que estamos viendo en la muestra que tenemos.
La significación tiene mucho que ver con el tamaño de muestra. Si ese tamaño es pequeño es difícil que
Entender este razonamiento es fundamental en Estadística. Estamos abordando, con esto, en realidad, el núcleo básico de
En Estadística a todo esto que estamos viendo le denominamos "Contraste de hipótesis". Vamos a ver, ahora, la terminología que usamos. En Contraste de hipótesis se habla de Hipótesis nula: H0, y de Hipótesis alternativa: H1. Y de que hemos de decidirnos por una u otra. La decisión no es como cuando compramos una camisa poniendo una al lado de la otra para ver cuál nos gusta más.
Esta lógica de funcionamiento es el tema nuclear de casi todas las técnicas estadísticas.
Siempre digo que la estructura de
El contraste de hipótesis en el caso de la regresión lineal es: Ho: a = 0, H1: a < > 0 (distinto de cero). Con la b lo mismo: Ho: b = 0, H1: b < > 0. Obsérvese el paralelismo con el contraste de la correlación: Ho: r = 0, H1: r < > 0. En la hipótesis nula siempre tenemos lo que podemos decir antes de hacer cualquier cosa(lo que podemos presuponer): que no hay relación.
El paralelismo de
En Estadística podemos decir que existe la presunción de no relación entre las variables. Presunción de r = 0, de a = 0, de b = 0. Y más tarde, cuando veamos las técnicas de comparación hableremos de la presunción de igualdad de medias, de proporciones, de varianzas, etc. Únicamente si es incoherente mantener esas presunciones, a la luz de la muestra (nuestras pruebas y testigos), diremos que hay relación. Pero cuando lo hagamos, cuando digamos que hay relación, o que hay diferencias de medias o de proporciones, como lo habremos hecho tras darle mucho margen de confianza a la presunción de no relación, o a la de igualdad, podemos decir que aquella relación es significativa, es fiable, que existen pocas posibilidades de que no sea así.
En el fondo los estadísticos somos un poco como el Tribunal constitucional. El Tribunal constitucional tiene como objetivo básico analizar las leyes y acabar dictaminando si se adaptan o no a la constitución. Al final sus sentencias son, en esencia, decir "constitucional" o "no constitucional". Y lo que dice este tribunal es la última palabra. Con
No hay comentarios:
Publicar un comentario