martes, 1 de noviembre de 2011
Conjuntos de números
viernes, 28 de octubre de 2011
Concepto de conjunto y de función
Definición de Matemáticas
¿Recuerda
el lector haber leído alguna vez una definición de Matemáticas? Posiblemente
no. Es que, en realidad, se han propuesto muy pocas. La verdad es que de las
Matemáticas tenemos muy claro qué cosas pertenecen a ese mundo, pero la visión
sintética, unificadora, integradora que requiere una definición no se realiza
con frecuencia. Esto ya lo podemos tomar, tal vez, como en síntoma de un
problema de fondo muy grave: usualmente en Matemáticas se calcula mucho, se
opera mucho, pero se reflexiona poco. Todos tenemos claro, por ejemplo, que el
mundo de las propiedades de los números, la trigonometría, la geometría, los
logaritmos, los límites, las derivadas, etc., todo esto pertenece al mundo de
las Matemáticas. Pero el problema surge cuando nos planteamos qué son las
Matemáticas, cómo articular con unas cuantas palabras una visión sintética y
unitaria de lo común de todas estas cuestiones que sin dificultad asociamos a
la disciplina de las Matemáticas.
Una posible definición, que es la que manejaré en esta obra y que me servirá como
hilo conductor a lo largo de todos los capítulos, es la siguiente: La
Matemática es la ciencia y la técnica que trata con conjuntos y con funciones.
Toda disciplina tiene un objeto
de trabajo, un ámbito sobre el cual actúa. Un territorio sobre el que decir
cosas o introducir entidades. Por ejemplo, la Lingüística trata con el
lenguaje, el Derecho con normas, la Biología con la vida. Lenguaje, normas,
vida son los objetos sobre los que actúa cada una de esas tres disciplinas.
Si esta disciplina es una ciencia
esta actuación básicamente consiste en la observación y en la experimentación
con la finalidad de comprender un determinado ámbito de la realidad. Así, por
ejemplo, la Lingüística, la Biología o el Derecho, como ciencias se plantean el
estudio racional, la ordenación conceptual, del ámbito objetivo sobre el que
actúan.
Si esta disciplina es una técnica esta actuación consiste en la creación de
entidades, en la creación de determinadas realidades (robots, ordenadores,
puentes, normas, etc.) para que se consigan, así, ciertos objetivos
preestablecidos.
La definición propuesta dice que la Matemática es una ciencia y una técnica.
Generalmente decimos que una disciplina o es una ciencia o una técnica. Pero
hay realmente disciplinas que comparten ambas dimensiones. Por ejemplo, el
Derecho. El Derecho también es una ciencia y una técnica. La dogmática
jurídica, el estudio de las normas vigentes en un territorio y en un momento
dados, es ciencia, es un intento de conocer una determinada realidad normativa,
conocer sus características, su estructura, sus peculiaridades. Pero también
hay en el mundo del Derecho algo cada día más trabajado en el mundo jurídico,
lo que ha venido en llamarse la Tecnología legislativa. Pues esto es, como su
nombre bien indica, una técnica.
La Matemática es, pues, una técnica:
Los conjuntos y las funciones, que son su objeto básico de trabajo, se crean.
Las funciones se crean a veces con la finalidad de modelar algún aspecto de la
realidad: el crecimiento de una población, el comportamiento de alguna
característica física a lo largo del tiempo, la relación entre la abundancia de
dos determinados tipos de palabras a lo largo de un texto, la relación que hay
entre euros y pesetas, etc. Otras veces las funciones se crean por el mero
placer de crear, de crear estructuras con ciertas curiosidades, con formas
extrañas, con propiedades curiosas.
Pero la Matemática es también una
ciencia: Los conjuntos y las funciones son entidades que se pueden estudiar al
modo que trabaja habitualmente la ciencia. Buscar propiedades, características.
De hecho una serie de conceptos clásicos en matemáticas, como el de límite,
derivada, etc., son técnicas para estudiar las funciones, son instrumentos para
caracterizar a los verdaderos entes matemáticos, que son las funciones.
Ya hemos visto la dimensión
científica y tecnológica de la Matemática. Ahora hace falta ver el objeto sobre
el que actúa la Matemática tanto al actuar como ciencia como al actuar como
técnica. Hemos dicho que el objeto es el mundo de los conjuntos y el de las
funciones. Y esto es muy importante. De hecho es la clave del planteamiento de
este curso de Matemáticas. Ver que detrás de todo en Matemáticas están los
conceptos de conjunto y de función es la clave de este proyecto. Es la clave
para mostrar el peculiar lenguaje del mundo de las Matemáticas.
Es claro que puede en principio
sorprender. La mayor parte de los estudiantes que llegan a la Universidad,
después de sus estudios secundarios tienen una idea deformada de lo que son las
Matemáticas. Tienen en la cabeza un enorme repertorio de conceptos matemáticos
muy desconectados entre sí. A un estudiante le cuesta ver la relación que hay
entre conceptos como derivada, límite, logaritmo, trigonometría, integración,
primitiva, etc. Pues la noción de función es un buen elemento de integración.
Porque lo que tienen estos conceptos citados en común y lo que tienen todos los
conceptos matemáticos en común es la noción de función. Que todos son distintos
enfoques, distintas formas de aproximarse a las funciones que son los
verdaderos protagonistas en el mundo de las matemáticas.
martes, 20 de septiembre de 2011
Introducción (1-8)
Técnicas de descripción (9-151)
Muestreo (9-16 y 147-151)
Estadística descriptiva (17-68)
Intervalos de confianza (69-146)
Correlación (158-227)
Regresión simple (228-297)
Ji-cuadrado (298-324)
Odds ratio (325-392)
Significación formal versus Significación material (393-432)
Introducción a la comparación (433-454)
Determinación del tamaño muestral (469-499)
Comparación de dos grupos (501-557)
ANOVA (558-606)
Problemas (609-642)
Concepto de modelización (643-653)
Problemas (654-660)
Modelización estadística (661-677)
Problemas (678-690)
Metáfora del baloncesto (691-727)
Problemas (728-735)
Sensibilidad, especificidad, VPP, VPN (736-806)
Problemas (807-825)
Regresión logística (826-915)
Problemas (851-855 y 916-920)
sábado, 3 de septiembre de 2011
Definiciones de Estadística
La que yo daría sería: La Estadística es un diálogo entre el indicativo y el subjuntivo (Deberé en otro momento argumentarla, evidentemente).
-- Desde Mi iPad
miércoles, 23 de febrero de 2011
Técnicas de comparación de dos grupos
1) Variables continuas
a) Muestras independientes
i. Poblaciones normales
Varianzas iguales: Test de la t de Student para varianzas iguales
Varianzas desiguales: Test de la t de Student para varianzas desiguales
ii. Poblaciones no normales: Test de Mann Whitney
b) Muestras relacionadas
i. Población normal: Test de la t de Student de datos apareados
ii. Población no normal: Test de los signos
2) Variables dicotómicas: Test de proporciones
martes, 22 de febrero de 2011
Indice
1. Introducción (1-8)
2. Técnicas de descripción (9-151)
a. Muestreo (9-16 y 147-151)
b. Estadística descriptiva (17-68)
c. Intervalos de confianza (69-146)
3. Técnicas de relación (152-432)
a. Correlación (158-227)
b. Significación (183-225, 276-294 y 393-432)
c. Regresión simple (228-297)
d. Ji-cuadrado (298-324)
e. Odds ratio (325-432)
4. Técnicas de comparación (433-499, de momento)
a. Intruducción a la comparación (433-454)
b. Significación (455-468)
c. Determinación del tamaño muestral (469-499)
domingo, 20 de febrero de 2011
Tamaño de muestra
Observemos en los tres experimentos que se muestran en la fotografía que las dispersiones de las muestras y las diferencias de medias son iguales en las tres comparaciones. La única diferencia está, ahora, en los tamaños muestrales. Arriba, el tamaño muestral es 3, en medio 5 y, abajo, es muy grande. Ante los datos mostrados arriba la técnica estadística debe mantener
Dispersión
Observemos en los tres experimentos que se muestran en la fotografía que, ahora, los tamaños muestrales (n=5) y las diferencias de medias son iguales en las tres comparaciones. La única diferencia está en la dispersión que, arriba, es grande, en medio, intermedia, y, abajo, es muy pequeña. Ante los datos de arriba la técnica estadística debe mantener
Diferencia de medias
Observemos en los tres experimentos de comparación de dos muestras que se dibujan en la fotografía que los tamaños muestrales (n=5) y las dispersiones de las muestras son iguales en las tres comparaciones. Vemos en cruces los valores muestrales y en una línea la media muestral. Cada color hace referencia a un grupo distinto. La única diferencia está, en este caso, en la diferencia de medias: Arriba, es perqueña, en medio, intermedia, y, abajo, es muy grande. Ante los datos de arriba la técnica estadística debe mantener la hipótesis nula (H0) de igualdad de medias a nivel poblacional. La diferencia de medias muestrales no es significativa. Se trata de una diferencia muestral no fiable porque podría ser perfectamente el fruto del azar del muestreo. La técnica estadística proporciona, en este caso, un p-valor superior a 0,05. Ante los datos de abajo, por el contrario, la técnica estadística verá que
miércoles, 9 de febrero de 2011
Técnicas y objetivos
1) Técnicas: Descripción, Relación y Comparación.
2) Objetivos: Describir, Pronosticar y Contrastar.
-- Desde Mi iPhone
domingo, 6 de febrero de 2011
La significación estadística
Significación en Estadística significa algo así como fiabilidad. Un resultado significativo es un resultado por el que podemos apostar. Ante una afirmación estadísticamente significativa podemos pensar que si volviésemos a hacer lo mismo, si volviésemos a empezar todo lo que habíamos hecho y que nos ha llevado a tales afirmaciones, y lo hiciésemos en las mismas circunstancias, pero con otra muestra, acabaríamos diciendo algo similar, algo equivalente.
Podemos pensar, pues, que estamos ante una muestra tipo, ante una buena muestra de muestras, una muestra representativa del conjunto de muestras que hubiéramos podido tener.
Una afirmación si es estadísticamente significativa representa que
La significación estadística se mide mediante el p-valor. Éste es un valor que va del 0 al 1, con dos sectores bien diferenciados: del 0 al 0,05 y del 0,05 al 1. Una metáfora posible, en esta situación, es la de las notas: En nuestro sistema educativo las notas van del 0 al 10, y es bien distinto el sector de notas que va del 0 al 5 que el que va del 5 al 10. Esto mismo sucede con el p-valor. La frontera del 0,05 en el p-valor es, en cierto modo, equivalente al 5 en las notas. Pero cuidado: 0,05, no 0,5.
Por ejemplo: Una correlación será significativa si su p-valor es inferior a 0,05. Si no es significativa hemos de presuponer que r = 0. Siguiendo la metáfora de las notas, es como si se examinara la afirmación r = 0: si el p-valor es igual o superior a 0,05 aprueba, si el p-valor es inferior a 0,05 suspende, decidimos, entonces, que la r no es 0 y nos quedamos con el signo y la magnitud de la r calculada. De esta forma podemos decir que una r = 0,8 con un p-valor de 0,26 es, en realidad, una correlación más baja que una r = 0,4 con p = 0,001. Porque, en este caso, la r = 0,8, al no ser significativa, no podemos fiarnos de ella. Puede ser un efecto del azar del muestreo. Esto quiere decir que de la misma forma que en esta muestra hemos calculado una r = 0,8 en otra muestra tomada en las mismas condiciones podríamos tener r = -0,8. Por eso ante esta posibilidad la técnica estadística nos dice: “Ante la duda mejor afirmar que no hay relación; o sea, que r es igual a
Al basarse la decisión en un número entre 0 y 1 y en una frontera (0,05), el paralelismo con la enseñanza es claro: En la enseñanaza, en España, las notas son un número del 0 al 10, con una frontera muy clara en el 5. Como puede verse la frontera en el p-valor está relativamente mucho más a favor del aprobado. Esto es para que cuando suspenda r = 0 tengamos muy pocas posibilidades de errar. Observemos que el margen de la afirmación r = 0 es muy amplio (0,95). Esto es lo que permite hablar de "significativo" cuando suspende. Por eso, entonces, hablamos de correlación significativa. Porque le hemos dado mucho margen a r = 0 y acabamos viendo que no es coherente mantener esta afirmación a la luz de lo que estamos viendo en la muestra que tenemos.
La significación tiene mucho que ver con el tamaño de muestra. Si ese tamaño es pequeño es difícil que
Entender este razonamiento es fundamental en Estadística. Estamos abordando, con esto, en realidad, el núcleo básico de
En Estadística a todo esto que estamos viendo le denominamos "Contraste de hipótesis". Vamos a ver, ahora, la terminología que usamos. En Contraste de hipótesis se habla de Hipótesis nula: H0, y de Hipótesis alternativa: H1. Y de que hemos de decidirnos por una u otra. La decisión no es como cuando compramos una camisa poniendo una al lado de la otra para ver cuál nos gusta más.
Esta lógica de funcionamiento es el tema nuclear de casi todas las técnicas estadísticas.
Siempre digo que la estructura de
El contraste de hipótesis en el caso de la regresión lineal es: Ho: a = 0, H1: a < > 0 (distinto de cero). Con la b lo mismo: Ho: b = 0, H1: b < > 0. Obsérvese el paralelismo con el contraste de la correlación: Ho: r = 0, H1: r < > 0. En la hipótesis nula siempre tenemos lo que podemos decir antes de hacer cualquier cosa(lo que podemos presuponer): que no hay relación.
El paralelismo de
En Estadística podemos decir que existe la presunción de no relación entre las variables. Presunción de r = 0, de a = 0, de b = 0. Y más tarde, cuando veamos las técnicas de comparación hableremos de la presunción de igualdad de medias, de proporciones, de varianzas, etc. Únicamente si es incoherente mantener esas presunciones, a la luz de la muestra (nuestras pruebas y testigos), diremos que hay relación. Pero cuando lo hagamos, cuando digamos que hay relación, o que hay diferencias de medias o de proporciones, como lo habremos hecho tras darle mucho margen de confianza a la presunción de no relación, o a la de igualdad, podemos decir que aquella relación es significativa, es fiable, que existen pocas posibilidades de que no sea así.
En el fondo los estadísticos somos un poco como el Tribunal constitucional. El Tribunal constitucional tiene como objetivo básico analizar las leyes y acabar dictaminando si se adaptan o no a la constitución. Al final sus sentencias son, en esencia, decir "constitucional" o "no constitucional". Y lo que dice este tribunal es la última palabra. Con
viernes, 4 de febrero de 2011
274. Gráfico de regresión
Ejemplo de correlación y regresión
Tenemos diez alumnos con sus notas de matemáticas y de física. Las notas son las siguientes (cada paréntesis recoge las notas de un alumno, la primera nota es la de matemáticas y la segunda es la de física):
(7, 8), (2, 4), (8, 8), (6, 7), (5, 6), (8, 9), (9, 9), (1, 3), (2, 3), (3, 4)
La correlación de Pearson es 0,98 y su p-valor es menor que 0,0001, lo que significa que se trata de una correlación significativa, positiva y de alta magnitud.
Vamos a hacer una regresión lineal a través del modelo y=ax+b+e, donde la y es la nota de física y la x la nota de matemáticas. Esto nos puede interesar, por ejemplo, si somos profesores de física y queremos algún día pronosticar las notas que tendrán de física nuestros alumnos sabiendo las notas que han obtenido previamente de matemáticas.
Si aplicamos a estos datos la técnica de los mínimos cuadrados vemos que los parámetros de la recta son: a=0,8179 y b=1,9284. La DE de la e es 0,4.
Esto significa que podemos escribir el modelo:
Nota de física=0,8179*Nota de matemáticas+1,9284+e
donde la e sigue una distribución N(0, 0.4).