La diversidad como columna vertebral: 2011

martes, 1 de noviembre de 2011

Conjuntos de números

De todos los conjuntos posibles los más usados en la construcción del mundo de las matemáticas son los conjuntos de números: Los conjuntos cuyos elementos son números. Son los más usados porque en matemáticas es muy usual tratar con magnitudes, con valores, con números que hacen referencia a una característica. Los números son el alfabeto de las magnitudes de cualquier naturaleza.

Potencialmente hay infinitos conjuntos de números. Los cinco conjuntos de números más populares, más usuales, son el conjunto de los naturales, el de los enteros, el conjunto de los racionales, el de los números reales y el de los complejos.

N es el conjunto de los números naturales, Z el de los números enteros, Q el de los racionales, R el de los reales y C el de los números complejos. Unos dentro de otros. Unos como subconjuntos de otros. (Un conjunto es subconjunto de otro conjunto cuando todos sus elementos -los del subconjunto- están incluidos en el otro conjunto). Así los naturales son un subconjunto de los enteros; éstos, a su vez, son un subconjunto de los racionales, etc. Todos, en última instancia, son subconjuntos de los números complejos, que se constituye en el techo de todos los posibles conjuntos de números.

El conjunto de los números naturales N es el formado por los siguientes números: {1,2,3,…}.

Los puntos suspensivos indican que tenemos la posibilidad de continuar indefinidamente.

Kronecker dijo en una ocasión que los números naturales los creó Dios y todos los demás los crearon los hombres. De hecho es el conjunto de números más familiar para nuestra intuición, para nuestra capacidad de percibir la discretización de las cosas de nuestro mundo. Las cosas las agrupamos, y se agrupan, en cantidades que son números naturales. Decimos un coche, o cinco personas, o siete libros.

Un número es una entidad matemática con vida propia, como toda entidad matemática, y que, como sucede también con toda entidad matemática, además, puede actuar como modelo, como representación, como aproximación, de la cantidad, de la magnitud de una característica de una entidad cualquiera.

El conjunto de los números enteros Z es el formado por los números naturales, el cero y los naturales con signo negativo; o sea, el formado por los siguientes números:{…,-2,-1,0,1,2,…}.

Los puntos suspensivos aquí se toman desde la izquierda, porque podemos extendernos indefinidamente hacia la izquierda, y hacia la derecha, porque, como sucede con los naturales, podemos continuar indefinidamente hacia la derecha.

Los números enteros los podemos usar como modelo, como representación de muchas situaciones: Si en un banco tenemos, en una cuenta, 1000 pesetas y nos pagan un recibo de la luz que es de 2000 pesetas, nos aparecerá un saldo de -1000, y esto lo entendemos todos. Dentro del conjunto de los números naturales no existe ningún número, ningún modelo, para representar este saldo negativo. En los enteros sí lo tenemos.

Los números negativos se entienden y se usan hoy en día con total normalidad, pero no siempre ha sido así. Incluso hoy en día no es sencilla su comprensión por ciertas personas de algunas generaciones. A ciertas personas mayores si se les pregunta cuánto es 5 menos 8 dicen que cero. Si a cinco se le quita ocho no queda nada, dicen, si se les pide que razonen el porqué.

El conjunto de los números racionales Q es el formado por los siguientes números:{a/b; a y b son enteros y b es distinto de cero}.

Esta es la expresión abstracta del conjunto. Se lee así: El conjunto de los números racionales está formado por elementos x tales que x es igual a un cociente cualquiera de dos números enteros con la única condición de que la q no sea el cero en ningún caso.

El conjunto de los números racionales está formado por cocientes de números enteros. Son las fracciones: 1/2, 3/4, etc. Buen modelo también para situaciones reales, comerciales, cotidianas, para formas de hablar, etc. Decimos la mitad, o tres cuartas partes. Son expresiones que entendemos todos. Los racionales se crearon para modelizar este tipo de situaciones. En general, cuando algo puede dividirse en fragmentos de la misma magnitud q y tomamos p fragmentos de esos, entonces hemos tomado el número racional p/q.

El conjunto de los números reales R es el conjunto de los números racionales más el de los irracionales. Los irracionales son los números que no pueden expresarse en forma de un cociente de enteros. Por ejemplo: el número pi, el número e, la 2, etc. Estos números no pueden expresarse en forma de fracción. Sus decimales no siguen una ordenación regular. Tienen infinitos decimales y, además, imprevisibles. Esto de imprevisibles es fundamental porque, por ejemplo, 10/3 es un número racional que tiene infinitos decimales también, pero son claramente previsibles, son siempre el mismo número: el 3.

Estos números surgen de la necesidad de representar valores reales como la relación entre el diámetro y el perímetro en una circunferencia o la longitud del diámetro en un cuadrado de lado uno, para cuya representación no nos valen los racionales. No hay ningún racional que nos proporcione la longitud del diámetro de un cuadrado de lado uno, de la misma forma que no había ningún número natural que nos representara un saldo negativo de mil pesetas.

Cada número real ocupa una posición en la denominada recta real. La recta está ocupa en todos sus puntos. No ocurriría lo mismo si representáramos los racionales. En este caso habría agujeros. En la posición del número pi , por ejemplo, habría un agujero, porque el número pi no es un número racional.

El conjunto de los números complejos C es el conjunto de los siguientes números: {a+bi; donde a y b son números reales e i es igual a la raíz cuadrada de -1}.

Un número complejo tiene la forma a+bi. La a es la llamada parte real y la b es la llamada parte imaginaria. Los números reales son los números complejos en los que la parte imaginaria es igual a cero. Uno puede decir: Tengo 24+0i años. Cualquier número, en realidad, es un número complejo.

Estos números resuelven ecuaciones como, por ejemplo, x²+1=0. No hay ningún número real que sea solución de esta ecuación porque no hay ningún número real que elevado al cuadrado (que multiplicado por él mismo) dé -1, que es lo que debería suceder para que la igualdad fuera cierta.

Como puede apreciarse cada tipo de número es una respuesta a algún tipo de situación real. Cada tipo de números aporta algo nuevo que era imposible encontrar en los anteriores.

Los números complejos son el techo de todos los números. Los demás son diferentes subconjuntos de éstos y, como tales, son, en realidad, complejos. Por ejemplo, los números reales son complejos en los que la b es igual a cero. Como la b, en los complejos, puede ser cualquier número real, y como los reales son los complejos para los que la b es igual a cero, los reales se ven ahora como una muy pequeña parte respecto al total de números complejos.

Es muy interesante ver cómo unos conjuntos de números están incluidos dentro de otros. Los naturales están dentro de los enteros, los enteros dentro de los racionales, los racionales dentro de los reales y los reales están dentro de los complejos. Todos son, pues, complejos.

Se pueden ver los números complejos como puntos de un plano en el que una dimensión es la llamada parte real del número, la a, y la otra dimensión la parte imaginaria, la b. De esta forma cada número complejo ocupa una posición distinta en este plano, una posición definida por dos componentes: su parte real y su parte imaginaria.

Aunque estos conjuntos de números son los más usuales en matemáticas no son los únicos conjuntos de números importantes. Hay otros conjuntos de números que en gran parte pueden ser partes de estos conjuntos básicos vistos, pero que es muy importante especificar por la enorme importancia que tienen. Por ejemplo: el conjunto de números reales comprendidos entre el cero y el diez, incluidos ambos. Este conjunto en lenguaje más técnico se le suele denominar el intervalo cerrado de números reales entre el cero y el diez. Escrito en lenguaje matemático:[0,10].

De este conjunto no nos hemos escapado de manejarlo nadie. Es el conjunto de notas posibles tras un examen. En España la forma de puntuar habitual de los exámenes es mediante un número que va del cero al diez, de un número de este intervalo cerrado. Es cerrado porque el cero y el diez pueden ser notas. Si el cero y el diez no pudieran nunca ponerse como notas pero sí cualquier nota entre ellos el intervalo sería el denominado “abierto”. Y se escribiría entonces (0,10) De la misma forma hay los semiabiertos:[0,10) y (0,10]. La interpretación de estos intervalos es obvia si se proyecta lo explicado anteriormente.

Otro conjunto de números importante: El intervalo de números reales del cero al cien. Escrito:[0,100]. Continuamente hablamos en porcentajes. Pues tomamos entonces valores de este conjunto.

Otro conjunto:[0,1]. Este es un conjunto de números muy usual en el mundo de las probabilidades. Las probabilidades las solemos expresar en tanto por uno. Por ejemplo, en una moneda equilibrada decimos que la probabilidad de cara es 0,5.

Otro:[-1,1]. Muy usual para indicar las correlaciones entre dos características evaluadas en ciertos individuos. Por ejemplo, podemos oír o leer que en una muestra estudiada se ha comprobado que entre la altura y el peso hay una correlación de 0,78. Este valor de correlación por el cálculo que implica siempre está comprendido entre el -1 y el 1.

Otro índice muy popular en la Química: El pH. Es un número entre 1 y 14. Por lo tanto, el pH es un valor de un intervalo [1,14].

viernes, 28 de octubre de 2011

Concepto de conjunto y de función

Dos conceptos están siempre presentes en cualquier idea en matemáticas: los conceptos de conjunto y de función. De hecho, en matemáticas siempre se están manejando conjuntos y funciones, porque la Matemática es, como ya hemos definido antes, la ciencia y la técnica que trata con conjuntos y funciones. Siempre conjuntos y funciones en matemáticas. No se sale de estos dos conceptos.

En realidad el concepto nuclear en matemáticas es el de función. Lo que sucede es que una función es una regla de asignación mediante la cual a todo elemento de un conjunto le asociamos un elemento, y sólo uno, de otro conjunto. Por lo tanto, en una función siempre necesitamos conjuntos. Uno como conjunto de partida de la función y otro como conjunto de llegada. Suele denominarse a uno dominio y al otro codominio.

Visto así puede parecer el mundo de las matemáticas como un mundo pobre, pero lo cierto es que la variedad de conjuntos y de funciones que se pueden llegar a ver dentro del mundo de las matemáticas es impresionante. En nuestras visitas a conjuntos y funciones que haremos en la parte especial de este libro podremos comprobar perfectamente esta sorprendente variedad.

En matemáticas todo gira en torno al concepto de función. Puede empezar a percibirse así la unidad que hay dentro del enorme volumen de conceptos que se han ido creando a lo largo de la historia de las matemáticas. Decir que las Matemáticas no hay más que funciones, y los conjuntos que son el soporte de esas funciones, debe proporcionarnos, además (y esto es muy importante), una cierta tranquilidad a la hora de iniciar este recorrido. Desde fuera, y a veces también desde dentro, las matemáticas se observan en muchas ocasiones como una enorme diversidad de conceptos, de técnicas, de problemas, de naturaleza incierta y sin conexión. Ahora, en este primer enmarque de lo que veremos, ya hemos unificado y ordenado todo lo matemático: Estudiar un único objeto, el de función. Siempre, pues, funciones. Esta idea debe guiarnos siempre en nuestro recorrido. Veremos una gran diversidad de cosas pero a través del hilo conductor del concepto de función.

Estos dos conceptos agrupan todo lo que hay en el mundo de las matemáticas. A través de estos conceptos unificadores se puede entender mucho mejor cada una de las peculiaridades de la gran diversidad de conceptos que se manejan en matemáticas y que suelen verse como fragmentarios y desconectados los unos de los otros. Ahora todo aparecerá agrupado: todo girará en torno a estos dos conceptos. Presentar nuestro recorrido girando siempre alrededor de estos conceptos ayudará a situar mejor las cosas, ayudará a enfrentarse a la diversidad con más posibilidades de comprender el papel que juega cada uno de los conceptos.

Estos dos conceptos serán la guía para nuestra mirada unificadora a toda la matemática. Serán nuestro hilo conductor. Nos permitirán entrar de lleno en el mundo de las matemáticas porque nos ayudarán a ver la realidad de cosas muy concretas y, al mismo tiempo, nos ayudarán a distanciarnos de ellas porque el ver que, en realidad, la enorme variedad de conceptos que hay en matemáticas pueden resumirse en dos nos permitirá delimitar, perfilar y dibujar con menor temor la materia con la que nos enfrentamos.

El nivel de complejidad al que se puede llegar con estos dos conceptos es enorme, por supuesto. Aquí está la dificultad, pero también lo apasionante de las matemáticas. En este recorrido por las matemáticas no dejaremos de tratar con conjuntos y con funciones. Estos dos conceptos van a ir enriqueciéndose, van a ir acumulando significados en la medida que nos enfrentemos a casos muy concretos, en la medida que visualicemos funciones concretas. Haremos disección de conjuntos y funciones. Haremos anatomía. Nos sorprenderá la complejidad y belleza que encontraremos en entidades aparentemente amorfas. Vamos a hacer una biología de los conjuntos y funciones.

Vamos a definir el concepto de conjunto:

Un conjunto es una reunión, hecha según un criterio cualquiera, de unas entidades cualesquiera.

Un conjunto es algo tan general como esto. Es el resultado de una agrupación, realizada según un criterio del tipo que sea, de entidades de cualquier naturaleza. A veces a estas entidades se las suele llamar elementos del conjunto.

Alguna precisión sobre el concepto de entidad: Una entidad será para nosotros una unidad, una agrupación de estructuras que a un determinado nivel de organización dispone de singularidad. Está separada, en un cierto sentido, de un entorno.

En matemáticas, pues, los conjuntos pueden ser cosas tan variadas como: las personas censadas en Barcelona, los capítulos de El Quijote, los números naturales o todas las funciones continuas (ya veremos qué tipo de entidades son esas).

Veamos el concepto de función: Dados dos conjuntos A y B cualesquiera, una función es una ley mediante la cual a todo elemento de A se le asocia un único elemento de B.

En la expresión es y=f(x). La x es aquí una expresión que designa a cualquier elemento del conjunto A y f(x) es una expresión que designa qué procedimiento, qué cálculo es necesario hacer para encontrar el elemento del conjunto B asociado a cada x, a cada elemento del conjunto A, según la ley f de la función. La y es, por lo tanto, el elemento concreto del conjunto B asignado a una x concreta según el procedimiento f.

f(x) es la expresión de la ley. Es donde se comprimen las especificaciones para asociar elementos de B a cada uno de los elementos de A. La x que hay dentro del paréntesis en f(x) es la x del conjunto A. Es una expresión general de cualquier elemento del conjunto A. Según lo especificado por f(x) sabremos qué elemento del conjunto B le corresponde a cualquier elemento x del conjunto A. Por ejemplo, la función f(x)=x2 nos indica que a un número cualquiera x que esté en el conjunto que ocupa la posición de A, su imagen, el valor que se le asigna según esta función, es su cuadrado. Si el 2 está en A se le asignará el 4, si está el -1 se le asignará el 1. Si está el 10 se le asignará, según esta función f, el 100. Etc.

No siempre tendremos una expresión general de la función. A veces la ley deberemos expresarla mediante un listado de todos los elementos de A y sus respectivos elementos de B asignados según f.

Una función es, pues, una ley, una regla, que asocia a todo elemento del conjunto A un único elemento del conjunto B.

Al conjunto que ocupa la posición del conjunto A suele denominarse dominio y al que ocupa la posición del conjunto B, recorrido. A veces, también, codominio.

Este libro, por ejemplo, lo podemos ver como un conjunto de párrafos. Un conjunto cuyos elementos son todos los párrafos del texto. Entonces x es la expresión abstracta de cualquiera de sus párrafos, f es una ley concreta y f(x) es el número que esta ley asigna a cada x distinta, que es un valor del conjunto R de los números reales. Por ejemplo, el números de palabras sería una función f. Según esta ley a cada uno de los párrafos se le asigna el número de palabras.

Por supuesto que podríamos concretar esta x. Podríamos ir escribiendo cada uno de los párrafos en los que está estructurada esta tesis y a la derecha el número de palabras que le corresponde.

El número de signos de puntuación sería otra f, otra función. El número de líneas, otra. El número de faltas de ortografía (Espero que esta función sea la función constante cero, escrita f(x) = 0; o sea, la función que a cada párrafo, designado aquí como x, le asigna el número cero). El número de verbos sería otra función. Etc.

Es curioso porque esta definición de función todos los estudiantes la conocen, la han visto muchas veces, desde primaria la están viendo, pero entenderla bien significa usarla en situaciones bien distintas, significa ser capaz de adaptarse con su uso a conjuntos A y B muy diferentes, y esto es ciertamente difícil.

Las matemáticas son eso: Conjuntos, funciones, conjuntos de funciones, funciones entre conjuntos de funciones, conjuntos de funciones que se definen entre conjuntos de funciones, etc. Siempre este juego entre conjuntos y funciones. Ya lo iremos viendo.

En matemáticas es cuestión de entrar en el lenguaje que configuran estos dos conceptos. Si se entra en este lenguaje, si se sitúan las cosas siempre bajo la configuración de estos dos conceptos, muchos conceptos que antes estaban sin una ubicación precisa en nuestra mente adquieren una posición más delimitada, más nítida. Conceptos como, por ejemplo, el de integral definida o el de derivada son, ya lo veremos, en realidad, unos tipos especiales de funciones. Esto cambiará posiblemente el significado que teníamos de estos conceptos.

Además, lo más difícil y lo más interesante del concepto de función es poder ver sus aplicaciones, cómo estos extraños organismos pueden servirnos para dibujar muchas cosas que vemos a nuestro alrededor. Ver cómo nos permiten dibujar las relaciones que hay entre ciertas características medidas en las cosas más próximas a nosotros.

Es muy importante ver las enormes posibilidades creativas que tienen estos dos conceptos. Este mundo, además de bello de por sí, está repleto de entidades útiles para pensar nuestro mundo, el de las cosas que nos rodean: el de los animales, el de las plantas, el de los humanos, las relaciones económicas, sociales, etc. Las entidades matemáticas son, tienen un tipo de vida: una vida lingüística. Y, además, pueden servir para representar a otros seres. Este ser dibujos de otras realidades, este ser modelos de cosas que tienen una realidad distinta a la realidad matemática será uno de los aspectos que más nos interesará en este recorrido por el lenguaje de las matemáticas.

Para un economista, un biólogo, un geólogo, para cualquier científico, las matemáticas aportan unas entidades de interés para dibujar, para aproximar, para modelizar, para dibujar las entidades con las que ellos se enfrentan, pero, además, y esto suele olvidarse, también aportan un ejercicio de pensamiento, de reflexión, que estamos seguros de que juega un importante papel que, aunque no es directamente perceptible, contribuye mucho a la lógica, a la creatividad y a la imaginación necesarias para todo científico. Entrar en el mundo de las matemáticas, además de tener acceso a entidades que son bellas de por sí y de facilitar unas estructuras que pueden ser útiles para hablar de los objetos con los que trata cualquier ciencia, facilita, a cualquiera que accede a él, una gimnasia mental con un valor no suficientemente estudiado y valorado.

La mayor parte de técnicas que se estudian en matemáticas son formas de mirar y buscar características de los que son los verdaderos protagonistas de la escena matemática: los conjuntos y las funciones.

Los conceptos de conjunto y de función se usan en el lenguaje popular con un significado prácticamente idéntico al que tienen en matemáticas. La palabra conjunto aparece en muchos contextos en el lenguaje cotidiano. Por ejemplo: Los empleados presentaron un conjunto de propuestas al director. El significado de conjunto cumple aquí perfectamente nuestra definición de conjunto. La palabra función, también se usa cotidianamente. Por ejemplo: En función del tiempo que haga iré o no iré. Este uso de función cumple perfectamente, también, la definición de función que se maneja en matemáticas. Cada situación meteorológica posible lleva asociada de forma única una decisión: ir o no ir. Y sólo una.

Definición de Matemáticas

¿Recuerda
el lector haber leído alguna vez una definición de Matemáticas? Posiblemente
no. Es que, en realidad, se han propuesto muy pocas. La verdad es que de las
Matemáticas tenemos muy claro qué cosas pertenecen a ese mundo, pero la visión
sintética, unificadora, integradora que requiere una definición no se realiza
con frecuencia. Esto ya lo podemos tomar, tal vez, como en síntoma de un
problema de fondo muy grave: usualmente en Matemáticas se calcula mucho, se
opera mucho, pero se reflexiona poco. Todos tenemos claro, por ejemplo, que el
mundo de las propiedades de los números, la trigonometría, la geometría, los
logaritmos, los límites, las derivadas, etc., todo esto pertenece al mundo de
las Matemáticas. Pero el problema surge cuando nos planteamos qué son las
Matemáticas, cómo articular con unas cuantas palabras una visión sintética y
unitaria de lo común de todas estas cuestiones que sin dificultad asociamos a
la disciplina de las Matemáticas.
Una posible definición, que es la que manejaré en esta obra y que me servirá como
hilo conductor a lo largo de todos los capítulos, es la siguiente: La
Matemática es la ciencia y la técnica que trata con conjuntos y con funciones.
Toda disciplina tiene un objeto
de trabajo, un ámbito sobre el cual actúa. Un territorio sobre el que decir
cosas o introducir entidades. Por ejemplo, la Lingüística trata con el
lenguaje, el Derecho con normas, la Biología con la vida. Lenguaje, normas,
vida son los objetos sobre los que actúa cada una de esas tres disciplinas.
Si esta disciplina es una ciencia
esta actuación básicamente consiste en la observación y en la experimentación
con la finalidad de comprender un determinado ámbito de la realidad. Así, por
ejemplo, la Lingüística, la Biología o el Derecho, como ciencias se plantean el
estudio racional, la ordenación conceptual, del ámbito objetivo sobre el que
actúan.
Si esta disciplina es una técnica esta actuación consiste en la creación de
entidades, en la creación de determinadas realidades (robots, ordenadores,
puentes, normas, etc.) para que se consigan, así, ciertos objetivos
preestablecidos.
La definición propuesta dice que la Matemática es una ciencia y una técnica.
Generalmente decimos que una disciplina o es una ciencia o una técnica. Pero
hay realmente disciplinas que comparten ambas dimensiones. Por ejemplo, el
Derecho. El Derecho también es una ciencia y una técnica. La dogmática
jurídica, el estudio de las normas vigentes en un territorio y en un momento
dados, es ciencia, es un intento de conocer una determinada realidad normativa,
conocer sus características, su estructura, sus peculiaridades. Pero también
hay en el mundo del Derecho algo cada día más trabajado en el mundo jurídico,
lo que ha venido en llamarse la Tecnología legislativa. Pues esto es, como su
nombre bien indica, una técnica.
La Matemática es, pues, una técnica:
Los conjuntos y las funciones, que son su objeto básico de trabajo, se crean.
Las funciones se crean a veces con la finalidad de modelar algún aspecto de la
realidad: el crecimiento de una población, el comportamiento de alguna
característica física a lo largo del tiempo, la relación entre la abundancia de
dos determinados tipos de palabras a lo largo de un texto, la relación que hay
entre euros y pesetas, etc. Otras veces las funciones se crean por el mero
placer de crear, de crear estructuras con ciertas curiosidades, con formas
extrañas, con propiedades curiosas.
Pero la Matemática es también una
ciencia: Los conjuntos y las funciones son entidades que se pueden estudiar al
modo que trabaja habitualmente la ciencia. Buscar propiedades, características.
De hecho una serie de conceptos clásicos en matemáticas, como el de límite,
derivada, etc., son técnicas para estudiar las funciones, son instrumentos para
caracterizar a los verdaderos entes matemáticos, que son las funciones.
Ya hemos visto la dimensión
científica y tecnológica de la Matemática. Ahora hace falta ver el objeto sobre
el que actúa la Matemática tanto al actuar como ciencia como al actuar como
técnica. Hemos dicho que el objeto es el mundo de los conjuntos y el de las
funciones. Y esto es muy importante. De hecho es la clave del planteamiento de
este curso de Matemáticas. Ver que detrás de todo en Matemáticas están los
conceptos de conjunto y de función es la clave de este proyecto. Es la clave
para mostrar el peculiar lenguaje del mundo de las Matemáticas.
Es claro que puede en principio
sorprender. La mayor parte de los estudiantes que llegan a la Universidad,
después de sus estudios secundarios tienen una idea deformada de lo que son las
Matemáticas. Tienen en la cabeza un enorme repertorio de conceptos matemáticos
muy desconectados entre sí. A un estudiante le cuesta ver la relación que hay
entre conceptos como derivada, límite, logaritmo, trigonometría, integración,
primitiva, etc. Pues la noción de función es un buen elemento de integración.
Porque lo que tienen estos conceptos citados en común y lo que tienen todos los
conceptos matemáticos en común es la noción de función. Que todos son distintos
enfoques, distintas formas de aproximarse a las funciones que son los
verdaderos protagonistas en el mundo de las matemáticas.

martes, 20 de septiembre de 2011

Indice
Introducción (1-8)
Técnicas de descripción (9-151)
Muestreo (9-16 y 147-151)
Estadística descriptiva (17-68)
Intervalos de confianza (69-146)
Correlación (158-227)
Regresión simple (228-297)
Ji-cuadrado (298-324)
Odds ratio (325-392)
Significación formal versus Significación material (393-432)
Introducción a la comparación (433-454)
Determinación del tamaño muestral (469-499)
Comparación de dos grupos (501-557)
ANOVA (558-606)
Problemas (609-642)
Concepto de modelización (643-653)
Problemas (654-660)
Modelización estadística (661-677)
Problemas (678-690)
Metáfora del baloncesto (691-727)
Problemas (728-735)
Sensibilidad, especificidad, VPP, VPN (736-806)
Problemas (807-825)
Regresión logística (826-915)
Problemas (851-855 y 916-920)

sábado, 3 de septiembre de 2011

Definiciones de Estadística

Se han dado muchas. La más original, desde mi punto de vista: Es la ciencia que lo intenta decir todo de todos sin saber nada de nadie.
La que yo daría sería: La Estadística es un diálogo entre el indicativo y el subjuntivo (Deberé en otro momento argumentarla, evidentemente).

-- Desde Mi iPad

miércoles, 23 de febrero de 2011

Técnicas de comparación de dos grupos

1) Variables continuas

a) Muestras independientes

i. Poblaciones normales

Varianzas iguales: Test de la t de Student para varianzas iguales

Varianzas desiguales: Test de la t de Student para varianzas desiguales

ii. Poblaciones no normales: Test de Mann Whitney

b) Muestras relacionadas

i. Población normal: Test de la t de Student de datos apareados

ii. Población no normal: Test de los signos

2) Variables dicotómicas: Test de proporciones

martes, 22 de febrero de 2011

Indice

1. Introducción (1-8)

2. Técnicas de descripción (9-151)

a. Muestreo (9-16 y 147-151)

b. Estadística descriptiva (17-68)

c. Intervalos de confianza (69-146)

3. Técnicas de relación (152-432)

a. Correlación (158-227)

b. Significación (183-225, 276-294 y 393-432)

c. Regresión simple (228-297)

d. Ji-cuadrado (298-324)

e. Odds ratio (325-432)

4. Técnicas de comparación (433-499, de momento)

a. Intruducción a la comparación (433-454)

b. Significación (455-468)

c. Determinación del tamaño muestral (469-499)

domingo, 20 de febrero de 2011

Tamaño de muestra

Observemos en los tres experimentos que se muestran en la fotografía que las dispersiones de las muestras y las diferencias de medias son iguales en las tres comparaciones. La única diferencia está, ahora, en los tamaños muestrales. Arriba, el tamaño muestral es 3, en medio 5 y, abajo, es muy grande. Ante los datos mostrados arriba la técnica estadística debe mantener la H0 de igualdad de medias a nivel poblacional. La diferencia de medias muestrales no es significativa, en este caso, está basada en muestras de tamaño ridículo (n=3) y, por lo tanto, ante la duda, proporciona un p-valor superior a 0,05. Ante los datos de abajo, por el contrario, la técnica estadística verá que la H0 no puede mantenerse. De ser ésta cierta es muy poco probable ver unas muestras como las que se ven abajo. En este caso las medias muestrales son muy fiables, están basadas en muestras grandes y difícilmente obtendríamos resultados muy distintos si volviéramos a hacer el mismo experimento de nuevo. Parece que en este caso la posibilidad de equivocarse al decir que hay diferencia de medias es muy baja. Por esto el p-valor es inferior a 0,05. En la situación del medio estamos en un caso dudoso, por esto no ponemos p-valor. Pero arriba y abajo los resultados son muy claros.

Dispersión

Observemos en los tres experimentos que se muestran en la fotografía que, ahora, los tamaños muestrales (n=5) y las diferencias de medias son iguales en las tres comparaciones. La única diferencia está en la dispersión que, arriba, es grande, en medio, intermedia, y, abajo, es muy pequeña. Ante los datos de arriba la técnica estadística debe mantener la H0 de igualdad de medias a nivel poblacional. La diferencia de medias muestrales no es significativa, las muestras están muy solapadas, y, por lo tanto, la técnica estadística proporciona un p-valor superior a 0,05. Ante los datos de abajo, por el contrario, la técnica estadística verá que la H0 no puede mantenerse. De ser ésta cierta es muy poco probable ver unas muestras como las que se ven abajo, tan distanciadas la una de la otra como efecto de la pequeñísima dispersión. Parece que en este caso la posibilidad de equivocarse al decir que hay diferencia de medias es muy baja. Por esto el p-valor es inferior a 0,05. En la situación del medio estamos en un caso dudoso, por esto no ponemos p-valor. Pero arriba y abajo los resultados son muy claros.

Diferencia de medias

Observemos en los tres experimentos de comparación de dos muestras que se dibujan en la fotografía que los tamaños muestrales (n=5) y las dispersiones de las muestras son iguales en las tres comparaciones. Vemos en cruces los valores muestrales y en una línea la media muestral. Cada color hace referencia a un grupo distinto. La única diferencia está, en este caso, en la diferencia de medias: Arriba, es perqueña, en medio, intermedia, y, abajo, es muy grande. Ante los datos de arriba la técnica estadística debe mantener la hipótesis nula (H0) de igualdad de medias a nivel poblacional. La diferencia de medias muestrales no es significativa. Se trata de una diferencia muestral no fiable porque podría ser perfectamente el fruto del azar del muestreo. La técnica estadística proporciona, en este caso, un p-valor superior a 0,05. Ante los datos de abajo, por el contrario, la técnica estadística verá que la H0 no puede mantenerse. De ser ésta cierta es muy poco probable ver unas muestras como las que se ven abajo. Parece que, en este caso, la posibilidad de equivocarse al decir que hay diferencia de medias, a nivel poblacional, es muy baja. Por esto el p-valor es inferior a 0,05. En la situación del medio estamos ante un caso dudoso, por esto no ponemos p-valor. Pero arriba y abajo los resultados son muy claros.

miércoles, 9 de febrero de 2011

Técnicas y objetivos

En Estadística es muy importante diferenciar entre técnicas y objetivos. Es como en Medicina: una cosa son las técnicas (radiología, medicina nuclear, etc.) y otra los objetivos (diagnósticos o terapéuticos).
1) Técnicas: Descripción, Relación y Comparación.
2) Objetivos: Describir, Pronosticar y Contrastar.

-- Desde Mi iPhone

domingo, 6 de febrero de 2011

La significación estadística

Significación en Estadística significa algo así como fiabilidad. Un resultado significativo es un resultado por el que podemos apostar. Ante una afirmación estadísticamente significativa podemos pensar que si volviésemos a hacer lo mismo, si volviésemos a empezar todo lo que habíamos hecho y que nos ha llevado a tales afirmaciones, y lo hiciésemos en las mismas circunstancias, pero con otra muestra, acabaríamos diciendo algo similar, algo equivalente.

Podemos pensar, pues, que estamos ante una muestra tipo, ante una buena muestra de muestras, una muestra representativa del conjunto de muestras que hubiéramos podido tener.

Una afirmación si es estadísticamente significativa representa que la Estadística cree en este resultado, cree que es muy poco probable que sea fruto del azar del muestreo. Si una técnica estadística duda de la representatividad de un muestreo dice: "esto no significativo".

La significación estadística se mide mediante el p-valor. Éste es un valor que va del 0 al 1, con dos sectores bien diferenciados: del 0 al 0,05 y del 0,05 al 1. Una metáfora posible, en esta situación, es la de las notas: En nuestro sistema educativo las notas van del 0 al 10, y es bien distinto el sector de notas que va del 0 al 5 que el que va del 5 al 10. Esto mismo sucede con el p-valor. La frontera del 0,05 en el p-valor es, en cierto modo, equivalente al 5 en las notas. Pero cuidado: 0,05, no 0,5.

Por ejemplo: Una correlación será significativa si su p-valor es inferior a 0,05. Si no es significativa hemos de presuponer que r = 0. Siguiendo la metáfora de las notas, es como si se examinara la afirmación r = 0: si el p-valor es igual o superior a 0,05 aprueba, si el p-valor es inferior a 0,05 suspende, decidimos, entonces, que la r no es 0 y nos quedamos con el signo y la magnitud de la r calculada. De esta forma podemos decir que una r = 0,8 con un p-valor de 0,26 es, en realidad, una correlación más baja que una r = 0,4 con p = 0,001. Porque, en este caso, la r = 0,8, al no ser significativa, no podemos fiarnos de ella. Puede ser un efecto del azar del muestreo. Esto quiere decir que de la misma forma que en esta muestra hemos calculado una r = 0,8 en otra muestra tomada en las mismas condiciones podríamos tener r = -0,8. Por eso ante esta posibilidad la técnica estadística nos dice: “Ante la duda mejor afirmar que no hay relación; o sea, que r es igual a 0”.

Al basarse la decisión en un número entre 0 y 1 y en una frontera (0,05), el paralelismo con la enseñanza es claro: En la enseñanaza, en España, las notas son un número del 0 al 10, con una frontera muy clara en el 5. Como puede verse la frontera en el p-valor está relativamente mucho más a favor del aprobado. Esto es para que cuando suspenda r = 0 tengamos muy pocas posibilidades de errar. Observemos que el margen de la afirmación r = 0 es muy amplio (0,95). Esto es lo que permite hablar de "significativo" cuando suspende. Por eso, entonces, hablamos de correlación significativa. Porque le hemos dado mucho margen a r = 0 y acabamos viendo que no es coherente mantener esta afirmación a la luz de lo que estamos viendo en la muestra que tenemos.

La significación tiene mucho que ver con el tamaño de muestra. Si ese tamaño es pequeño es difícil que la Estadística se fíe de ella. Las muestras de tamaño pequeño son muy imprevisibles porque las diferentes muestras posibles son muy diversas entre ellas. En muestras grandes hay mucha homogeneidad entre las diferentes muestras posibles. Por eso será más fiable lo que una de ellas diga.

Entender este razonamiento es fundamental en Estadística. Estamos abordando, con esto, en realidad, el núcleo básico de la Estadística.

En Estadística a todo esto que estamos viendo le denominamos "Contraste de hipótesis". Vamos a ver, ahora, la terminología que usamos. En Contraste de hipótesis se habla de Hipótesis nula: H0, y de Hipótesis alternativa: H1. Y de que hemos de decidirnos por una u otra. La decisión no es como cuando compramos una camisa poniendo una al lado de la otra para ver cuál nos gusta más. La H0 parte como cierta y sólo nos decantaremos por la H1 si la H0 es absurdo mantenerla viendo lo que vemos en la muestra. Por eso H1 se le denomina alternativa, porque es la alternativa de la nula cuando no es lógico mantenerla tras analizar la muestra. En todo lo visto con la correlación podemos ahora conectar: H0 es r = 0 y H1 es r distinta de 0. El p-valor es el criterio objetivo basado en el análisis de la muestra que nos permite decidirnos por mantener H0 o pasarnos a la alternativa, a H1.

Esta lógica de funcionamiento es el tema nuclear de casi todas las técnicas estadísticas.

Siempre digo que la estructura de la Estadística es como la del Bolero de Ravel: un mismo tema que va repitiéndose machaconamente. El tema machacón del Bolero de Ravel de la Estadística es esta noción de contraste de hipótesis y el p-valor como criterio de decisión.

El contraste de hipótesis en el caso de la regresión lineal es: Ho: a = 0, H1: a < > 0 (distinto de cero). Con la b lo mismo: Ho: b = 0, H1: b < > 0. Obsérvese el paralelismo con el contraste de la correlación: Ho: r = 0, H1: r < > 0. En la hipótesis nula siempre tenemos lo que podemos decir antes de hacer cualquier cosa(lo que podemos presuponer): que no hay relación.

El paralelismo de la Estadística con el mundo judicial es sorprendente. En un juicio también hay dos hipótesis a contrastar: inocencia y culpabilidad. Y las dos no parten paralelas. Una parte como cierta: la inocencia ("presunción de inocencia"), y sólo si durante el juicio, mediante las pruebas y testigos, se ve que la inocencia no se puede mantener se pasará a la culpabilidad.

En Estadística podemos decir que existe la presunción de no relación entre las variables. Presunción de r = 0, de a = 0, de b = 0. Y más tarde, cuando veamos las técnicas de comparación hableremos de la presunción de igualdad de medias, de proporciones, de varianzas, etc. Únicamente si es incoherente mantener esas presunciones, a la luz de la muestra (nuestras pruebas y testigos), diremos que hay relación. Pero cuando lo hagamos, cuando digamos que hay relación, o que hay diferencias de medias o de proporciones, como lo habremos hecho tras darle mucho margen de confianza a la presunción de no relación, o a la de igualdad, podemos decir que aquella relación es significativa, es fiable, que existen pocas posibilidades de que no sea así.

En el fondo los estadísticos somos un poco como el Tribunal constitucional. El Tribunal constitucional tiene como objetivo básico analizar las leyes y acabar dictaminando si se adaptan o no a la constitución. Al final sus sentencias son, en esencia, decir "constitucional" o "no constitucional". Y lo que dice este tribunal es la última palabra. Con la Estadística sucede un poco lo mismo. Analiza unos datos y acaba dando un veredicto: "significativo" o "no significativo". Y la comunidad científica está muy pendiente de estos veredictos, por su fundamental trascendencia. Podemos decir algo así como que la Estadística es el Tribunal de la significación de la ciencia.

viernes, 4 de febrero de 2011

274. Gráfico de regresión

Aquí puede verse el gráfico del ejemplo planteado. La recta azul es la recta de regresión. Las curvas rojas y rosas dibujan intervalos de confianza.

Ejemplo de correlación y regresión

Tenemos diez alumnos con sus notas de matemáticas y de física. Las notas son las siguientes (cada paréntesis recoge las notas de un alumno, la primera nota es la de matemáticas y la segunda es la de física):

(7, 8), (2, 4), (8, 8), (6, 7), (5, 6), (8, 9), (9, 9), (1, 3), (2, 3), (3, 4)

La correlación de Pearson es 0,98 y su p-valor es menor que 0,0001, lo que significa que se trata de una correlación significativa, positiva y de alta magnitud.

Vamos a hacer una regresión lineal a través del modelo y=ax+b+e, donde la y es la nota de física y la x la nota de matemáticas. Esto nos puede interesar, por ejemplo, si somos profesores de física y queremos algún día pronosticar las notas que tendrán de física nuestros alumnos sabiendo las notas que han obtenido previamente de matemáticas.

Si aplicamos a estos datos la técnica de los mínimos cuadrados vemos que los parámetros de la recta son: a=0,8179 y b=1,9284. La DE de la e es 0,4.

Esto significa que podemos escribir el modelo:

Nota de física=0,8179*Nota de matemáticas+1,9284+e

donde la e sigue una distribución N(0, 0.4).