Atentos a los intervalos de confianza

Un intervalo de confianza es la zona en la que me fío de lo que estimo. Cuanto más amplia es esa zona menos me fío de lo que estimo y cuanto más estrecha más me fío de lo que estimo. Lo que pasa es que un intervalo de confianza por definición empieza con la famosa expresión “dada una población de media nu y desviación típica sigma…

¡¡¡FU FU FU FU FU FU!!!

Cuando una definición empieza así levantad las orejas como el can que tenéis al comienzo de estas líneas, una brava infante de marina que, tras 11 años cuidando de mi y de mi familia está pasando horas bajas. Y debéis estar atentos porque estáis trabajando con una media y cuando los datos se parezcan más a la media más me fío de lo que estimo. Sin embargo no por estar más cerca de la media mi estimación tiene que ser mejor. Hacemos unos datos aleatorios con SAS:

data uno;
do x = 1 to 100;
tam = int(110 - rangam(3,x))/30;
do j = 1 to tam;
y = ranuni(8);
dist = sqrt((y-x/100)**2);
if dist

Tenemos una nube de puntos a la que deseamos ajustar un modelo de regresión lineal y obtener un intervalo de confianza:

proc reg data=uno;
model y = x/spec;
plot y*x/conf;
run;quit;

Podemos observar que el intervalo se estrecha en la zona central de nuestra recta de regresión, es decir, es más estrecho en el punto (media_y,media_x) por donde pasan todas las rectas de regresión, sin embargo casi todos los puntos están fuera de ese intervalo en esa zona y a la izquierda, donde el intervalo es ligeramente más ancho, casi todos los puntos caen dentro. No es un modelo que presenta homocedasticidad algo que comprobamos con la opción spec. Es evidente que los datos tienen poco de aleatorios, están forzados para que salga lo que tiene que salir, pero se trata de alertaros sobre medias y desviaciones típicas. Y pediros, también, que veáis gráficos de residuos cuando modelicéis:

 
proc reg data=uno;
model y = x;
plot y*x/conf;
plot residual.*x;
run;quit;

A la vista de este gráfico podríamos apreciar heterocedasticidad, pero no es muy clara, pero si que es evidente que mi modelo funciona mucho mejor para valores pequeños de X, donde los intervalos de confianza eran más anchos, donde menos me fío de lo que estimo. Saludos.

4 comentarios en “Atentos a los intervalos de confianza

  1. En realidad un intervalo de confianza al 95% por ejemplo, significa que de 100 muestras que tome de esa población y en cada una calcule el intervalo de confianza, el valor “real” estará dentro de 95 de los intervalos calculados (aproximadamente). Otro cosa son los intervalos de credibilidad, pero eso ya es meterse en estadística bayesiana

  2. Buenos días Raul.

    Me ha surgido un problemilla con sas y quería pedirte consulta. Como puedo exportar una tabla sas a un directorio particular comprimida en zip directamente. Me estoy machacando y no encuentro mucha documentación.

    Un cordial saludo.

    AAA

  3. Hola Angel. Tienes que usar un winzip o un winrar, imagino que trabajas en windows. Emplear el comando x de SAS (si no usas E.Guide) luego pones x “c:\…\winzip.exe -u -d” No recuerdo exactamente los parámetros del winzip. Hace mucho tiempo lo hice con el 7zip. Recuerdo que tenía problemas con las unidades de red.

  4. hola, muy buena explicacion pero no tengo la capacidad o no etiendo como conseguir los datos, me preguntaba si tu no tendras una base de datos que presente Heterocedasticidad que me puedas pasar, esque tengo que buscar un ejercicio y desarrollarlo en minitab pero no encuentro una base de datos apropiada saludos y gracias
    mi correo: poveda001@gmail.com

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

[bws_google_captcha]