Análisis de Regresión Lineal: Relación entre el Consumo de Tabaco y el Promedio de Notas
Clasificado en Matemáticas
Escrito el en español con un tamaño de 3,31 KB
En primera instancia, abrimos el programa SPSS y damos clic en la vista de variables para posteriormente insertar las variables correctamente. Previamente, las identificamos y colocamos en "Nombre" la denominación que queramos darle a las variables dependientes e independientes. En "Tipo" colocamos "Numérico", en "Amplitud" dejamos por defecto 8, en "Decimales" por lo general dejaremos 0. En "Etiqueta" se coloca el nombre de las variables, en este caso, "Edad", "Cantidad de Tabacos" y "Promedio de Notas" respectivamente. En "Valores" por defecto se deja "Ninguno", en "Ausencia" dejamos "Ninguno" como el anterior, en "Columna" 8 por defecto, en "Alinear" ponemos "Derecha", en "Medida" dejamos en "Escala" y "Rol" "Entrada" por defecto. De ahí, hacemos clic en la vista de datos y comenzamos a ingresar correctamente en cada columna.
Con los datos que tenemos, se realiza primero un gráfico de dispersión, haciendo clic en "Gráficos", luego "Generador de gráficos" y necesitamos orientar nuestra variable independiente "Cantidad de Tabacos" en el eje X y "Promedio de Notas" en el eje Y para luego aceptar.
Estadísticos Descriptivos
A continuación, nos vamos a "Analizar", "Estadísticos descriptivos" y "Explorar". Como necesitamos hacer un estudio de las dos variables, las colocamos en la lista de dependientes y hacemos clic en "Gráficos" y en "Gráficos con prueba de normalidad" debido a que necesitamos dicha tabla para la significancia.
Aquí podemos observar que nuestros datos son menores a 50 y tomamos en consideración la prueba de Shapiro-Wilk, en la cual tenemos un nivel de significancia mayor a 0.01, lo que nos ayuda a concluir que el p-valor o "Sig" hace que aceptemos la hipótesis nula (H0), la cual establece que los datos de las variables siguen una distribución normal y procederemos a usar los estadísticos paramétricos.
Luego vamos a "Analizar", "Regresión" y "Regresión lineal". Volvemos a colocar nuestras variables donde corresponde y se nos mostrará nuestro resumen del modelo.
En esta tabla, el R² expresará la proporción de varianza de la variable dependiente que está explicada por la variable independiente, es decir, será el coeficiente de determinación. En nuestro ejercicio, indica que el 27.8% del promedio de nota está explicado por la cantidad de tabacos "X".
El R o coeficiente de Pearson nos da 0.522, lo que concluimos en que existe una correlación significativa entre las variables.
El R cuadrado corregido de nuestro caso es de 25.2%, es bajo con relación al R debido a que como hay pocos casos y una sola variable.
También encontramos la tabla ANOVA. El valor de significancia p=0.003 < 0.05, rechazamos la hipótesis nula y aceptamos la hipótesis del investigador, por lo que concluimos que las variables están linealmente relacionadas.
La siguiente tabla a analizar es la de "Coeficientes". La constante es de a=10.612 y es el punto de intercepto en Y, y el coeficiente de la cantidad de tabacos X es de b=-0.073, cuya relación es inversa e indica el cambio medio que corresponde a la variable dependiente (promedio de notas) por cada unidad de cambio de la variable independiente (cantidad de tabacos X).
Y nuestra ecuación de regresión queda:
Pronóstico de promedio de notas = 10.612 - 0.073 (cantidad de tabacos X)