Conceptos Clave de Estadística: Muestreo, Validez y Correlación
Clasificado en Matemáticas
Escrito el en español con un tamaño de 5,47 KB
Tipos de Muestreo
Muestreo Estratificado
Consiste en dividir la población total en clases homogéneas, denominadas estratos. Cada estrato funciona de manera independiente, y dentro de ellos se puede aplicar, por ejemplo, el muestreo aleatorio simple.
Muestreo por Conglomerados
Similar al muestreo estratificado, pero con la diferencia de que la población se divide en grupos heterogéneos.
Validez en la Investigación
Validez Interna
Grado de confianza con el que podemos atribuir a una causa específica el efecto observado. Se verá menos amenazada cuanto mayores sean los controles establecidos. Ejemplo: Test de Cooper. Se puede mejorar añadiendo un pulsómetro para mayor control.
Validez Externa
Grado de confianza con el que las relaciones inferidas o descripciones realizadas en la investigación pueden generalizarse a diferentes tipos de personas, contextos o valores de las variables no utilizadas. Ejemplo: Poner a prueba la efectividad de un determinado entrenamiento para mejorar la habilidad de los árbitros en la detección del fuera de juego.
Análisis de Correlación y Asociación
Coeficiente de Correlación de Pearson
Se utiliza para estudiar el grado de correlación entre dos variables cuantitativas. Varía de -1 a 1. Interpretación:
- -1 < r < -0.5: Correlación negativa fuerte.
- 0.5 < r < 1: Correlación positiva fuerte.
- -0.5 < r < 0.5: Correlación débil o nula.
Media Insesgada
La distribución con respecto a la media es simétrica, por lo cual no presenta sesgos (sigue una Campana de Gauss).
Relación entre Variables
Se utilizan diferentes técnicas y gráficos según el tipo de variables:
- Dos variables cualitativas: Medidas de asociación, test Chi cuadrado de independencia, gráficos de barras agrupadas.
- Dos variables cuantitativas: Coeficiente de correlación, regresión, diagrama de dispersión.
- Una variable cuantitativa y una cualitativa: Diagrama de caja por grupos, comparación de medias y desviaciones típicas.
Ejemplos de técnicas y gráficos:
- Técnica: Coeficiente de correlación. Gráfico: Dispersión.
- Técnica: Test Chi-cuadrado (dos variables cualitativas). Gráfico: Barras agrupadas.
- Técnica: Comparación de medias y desviaciones. Gráfico: Caja por grupos.
Otros Conceptos Estadísticos
- Tipificar: El número más alto indica un mejor resultado.
- Prueba T: Se utiliza para muestras con N < 30.
- Función de densidad: Se representa gráficamente con la Campana de Gauss.
- Mediana: El valor por encima del cual se encuentra el 50% de los datos.
- Asimetría: Si (Media - Moda) > 0 y la desviación es positiva, la distribución se sesga hacia la derecha.
- Pearson (Covarianza): Sxy. Ejemplo: 0.85 indica una correlación positiva fuerte, cercana a 1.
- Cuartiles: Ejemplo: Por debajo de 31 cm se encuentra el 25% de las peores marcas.
- Fiabilidad: Se considera fiable si N > 30 y las frecuencias esperadas son ≥ 5.
- Error de tipo 1: Error que se comete al rechazar la hipótesis nula (H0) siendo esta verdadera.
- Error de tipo 2: Error que se comete al aceptar la hipótesis nula (H0) siendo falsa.
- Nivel de significación: Probabilidad de cometer error de tipo 1. Se representa con el valor α (alfa).
- P (Z < 0.33): Se busca en los bordes de la tabla de la distribución normal.
- R2 (Recta de regresión): Ejemplo: Recta 1 = -2.9x + 79.9. El signo de la pendiente coincide con el signo de la correlación.
- Cálculo de percentiles: Ejemplo: ¿Qué peso hay que tener para estar entre el 20% de los menos pesados? Se busca el valor 0.80 dentro de la tabla de la distribución normal y se cambia el signo. Ejemplo: -0.845 = (x - Media) / S.
- Números Aleatorios: Ejemplo: (0.1425 * 30 (Partidos totales)) = 4.275 → 4 + 1 = 5.
- Frecuencia Relativa Acumulada:
- El 65% de las personas responden 0 respuestas afirmativas.
- Entre el 65% y el 83% responden 1 respuesta afirmativa.
- Coeficiente de Contingencia (Ejercicio):
- ¿Para representar los datos es apropiado hacer un gráfico de rectángulos agrupados? Sí, es correcto porque son dos variables cualitativas.
- ¿Para medir la dependencia entre las dos preguntas, además del coeficiente C de contingencia, es apropiado calcular su coeficiente de correlación? No, porque son dos variables cualitativas. Si fuesen dos variables cuantitativas, sí se calcularía el coeficiente de correlación.
- Si el p-valor del contraste de chi-cuadrado de independencia es mayor que 0.05, ¿hay dependencia entre las dos preguntas? Falso. Cuando el p-valor > 0.05, NO hay dependencia.