Estadística Descriptiva: Población, Muestra, Variables y Medidas de Tendencia Central

Clasificado en Matemáticas

Escrito el en español con un tamaño de 6,21 KB

POBLACIÓN - Conjunto de individuos, seres, objetos o elementos que son propósito de nuestro estudio.

TAMAÑO POBLACIÓN - Número de elementos en la población.

MUESTRA - Grupo reducido de la población que utilizaremos para el estudio. Los elementos deben ser elegidos de manera adecuada para que representen a toda la población.

TAMAÑO MUESTRAL - Número de elementos de la muestra.

VARIABLES - Características de la población que nos interesan para el estudio.

- NUMÉRICAS O CUANTITATIVAS -

  • DISCRETAS (números enteros)
  • CONTINUAS (cualquier intervalo, medida como 1.24)

- CATEGÓRICAS O CUALITATIVAS -

  • ORDINALES (tienen un orden: alto, bajo, mediano)
  • NOMINALES (no hay orden)

AMPLITUD INTERVALO - Diferencia entre los límites del intervalo.

xi= li-li-1/2.

MARCA DE INTERVALO - Punto medio del intervalo que representa.

xi=(li-1+li)/2.

GRÁFICO DE BARRAS - Para variables categóricas o cualitativas (ordinales y nominales). En el eje horizontal se representan las categorías de las variables (xi) y en el eje vertical las frecuencias absolutas o relativas de cada variable (fi).

GRÁFICO DE SECTORES - Para variables categóricas. Se divide la circunferencia en tantas partes como categorías tenga y se le asigna un área proporcional a la frecuencia de dicha categoría.

HISTOGRAMAS - Para variables numéricas continuas (intervalos). Similar al de barras, pero en el eje horizontal se representan los intervalos.

POLÍGONO DE FRECUENCIAS - Utilizado para datos cuantitativos. Posible con discretos u ordinales, NO con nominales. Muestra orden y sentido con fechas (ej., en esta fecha tantas personas). Cuando tengamos datos discretos, lo más usado es el histograma adosado; cuando sean continuos, suele usarse el polígono de frecuencias. En ambos casos, se utilizan las frecuencias relativas.


MEDIA ARITMÉTICA - La suma de las desviaciones de todos los valores respecto a su media es 0.

  • CAMBIO DE ORIGEN: Si a todos los valores de la variable X sumamos una constante b, la media aritmética de la variable queda aumentada también en esa constante. Le afectan los cambios de origen. Es lo mismo sumarle un valor a la X que calcular la media y al final sumarle el valor.
  • CAMBIO DE ESCALA: Si a todos los valores de la variable X los multiplicamos por una constante A, la media de la variable queda multiplicada también en esa constante. Le afectan los cambios de escala. A la media le afectan los cambios de escala y de origen.
  • MEDIA DE COMBINACIÓN LINEAL: Aplicación simultánea de cambio de origen y escala sobre la variable X.

Inconveniente: Afectada por la presencia de valores anormalmente grandes o pequeños, la media es poco representativa de la muestra.

MEDIA GEOMÉTRICA - Los valores extremos influyen menos en la determinación de G que en la media aritmética. Los valores de la media ponderada perjudican con un 0, y en esta no, porque un valor negativo no permite calcular la raíz cuadrada.

SOLO PUEDE CALCULARSE SOBRE VALORES POSITIVOS NO NULOS.

MEDIA ARMÓNICA - Utilizada para velocidades, rendimientos, tiempos. Le afectan mucho los valores pequeños, por lo que en distribuciones donde exista este tipo de valores no es aconsejable su uso. No utilizable si hay valores nulos.

MEDIANA - Variable ordenada de mayor a menor.

MODA - Si está en intervalos, medir el intervalo modal. Si todos son de la misma amplitud, el intervalo de mayor frecuencia. Y en caso de que los intervalos sean diferentes, será aquel cuyo cociente entre frecuencia y amplitud sea mayor. Cuando se trabaja con datos no susceptibles de ordenación (categóricos). Los cambios de origen afectan. Los cambios de escala también le afectan. SI TENGO 2 MODAS, CALCULAR LAS 2 POR SEPARADO CON LA FÓRMULA:

Moda= Li-1 + (fi-fi-1) / (fi-fi-1) + (fi-fi+1) X (li-li-1)


MEDIA -

  • VENTAJAS: Es solo un número. Es la más utilizada. Reúne todos los valores considerados. Es más estable. La suma de distancias de todos los valores a la media es 0.
  • INCONVENIENTES: Distorsión por valores muy extremos (10 y 0). No siempre es posible calcularla (datos cualitativos, datos agrupados en clase abierta). Si consideramos una variable discreta, el valor puede NO pertenecer al conjunto de valores de la variable.

MEDIANA -

  • VENTAJAS: No es afectada por valores extremos o elevados. Es siempre un valor de la variable que estudiamos. Es de cálculo rápido e interpretación sencilla.
  • INCONVENIENTES: Propiedades matemáticas complicadas.

MODA - Menos representativa que la media, pero en ocasiones más útil (datos cualitativos). Ignora una parte sustancial de los datos, no suele utilizarse normalmente en la investigación. Representa el valor dominante de la distribución.

MEDIDAS DE DISPERSIÓN - Sirven para medir la variabilidad que hay en los datos, para ver cuán homogénea o heterogénea es la muestra respecto a la variable de interés, y para saber hasta qué punto las medidas de posición son representativas de la muestra.

Rango o recorrido: RE=Max-Min de la muestra.

Rango intercuartílico: RI=C3-C1 / Varianza (S2) / Desviación típica=S√ / Desviación mediana / Coeficiente de apertura / Rango o recorrido semiintercuartílico / Coeficiente de variación.

Entradas relacionadas: