Visualización de Datos: Tipos de Gráficos Estadísticos y Conceptos Fundamentales

Clasificado en Matemáticas

Escrito el en español con un tamaño de 6,59 KB

Gráficos Estadísticos

Un gráfico es la representación de información estadística con el fin de obtener una impresión visual global del material presentado que facilite su rápida comprensión. Los gráficos son una alternativa a las tablas para representar las distribuciones de frecuencias. Algunos requisitos recomendables al construir un gráfico son: sencillez, evitar distorsiones por escalas exageradas y la elección adecuada del tipo de gráfico, según los objetivos y el nivel de medición de las variables.

Tipos Principales de Gráficos

  • Gráfico de Barras: Se usa para representar la distribución de frecuencias de variables discretas. Cada categoría se representa por una barra cuyo largo indica la frecuencia de observaciones en dicha categoría.
  • Gráfico de Barras Divididas: Se utiliza para estudiar la distribución de frecuencias de una variable discreta (con pocas categorías) dentro de diferentes niveles de otra variable discreta.
  • Gráfico de Sectores (o Circular): Es una alternativa equivalente a los gráficos de barras divididas. Este tipo de gráfico muestra la partición de un total en sus partes componentes. Para su construcción, se considera que al círculo (360°) le corresponde el 100% de los casos. En consecuencia, conviene: expresar cada cantidad parcial en su frecuencia relativa o porcentual, convertir esta frecuencia a grados, y dibujar los ángulos correspondientes.
  • Pictogramas: Son una forma de representar la información mediante dibujos de los objetos que son motivo de estudio, con un formato tal que dé una idea rápida y visual de la distribución de frecuencia. Son útiles para fines publicitarios por ser atractivos y de fácil interpretación.
  • Histograma: Este gráfico es especialmente adecuado para representar frecuencias en el caso de variables de intervalo o razón continuas. Consiste en una serie de barras adyacentes cuyas superficies son proporcionales a la frecuencia del intervalo sobre el cual se levantan. Si los intervalos son de igual amplitud, los rectángulos tienen una altura proporcional a la frecuencia correspondiente.
  • Diagrama de Dispersión: Se utiliza cuando se estudia la posible asociación entre dos variables de nivel de intervalo o de razón. Es útil representar las observaciones en coordenadas cartesianas, obteniendo una nube de puntos denominada diagrama de dispersión o gráfico de correlación.

Conceptos Clave de Estadística

La Estadística se ocupa de recopilar datos, organizarlos en tablas y gráficos, y analizarlos con un determinado objetivo.

  • Frecuencia (Absoluta): Cantidad de veces que se repite un determinado valor de la variable.
  • Frecuencia Relativa: Indica qué parte del total representa cada valor de la variable. Si se multiplica por 100, se obtiene el porcentaje representado.
  • Frecuencia Acumulada: Permite conocer cuántos datos se acumulan hasta un cierto valor. Se calcula sumando a la frecuencia de ese valor la frecuencia de los valores anteriores.
  • Tamaño de Muestra (n) y Población (N): n es el tamaño de la muestra (cantidad de datos en el estudio). N es el tamaño de la población total.
  • Población: Conjunto completo de elementos con una característica común.
  • Muestra Representativa: Subconjunto de casos de la población, idealmente elegidos aleatoriamente para reflejar las características del conjunto total.

Tipos de Variables

  • Cualitativas: Describen cualidades o características (ej. color de ojos).
  • Cuantitativas Discretas: Toman valores enteros, usualmente de conteos (ej. número de hermanos).
  • Cuantitativas Continuas: Toman cualquier valor dentro de un rango, usualmente de mediciones (ej. altura, peso).

Medidas de Centralización o Posición

  • Media Aritmética: Se calcula como el promedio de todos los valores de la variable. Es sensible a valores extremos.
  • Moda: Es el valor que se repite con mayor frecuencia (el de mayor frecuencia absoluta). Puede ser unimodal (una moda), bimodal (dos modas), multimodal (varias modas) o amodal (sin moda).
  • Mediana: Es el valor que divide los datos ordenados (de menor a mayor) en dos partes iguales, dejando un 50% por debajo y un 50% por encima. No es sensible a valores extremos.
  • Rango o Amplitud: Diferencia entre el valor máximo y el valor mínimo del conjunto de datos.

Ejemplos de Interpretación Estadística

  • "Hay 4 personas que no tienen hermanos." (Interpretación de frecuencia absoluta para el valor 0).
  • "El 18% de los alumnos tienen 3 hermanos." (Interpretación de frecuencia relativa porcentual).
  • "Hay 31 alumnos que tienen a lo sumo (como máximo) 2 hermanos." (Interpretación de frecuencia acumulada hasta el valor 2).
  • "Hay X alumnos que tienen por lo menos (como mínimo) 2 hermanos." (Interpretación basada en la suma de frecuencias desde el valor 2 hasta el máximo).
  • "En promedio, entre 3 y 4 personas conviven en los hogares." (Interpretación de la media aritmética).
  • "El número de personas más frecuente que conviven en los hogares es de 3." (Interpretación de la moda).
  • "En un 50% de los hogares hay menos de 3 personas conviviendo y en el resto más de 3." (Interpretación de la mediana, asumiendo que la mediana es 3).
  • "El promedio de alejamiento de los valores con respecto a la media aritmética es de 1,75." (Interpretación de la desviación estándar o desviación media).
  • "El cuadrado de la desviación estándar es de 3,06." (Interpretación de la varianza).

Entradas relacionadas: