Actividad Unidad 1

 

Autores:

Jakeline Gonzalez Garcia

Deisy Cepeda Vargas

Samuel Orozco Restrepo


DATOS Y CIFRAS EN LA TOMA DE DECISIONES

Definición y uso de Análisis Descriptivo

La estadística descriptiva y la visualización de datos juegan un papel esencial en el análisis de información, ya que están concebidas para convertir grandes cantidades de datos en conocimiento claro, relevante y fácil de interpretar.

De esta forma, deja de tratarse de una simple colección de datos para convertirse en una herramienta valiosa, capaz de proporcionar información relevante tanto a empresas como a instituciones de diverso carácter. Así, la Estadística Descriptiva se vuelve un elemento clave en la toma de decisiones más informadas, eficientes y acertadas.

En definitiva, la Estadística Descriptiva proporciona orden, estructura y significado a los datos en bruto. A partir de métodos como tablas, gráficas o resúmenes numéricos, descubre hechos relevantes, revela patrones y proporciona una visión más clara de la información. Esto proporciona una base sólida para convertir los datos en conocimiento valioso, ayudando tanto a empresas como a comunidades en la toma de decisiones más eficientes e informadas. Por eso tiene una aplicación tan amplia en múltiples sectores, al resumir, analizar e interpretar información de forma clara y relevante.

En el sector de la salud, la Estadística Descriptiva resulta particularmente útil para resumir, analizar e interpretar datos de personas, diagnósticos, tratamientos o indicadores de salud, enfermedad o mortalidad en una población. Esto proporciona una base objetiva para la toma de decisiones, ayudando tanto a los profesionales de la salud, como las diferentes entidades, en la gestión de recursos, prevención de enfermedades, evaluación de la calidad de la atención y seguimiento de políticas de salud.



Conceptos básicos en el Análisis Descriptivo

En este procedimiento están involucrados conceptos clave como población, muestra, tamaño de muestra y muestreo, que resultan fundamentales para llevar a cabo un análisis correcto y representativo de la realidad.

Población: Es el conjunto total de elementos o sujetos que comparten una o varias características en común. Por ejemplo, en un hospital, la población podría estar conformada por todos los pacientes atendidos en el último año. Existen varias maneras de clasificar a la población según diferentes parámetros. Algunos de los tipos más comunes son:


Clasificación

Características

Ejemplo

Según cantidad de elementos

Finitas: número limitado. Infinitas: sin límite o muy grande.

Finitas: trabajadores de una empresa. Infinitas: bacterias en una muestra de laboratorio.

Según procedimiento de selección

Reales: están presentes o podemos contarlos. Hipotéticas: están planteadas, pero aún no ocurren o están en hipótesis.

Reales: pacientes en un hospital. Hipotéticas: futuros compradores de un nuevo producto.

Según el Tiempo

Estáticas: sin cambios en el período de análisis. Dinámica: están en constante cambio.

Estática: edificios en una ciudad en 2020. Dinámica: población de una ciudad (por nacimientos o muertes).


Muestra: Consiste en una parte o subconjunto de la población, elegido de forma representativa. Esto se hace cuando estudiar a toda la población es complejo o costoso. Por ejemplo, de los 10.000 pacientes en total, podemos estudiar una muestra de 500 para llevar a cabo el análisis.

Unidad de análisis: Es cada elemento de la población o muestra que proporciona información. Por ejemplo, en el hospital, cada paciente es una unidad de análisis.

Variable: Se denomina así a toda característica o atributo de la unidad de análisis que puede medirse o clasificarse. Por ejemplo, en el hospital podemos considerar como variables la edad, el género, el diagnóstico médico, o el número de hospitalizaciones.

Valor: Es el resultado de la medición o categorizado de una variable en una unidad de análisis.

Ejemplo: La altura de un paciente (1,72 m) o el diagnóstico médico ("diabetes").

Registro: Es la información recogida de cada elemento o sujeto de un estudio. Por ejemplo, en el sector salud, el registro de cada paciente puede incluir datos como la edad, el género, el diagnóstico o el tratamiento.

Datos en el Análisis Descriptivo

En el análisis descriptivo, los datos juegan el papel más importante, ya que son la fuente de información que se va a resumir, organizar y expresar de forma clara para destacar las características más relevantes de la población o muestra en estudio.

Dato: Corresponde al conjunto de valores recogidos para una variable en la muestra o población.

Ejemplo: La colección de presiones arteriales de todos los pacientes hospitalizados en el último mes.



Identificar el tipo de datos es crucial para saber cómo procesarlos, analizarlos y visualizarlos correctamente. Los datos se clasifican principalmente en dos grandes categorías:

1.        Datos Cualitativos o Categóricos:

Expresan cualidades o características, sin tener un valor numérico en sí.
Ejemplo en salud: el tipo de sangre, el género, el síntoma principal, o el grupo de riesgo de determinados pacientes.

2. Datos Cuantitativos o Numéricos:
Expresan cantidades o magnitudes, y están sujetos a operaciones matemáticas.
Se dividen en:

  • Discretos: Toman únicamente valores enteros.
    Ejemplo: número de pacientes en una sala, o número de hospitalizaciones en un mes.
  • Continuos: Pueden tener cualesquiera valores en un rango.
    Ejemplo: presión arterial, temperatura corporal, o concentraciones de glucosa en la sangre.

Proceso de manejo de datos

Recolección de datos

Identificación del tipo de datos

Limpieza y validación

Clasificación o categorización

Cálculo de frecuencias

Análisis e interpretación

Visualización

Análisis e interpretación descriptiva

 

  • Recolección: Obtención de datos desde fuentes como encuestas, formularios, sistemas de salud o bases de datos. Ejemplo: Encuesta aplicada a 100 pacientes con preguntas sobre edad, sexo y diagnóstico médico.
  • Identificación del tipo de datos: Se clasifican los datos para definir el tipo de análisis que se puede aplicar:

Cualitativos nominales: sexo (masculino/femenino)

Cualitativos ordinales: nivel de dolor (leve, moderado, severo)

Cuantitativos discretos: número de hijos

Cuantitativos continuos: edad, peso

  • Limpieza: Corrección de errores, eliminación de duplicados y datos incompletos
  • Clasificación: Proceso de ordenar o categorizar los datos en grupos o clases, según características o rango de valores. Esto permite resumir y analizar más eficientemente la información.
  • Frecuencia y resumen estadístico: Cálculo de frecuencias, porcentajes, promedios y medidas de dispersión.
  • Visualización: Representación con gráficos y tablas.
  • Interpretación descriptiva: Análisis de los patrones, valores más frecuentes y variaciones.




Mediciones que se pueden realizar con los datos

En el análisis descriptivo, existen diversas mediciones que permiten resumir, describir y comprender el comportamiento de una o varias variables dentro de un conjunto de datos. Estas herramientas estadísticas son fundamentales para transformar la información cruda en conocimiento útil. A continuación, se relacionan las Mediciones en Análisis Descriptivo Agrupadas por Tipo:

  • Medidas de Frecuencia

Estas indican cuántas veces ocurren los valores dentro de un conjunto de datos.

Medición

¿Qué indica?

Ejemplo

Frecuencia absoluta

Número de veces que aparece un valor o categoría

40 pacientes con hipertensión

Frecuencia relativa (%)

Porcentaje que representa esa categoría frente al total

40% de los pacientes tienen hipertensión

Frecuencia acumulada

Suma acumulada de frecuencias hasta un determinado punto

Hasta los 40 años: 65 pacientes

  • Medidas de Tendencia Central

Sirven para identificar el centro o valor típico de los datos.

Medición

¿Qué indica?

Ejemplo

Media

Promedio de todos los valores

Edad promedio = 42 años

Mediana

Valor que está justo en el centro

Edad central (ordenada) = 45 años

Moda

Valor que más se repite

Diagnóstico más común: Diabetes

  •  Medidas de Dispersión

Muestran qué tan alejados están los datos del valor central.

Medición

¿Qué indica?

Ejemplo

Rango

Diferencia entre el valor más alto y más bajo

Peso: 95 kg – 50 kg = 45 kg

Varianza

Variabilidad respecto a la media

Varianza = 36 kg²

Desviación estándar

Raíz cuadrada de la varianza (dispersión directa)

±6 kg respecto al peso promedio

Coeficiente de variación

Dispersión relativa expresada como porcentaje

15% de variación respecto a la media

 

  •  Medidas de Posición Relativa

Dividen los datos en segmentos iguales para comparaciones por grupos.

Medición

¿Qué indica?

Ejemplo

Cuartiles

Dividen los datos en 4 partes

Q1 = 25%, Q2 (mediana) = 50%, Q3 = 75%

Deciles

Dividen los datos en 10 partes

D1 = 10%, D9 = 90%

Percentiles

Dividen los datos en 100 partes

P90 = el 90% está por debajo de X valor




Visualización de datos

La visualización de datos estadísticos es una herramienta fundamental para el análisis y la comunicación de información. A través de gráficos, diagramas y representaciones visuales, es posible transformar conjuntos de datos complejos en imágenes claras, comprensibles y accesibles para todo tipo de audiencias.

Este proceso no solo facilita la identificación de patrones, tendencias y anomalías, sino que también mejora la toma de decisiones al presentar la información de manera más intuitiva y eficaz. En el contexto de la estadística descriptiva, la visualización cumple un rol clave al resumir los datos y hacerlos interpretables de forma rápida y precisa.

▪️ Gráfico de barras

Representa y compara frecuencias entre categorías.
Ejemplo: Número de casos reportados de enfermedades infecciosas por región.
Utilidad: Permite identificar qué zonas presentan mayor incidencia.

▪️ Gráfico circular (de pastel)

Muestra la proporción porcentual de cada categoría respecto al total.
Ejemplo: Distribución porcentual de pacientes según grupo etario.
Utilidad: Muestra visualmente cómo se reparte una población en categorías.

▪️ Histograma

Representa la distribución de una variable continua en intervalos.
Ejemplo: Distribución de edades de pacientes hospitalizados.
Utilidad: Facilita el análisis de la forma de la distribución (simétrica, sesgada, etc.).

▪️ Diagrama de dispersión

Muestra la relación entre dos variables cuantitativas.
Ejemplo: Asociación entre índice de masa corporal (IMC) y presión arterial.
Utilidad: Permite observar posibles correlaciones entre variables clínicas.

▪️ Diagrama de caja (boxplot)

Resume la distribución de datos indicando mediana, cuartiles y valores atípicos.
Ejemplo: Comparación de niveles de glucosa entre hombres y mujeres.
Utilidad: Identifica dispersión, simetría y posibles valores extremos.

▪️ Mapa temático o de calor (heatmap)

Representa datos en el espacio geográfico o según intensidad de color.
Ejemplo: Mapa de calor de incidencia de dengue por municipios.
Utilidad: Facilita la visualización de áreas críticas en salud pública.

▪️ Gráfico de líneas

Muestra la evolución de una variable a lo largo del tiempo.
Ejemplo: Comportamiento mensual de casos de COVID-19 en un año.
Utilidad: Ideal para observar tendencias, picos o estacionalidades.


Errores comunes al interpretar datos estadísticos

La estadística descriptiva busca clarificar la información, pero si no se interpreta correctamente, puede generar confusión o incluso decisiones equivocadas. Aquí abordamos los errores más frecuentes que se cometen al analizar o presentar datos y cómo evitarlos, conectando con lo que ya has aprendido sobre población, muestra, variables y visualización de datos.

 1. Usar la media en lugar de la mediana en datos con valores extremos

Error común:
Calcular el promedio en una muestra con valores muy desiguales y asumir que representa a todo el grupo.

Ejemplo:
Salarios en una empresa:


$1.000.000, $1.200.000, $1.300.000, $1.400.000, $12.000.000

Media: $3.380.000
Mediana: $1.300.000

Conclusión errónea: “Los empleados ganan bien”.
Interpretación correcta: La media está inflada por un valor atípico. La mediana es más representativa.

2. Gráficos con ejes manipulados

Error común:
Modificar los ejes de una gráfica para exagerar o minimizar diferencias.

Ejemplo:
Una empresa muestra que aumentó ventas “enormemente” con esta escala:

Mes

Ventas

Ene

100

Feb

105

Gráfico con eje truncado en 95:

El salto parece inmenso.

Conclusión errónea: “Hubo un gran crecimiento”.
Interpretación correcta: Solo fue un aumento del 5%.

3. Comparar porcentajes sin considerar el tamaño de la muestra

Error común:
Presentar porcentajes sin revelar cuántos casos se analizaron.

Ejemplo:
“80% de los usuarios prefieren el producto A”…
pero solo se entrevistaron 5 personas.

Conclusión errónea: “La mayoría del mercado prefiere ese producto”.
Interpretación correcta: El tamaño de muestra no es representativo (ver tema de muestreo del PDF).

4. No distinguir entre correlación y causalidad

Error común:
Asumir que si dos variables cambian juntas, una causa a la otra.

Ejemplo:
“Entre más helados se venden, más personas se ahogan”.
Ambos aumentan en verano, pero no están causalmente relacionados.

Conclusión errónea: “Los helados causan ahogamientos”.
Interpretación correcta: Hay una tercera variable (el clima) que afecta ambas.

 

5. Ignorar la dispersión o variabilidad de los datos

Error común:
Mirar solo la media sin considerar qué tan dispersos están los datos.

Ejemplo:
Dos grupos tienen media de edad de 30 años.

  • Grupo A: 29, 30, 31
  • Grupo B: 18, 30, 42

Conclusión errónea: “Los dos grupos son iguales”.
Interpretación correcta: El segundo grupo es mucho más diverso. Se debe usar la desviación estándar o el rango.

¿Cómo evitar estos errores?

Error

Solución estadística recomendada

Mal uso de la media

Usar mediana o moda si hay valores extremos

Ejes manipulados

Mantener proporciones reales (usar cero como inicio si aplica)

Muestra pequeña

Indicar siempre el tamaño de la muestra y justificar su representatividad

Confusión causal

Indicar si solo se trata de correlación, no afirmar relaciones de causa-efecto

Desconocer dispersión

Calcular y reportar medidas como el rango, varianza y desviación estándar

Conclusión

La estadística no solo se trata de calcular, sino de entender e interpretar con responsabilidad. Saber identificar estos errores te permite no solo crear análisis más sólidos, sino también desconfiar con criterio de los informes que presentan conclusiones apresuradas.

“Los números no mienten, pero pueden hacernos creer cualquier cosa si no los interpretamos bien.”



Bibliografía

Anderson, D.R., Sweeney, D.J., & Williams, T.A. (2012). Estadística para negocios y economía. México, DF, México: Cengage Learning Editores, S.A. de C.V.3.

Lind, D.A., Marchal, W.G., & Mason, R.D. (2004). Estadística para Administración y Economía. México DF, México: Alfaomega Grupo Editor, S.A. de C.V.7.

Llinás, H. (2018). Estadística descriptiva y Distribuciones de Probabilidad. Universidad del Norte.7.


Comentarios