Actividad Unidad 1
Autores:
Jakeline Gonzalez Garcia
Deisy Cepeda Vargas
Samuel Orozco Restrepo
DATOS Y CIFRAS EN
LA TOMA DE DECISIONES
Definición y uso de Análisis Descriptivo
La estadística descriptiva y la
visualización de datos juegan un papel esencial en el análisis de información,
ya que están concebidas para convertir grandes cantidades de datos en
conocimiento claro, relevante y fácil de interpretar.
De esta forma, deja de tratarse
de una simple colección de datos para convertirse en una herramienta valiosa,
capaz de proporcionar información relevante tanto a empresas como a
instituciones de diverso carácter. Así, la Estadística Descriptiva se vuelve un
elemento clave en la toma de decisiones más informadas, eficientes y acertadas.
En definitiva, la Estadística
Descriptiva proporciona orden, estructura y significado a los datos en bruto. A
partir de métodos como tablas, gráficas o resúmenes numéricos, descubre hechos
relevantes, revela patrones y proporciona una visión más clara de la
información. Esto proporciona una base sólida para convertir los datos en
conocimiento valioso, ayudando tanto a empresas como a comunidades en la toma
de decisiones más eficientes e informadas. Por eso tiene una aplicación tan
amplia en múltiples sectores, al resumir, analizar e interpretar información de
forma clara y relevante.
En el sector de la salud, la
Estadística Descriptiva resulta particularmente útil para resumir, analizar e
interpretar datos de personas, diagnósticos, tratamientos o indicadores de
salud, enfermedad o mortalidad en una población. Esto proporciona una base
objetiva para la toma de decisiones, ayudando tanto a los profesionales de la
salud, como las diferentes entidades, en la gestión de recursos, prevención de
enfermedades, evaluación de la calidad de la atención y seguimiento de
políticas de salud.
En este procedimiento están
involucrados conceptos clave como población, muestra, tamaño de
muestra y muestreo, que resultan fundamentales para llevar
a cabo un análisis correcto y representativo de la realidad.
Población: Es el
conjunto total de elementos o sujetos que comparten una o varias
características en común. Por ejemplo, en un hospital, la población podría
estar conformada por todos los pacientes atendidos en el último año.
Existen varias maneras de clasificar a la población según diferentes
parámetros. Algunos de los tipos más comunes son:
Clasificación |
Características |
Ejemplo |
Según cantidad de elementos |
Finitas: número limitado. Infinitas: sin
límite o muy grande. |
Finitas: trabajadores de una empresa. Infinitas: bacterias
en una muestra de laboratorio. |
Según procedimiento de selección |
Reales: están presentes o podemos contarlos.
Hipotéticas: están planteadas, pero aún no ocurren o están en
hipótesis. |
Reales: pacientes en un hospital. Hipotéticas: futuros
compradores de un nuevo producto. |
Según el Tiempo |
Estáticas: sin cambios en el período de
análisis. Dinámica: están en constante cambio. |
Estática: edificios en una ciudad en
2020. Dinámica: población de una ciudad (por nacimientos o
muertes). |
Muestra: Consiste en
una parte o subconjunto de la población, elegido de forma representativa. Esto
se hace cuando estudiar a toda la población es complejo o costoso. Por ejemplo,
de los 10.000 pacientes en total, podemos estudiar una muestra de
500 para llevar a cabo el análisis.
Unidad de análisis: Es
cada elemento de la población o muestra que proporciona información. Por
ejemplo, en el hospital, cada paciente es una unidad de análisis.
Variable: Se denomina
así a toda característica o atributo de la unidad de análisis que puede medirse
o clasificarse. Por ejemplo, en el hospital podemos considerar como variables
la edad, el género, el diagnóstico médico, o el número de hospitalizaciones.
Valor: Es el
resultado de la medición o categorizado de una variable en una unidad de
análisis.
Ejemplo: La altura de un paciente (1,72 m) o el
diagnóstico médico ("diabetes").
Registro: Es la
información recogida de cada elemento o sujeto de un estudio. Por ejemplo,
en el sector salud, el registro de cada paciente puede incluir datos como la
edad, el género, el diagnóstico o el tratamiento.
Datos en el Análisis Descriptivo
En el análisis descriptivo,
los datos juegan el papel más importante, ya que son la fuente de información
que se va a resumir, organizar y expresar de forma clara para destacar las
características más relevantes de la población o muestra en estudio.
Dato: Corresponde al
conjunto de valores recogidos para una variable en la muestra o población.
Ejemplo: La colección de
presiones arteriales de todos los pacientes hospitalizados en el último mes.
Identificar el tipo de datos es crucial para saber cómo procesarlos, analizarlos y visualizarlos correctamente. Los datos se clasifican principalmente en dos grandes categorías:
1.
Datos Cualitativos o Categóricos:
Expresan cualidades o
características, sin tener un valor numérico en sí.
Ejemplo en salud: el tipo de sangre, el género, el síntoma
principal, o el grupo de riesgo de determinados pacientes.
2. Datos Cuantitativos o Numéricos:
Expresan cantidades o magnitudes, y están sujetos a operaciones
matemáticas.
Se dividen en:
- Discretos: Toman únicamente
valores enteros.
Ejemplo: número de pacientes en una sala, o número de hospitalizaciones en un mes. - Continuos: Pueden
tener cualesquiera valores en un rango.
Ejemplo: presión arterial, temperatura corporal, o concentraciones de glucosa en la sangre.
Proceso
de manejo de datos
Recolección
de datos
↓
Identificación
del tipo de datos
↓
Limpieza
y validación
↓
Clasificación
o categorización
↓
Cálculo
de frecuencias
↓
Análisis
e interpretación
↓
Visualización
↓
Análisis
e interpretación descriptiva
- Recolección: Obtención de datos
desde fuentes como encuestas, formularios, sistemas de salud o bases
de datos. Ejemplo: Encuesta aplicada a 100 pacientes con
preguntas sobre edad, sexo y diagnóstico médico.
- Identificación del tipo de datos: Se
clasifican los datos para definir el tipo de análisis que se puede
aplicar:
Cualitativos nominales: sexo
(masculino/femenino)
Cualitativos
ordinales: nivel de dolor (leve, moderado, severo)
Cuantitativos
discretos: número de hijos
Cuantitativos
continuos: edad, peso
- Limpieza: Corrección de errores,
eliminación de duplicados y datos incompletos
- Clasificación: Proceso de ordenar o
categorizar los datos en grupos o clases, según características o rango de
valores. Esto permite resumir y analizar más eficientemente la
información.
- Frecuencia y resumen estadístico: Cálculo
de frecuencias, porcentajes, promedios y medidas de dispersión.
- Visualización: Representación con
gráficos y tablas.
- Interpretación descriptiva: Análisis de
los patrones, valores más frecuentes y variaciones.
Mediciones que se pueden realizar con los datos
En el análisis descriptivo, existen diversas mediciones que
permiten resumir, describir y comprender el comportamiento de una o
varias variables dentro de un conjunto de datos. Estas herramientas
estadísticas son fundamentales para transformar la información cruda en
conocimiento útil. A continuación, se relacionan las Mediciones en
Análisis Descriptivo Agrupadas por Tipo:
- Medidas
de Frecuencia
Estas indican cuántas veces ocurren los
valores dentro de un conjunto de datos.
Medición |
¿Qué indica? |
Ejemplo |
Frecuencia absoluta |
Número de veces que aparece un valor o categoría |
40 pacientes con hipertensión |
Frecuencia relativa (%) |
Porcentaje que representa esa categoría frente al total |
40% de los pacientes tienen hipertensión |
Frecuencia acumulada |
Suma acumulada de frecuencias hasta un determinado punto |
Hasta los 40 años: 65 pacientes |
- Medidas
de Tendencia Central
Sirven para identificar el centro o valor típico de
los datos.
Medición |
¿Qué indica? |
Ejemplo |
Media |
Promedio de todos los valores |
Edad promedio = 42 años |
Mediana |
Valor que está justo en el centro |
Edad central (ordenada) = 45 años |
Moda |
Valor que más se repite |
Diagnóstico más común: Diabetes |
- Medidas
de Dispersión
Muestran qué tan alejados están los datos
del valor central.
Medición |
¿Qué indica? |
Ejemplo |
Rango |
Diferencia entre el valor más alto y más bajo |
Peso: 95 kg – 50 kg = 45 kg |
Varianza |
Variabilidad respecto a la media |
Varianza = 36 kg² |
Desviación estándar |
Raíz cuadrada de la varianza (dispersión directa) |
±6 kg respecto al peso promedio |
Coeficiente de variación |
Dispersión relativa expresada como porcentaje |
15% de variación respecto a la media |
- Medidas
de Posición Relativa
Dividen los datos en segmentos iguales para
comparaciones por grupos.
Medición |
¿Qué indica? |
Ejemplo |
Cuartiles |
Dividen los datos en 4 partes |
Q1 = 25%, Q2 (mediana) = 50%, Q3 = 75% |
Deciles |
Dividen los datos en 10 partes |
D1 = 10%, D9 = 90% |
Percentiles |
Dividen los datos en 100 partes |
P90 = el 90% está por debajo de X valor |
Visualización de datos
La visualización de datos estadísticos es una herramienta
fundamental para el análisis y la comunicación de información. A través de
gráficos, diagramas y representaciones visuales, es posible transformar
conjuntos de datos complejos en imágenes claras, comprensibles y accesibles
para todo tipo de audiencias.
Este proceso no solo facilita la identificación de patrones,
tendencias y anomalías, sino que también mejora la toma de decisiones al
presentar la información de manera más intuitiva y eficaz. En el contexto de la
estadística descriptiva, la visualización cumple un rol clave al resumir los
datos y hacerlos interpretables de forma rápida y precisa.
▪️ Gráfico de barras
Representa y compara frecuencias entre categorías.
Ejemplo: Número de casos reportados de enfermedades infecciosas por
región.
Utilidad: Permite identificar qué zonas presentan mayor incidencia.
▪️ Gráfico circular (de pastel)
Muestra la proporción porcentual de cada categoría respecto
al total.
Ejemplo: Distribución porcentual de pacientes según grupo etario.
Utilidad: Muestra visualmente cómo se reparte una población en
categorías.
▪️ Histograma
Representa la distribución de una variable continua en
intervalos.
Ejemplo: Distribución de edades de pacientes hospitalizados.
Utilidad: Facilita el análisis de la forma de la distribución
(simétrica, sesgada, etc.).
▪️ Diagrama de dispersión
Muestra la relación entre dos variables cuantitativas.
Ejemplo: Asociación entre índice de masa corporal (IMC) y presión
arterial.
Utilidad: Permite observar posibles correlaciones entre variables
clínicas.
▪️ Diagrama de caja (boxplot)
Resume la distribución de datos indicando mediana, cuartiles
y valores atípicos.
Ejemplo: Comparación de niveles de glucosa entre hombres y mujeres.
Utilidad: Identifica dispersión, simetría y posibles valores
extremos.
▪️ Mapa temático o de calor (heatmap)
Representa datos en el espacio geográfico o según intensidad
de color.
Ejemplo: Mapa de calor de incidencia de dengue por municipios.
Utilidad: Facilita la visualización de áreas críticas en salud
pública.
▪️ Gráfico de líneas
Muestra la evolución de una variable a lo largo del tiempo.
Ejemplo: Comportamiento mensual de casos de COVID-19 en un año.
Utilidad: Ideal para observar tendencias, picos o estacionalidades.
Errores comunes al interpretar datos estadísticos
La estadística descriptiva busca
clarificar la información, pero si no se interpreta correctamente, puede
generar confusión o incluso decisiones equivocadas. Aquí abordamos los
errores más frecuentes que se cometen al analizar o presentar datos y cómo
evitarlos, conectando con lo que ya has aprendido sobre población, muestra,
variables y visualización de datos.
1. Usar la media en lugar de la mediana en
datos con valores extremos
Error común:
Calcular el promedio en una muestra con valores muy desiguales y asumir que
representa a todo el grupo.
Ejemplo:
Salarios en una empresa:
$1.000.000, $1.200.000, $1.300.000, $1.400.000, $12.000.000
Media: $3.380.000
Mediana: $1.300.000
Conclusión errónea: “Los empleados ganan bien”.
Interpretación correcta: La media está inflada por un valor atípico. La mediana
es más representativa.
2. Gráficos con ejes
manipulados
Error común:
Modificar los ejes de una gráfica para exagerar o minimizar diferencias.
Ejemplo:
Una empresa muestra que aumentó ventas “enormemente” con esta escala:
Mes |
Ventas |
Ene |
100 |
Feb |
105 |
Gráfico con eje truncado en 95:
El salto parece inmenso.
Conclusión errónea: “Hubo un gran crecimiento”.
Interpretación correcta: Solo fue un aumento del 5%.
3. Comparar porcentajes sin
considerar el tamaño de la muestra
Error común:
Presentar porcentajes sin revelar cuántos casos se analizaron.
Ejemplo:
“80% de los usuarios prefieren el producto A”…
pero solo se entrevistaron 5 personas.
Conclusión errónea: “La mayoría del mercado prefiere ese
producto”.
Interpretación correcta: El tamaño de muestra no es representativo (ver tema de
muestreo del PDF).
4. No distinguir entre
correlación y causalidad
Error común:
Asumir que si dos variables cambian juntas, una causa a la otra.
Ejemplo:
“Entre más helados se venden, más personas se ahogan”.
Ambos aumentan en verano, pero no están causalmente relacionados.
Conclusión errónea: “Los helados causan ahogamientos”.
Interpretación correcta: Hay una tercera variable (el clima) que afecta ambas.
5. Ignorar la dispersión o
variabilidad de los datos
Error común:
Mirar solo la media sin considerar qué tan dispersos están los datos.
Ejemplo:
Dos grupos tienen media de edad de 30 años.
- Grupo A: 29, 30, 31
- Grupo B: 18, 30, 42
Conclusión errónea: “Los dos grupos son iguales”.
Interpretación correcta: El segundo grupo es mucho más diverso. Se debe usar la
desviación estándar o el rango.
¿Cómo evitar estos errores?
Error |
Solución estadística
recomendada |
Mal uso de la media |
Usar mediana o moda si hay
valores extremos |
Ejes manipulados |
Mantener proporciones reales
(usar cero como inicio si aplica) |
Muestra pequeña |
Indicar siempre el tamaño de la
muestra y justificar su representatividad |
Confusión causal |
Indicar si solo se trata de
correlación, no afirmar relaciones de causa-efecto |
Desconocer dispersión |
Calcular y reportar medidas
como el rango, varianza y desviación estándar |
Conclusión
La estadística no solo se trata
de calcular, sino de entender e interpretar con responsabilidad. Saber
identificar estos errores te permite no solo crear análisis más sólidos, sino
también desconfiar con criterio de los informes que presentan
conclusiones apresuradas.
“Los números no mienten, pero
pueden hacernos creer cualquier cosa si no los interpretamos bien.”
Bibliografía
Anderson, D.R., Sweeney, D.J., & Williams, T.A.
(2012). Estadística para negocios y economía. México, DF, México:
Cengage Learning Editores, S.A. de C.V.3.
Lind, D.A., Marchal, W.G., & Mason, R.D. (2004). Estadística
para Administración y Economía. México DF, México: Alfaomega Grupo Editor,
S.A. de C.V.7.
Llinás, H. (2018). Estadística descriptiva y
Distribuciones de Probabilidad. Universidad del Norte.7.
Comentarios
Publicar un comentario