Métricas de Testing y KPIs

Domina las métricas esenciales de QA y KPIs: defect density, DRE, cobertura de pruebas, MTTR y más. Aprende a construir un dashboard que impulse decisiones de calidad.

Por Qué las Métricas Importan en QA

Sin métricas, la calidad es solo una opinión. Un desarrollador dice “el código está sólido,” un tester dice “encontramos muchos bugs,” y un manager pregunta “¿podemos liberar?” — y nadie tiene datos que respalden su posición.

Las métricas de testing transforman opiniones subjetivas en datos objetivos. Ayudan a responder preguntas críticas:

¿Estamos encontrando suficientes bugs antes del release?
¿Nuestro testing se está volviendo más eficiente con el tiempo?
¿Dónde deberíamos enfocar nuestro esfuerzo de testing?
¿Está el producto listo para salir?

Pero las métricas también tienen un lado oscuro. Métricas mal elegidas pueden impulsar el comportamiento equivocado. Si mides a los testers por “número de bugs encontrados,” reportarán issues triviales. Si mides por “test cases ejecutados por día,” escribirán pruebas superficiales. Elegir las métricas correctas es tan importante como medirlas.

Categorías de Métricas de Testing

graph TD A[Métricas de Testing] --> B[Métricas de Proceso] A --> C[Métricas de Producto] A --> D[Métricas de Proyecto] B --> B1[Tasa de ejecución de pruebas] B --> B2[Defect removal efficiency] B --> B3[Efectividad de test cases] C --> C1[Defect density] C --> C2[Cobertura de código] C --> C3[Distribución de severidad] D --> D1[Adherencia al cronograma] D --> D2[Costo por defecto] D --> D3[Utilización de recursos]

Métricas de Proceso

Las métricas de proceso evalúan qué tan bien funciona el proceso de testing. Ayudan a mejorar la forma en que pruebas.

Métrica	Fórmula	Objetivo	Qué Te Dice
Tasa de Ejecución de Pruebas	(Tests ejecutados / Total tests) × 100	95-100%	¿Estamos ejecutando todas las pruebas planificadas?
Defect Removal Efficiency (DRE)	(Defectos pre-release / Total defectos) × 100	>95%	¿Estamos atrapando bugs antes que los usuarios?
Efectividad de Test Cases	(Defectos encontrados / Test cases ejecutados) × 100	Varía	¿Nuestros test cases están encontrando bugs reales?
Tasa de Rechazo de Defectos	(Defectos rechazados / Total defectos reportados) × 100	<10%	¿Estamos reportando bugs válidos?

Métricas de Producto

Las métricas de producto miden la calidad del software en sí.

Métrica	Fórmula	Objetivo	Qué Te Dice
Defect Density	Defectos / Tamaño (KLOC o FP)	<5 por KLOC	¿Qué tan lleno de bugs está el código?
Distribución de Severidad	% en cada nivel de severidad	Forma de pirámide	¿Los defectos son mayormente menores o críticos?
Cobertura de Código	(Líneas testeadas / Total líneas) × 100	70-80%	¿Cuánto código ejercitan las pruebas?
Mean Time to Repair (MTTR)	Tiempo total de reparación / Número de defectos	<24 horas	¿Qué tan rápido se corrigen los bugs?

Métricas de Proyecto

Las métricas de proyecto rastrean la salud del proyecto de testing.

Métrica	Fórmula	Qué Te Dice
Variación de Cronograma	(Duración real - Duración planificada) / Duración planificada	¿Estamos en tiempo?
Uptime del Entorno de Pruebas	(Horas disponibles / Total horas) × 100	¿La infraestructura es confiable?
Antigüedad de Defectos	Tiempo que un defecto permanece abierto	¿Se están atendiendo los bugs oportunamente?
ROI de Automatización	(Tiempo manual ahorrado - Inversión en automatización) / Inversión	¿La automatización está dando resultados?

Indicadores Adelantados vs Rezagados

Entender esta distinción es crucial para la gestión proactiva de la calidad.

Indicadores rezagados te dicen lo que ya pasó:

Defectos encontrados en producción
Issues reportados por clientes
Conteo de parches post-release

Indicadores adelantados predicen resultados futuros:

Cobertura de pruebas antes de la ejecución
Defectos encontrados en la revisión de requisitos
Advertencias de análisis estático
Tendencias de complejidad de código

Los mejores dashboards de QA enfatizan indicadores adelantados porque te dan tiempo para actuar. Un indicador rezagado como “50 bugs en producción el mes pasado” es útil para una retrospectiva pero inútil para prevenir esos bugs.

Métricas Clave en Detalle

Defect Density

Defect density es el número de defectos confirmados relativo al tamaño del software.

Fórmula: Defect Density = Número de Defectos / Tamaño

El tamaño puede medirse en:

KLOC (miles de líneas de código)
Function Points
User Stories
Módulos

Ejemplo:

120 defectos encontrados en una aplicación de 40 KLOC
Defect Density = 120 / 40 = 3 defectos por KLOC

Benchmarks de la industria:

<1 por KLOC: Excelente (nivel NASA)
1-5 por KLOC: Bueno (organizaciones maduras)
5-10 por KLOC: Promedio
10 por KLOC: Necesita mejora

Defect Removal Efficiency (DRE)

DRE es posiblemente la métrica de QA más importante. Mide qué porcentaje de defectos tu proceso de testing detecta antes del release.

Fórmula: DRE = (Defectos encontrados antes del release / Total de defectos) × 100

Total de defectos = Defectos pre-release + Defectos post-release (encontrados dentro de un período definido, usualmente 90 días).

Ejemplo:

Testing encontró 200 defectos antes del release
Los usuarios reportaron 10 defectos en los primeros 90 días
DRE = 200 / (200 + 10) × 100 = 95.2%

Benchmarks:

95%: Clase mundial
85-95%: Bueno
70-85%: Promedio
<70%: El proceso de testing necesita mejora significativa

Cobertura de Pruebas

La cobertura de pruebas puede medirse en múltiples niveles:

Nivel	Qué Mide	Fórmula
Cobertura de Requisitos	Requisitos con al menos un test case	(Requisitos con tests / Total requisitos) × 100
Cobertura de Código	Líneas de código ejecutadas por tests	(Líneas ejecutadas / Total líneas) × 100
Cobertura de Ejecución	Tests planificados que realmente se ejecutaron	(Tests ejecutados / Tests planificados) × 100
Cobertura de Riesgos	Riesgos identificados con tests de mitigación	(Riesgos cubiertos / Total riesgos) × 100

Defect Escape Rate

El inverso de DRE, esta métrica se enfoca en lo que se filtró.

Fórmula: Defect Escape Rate = (Defectos post-release / Total de defectos) × 100

Un escape rate de 5% significa 95% de DRE. Rastrea esta métrica a lo largo del tiempo — un escape rate creciente señala un proceso de testing en deterioro.

Mean Time to Repair (MTTR)

MTTR mide qué tan rápido se resuelven los defectos una vez encontrados.

Fórmula: MTTR = Suma de todos los tiempos de reparación / Número de defectos reparados

Rastrea MTTR por severidad:

Critical: objetivo <4 horas
High: objetivo <24 horas
Medium: objetivo <3 días hábiles
Low: objetivo <2 semanas

Construyendo un Dashboard de Métricas

Un buen dashboard no es una colección de todas las métricas posibles. Es un conjunto curado que cuenta una historia. Sigue el enfoque GQM (Goal-Question-Metric):

Goal (Meta): ¿Qué quieres lograr? (ej., “Mejorar la calidad de releases”)
Question (Pregunta): ¿Qué necesitas saber? (ej., “¿Estamos detectando bugs suficientemente temprano?”)
Metric (Métrica): ¿Qué datos responden la pregunta? (ej., DRE, defect escape rate)

Layout Recomendado del Dashboard

Para Sprint/Iteration Reviews:

Progreso de ejecución de pruebas (planificado vs real)
Conteo de defectos abiertos por severidad
Tendencia de DRE en los últimos 5 sprints
Tendencia de cobertura de automatización

Para Decisiones de Release:

Estado de criterios de salida (cumplido/no cumplido)
Defectos abiertos critical/high
Tendencia de defectos (abiertos vs cerrados a lo largo del tiempo)
Cobertura de ejecución de pruebas

Para Reportes Ejecutivos:

Tendencia de DRE (trimestral)
Tendencia de defect density
Costo de calidad (costo de testing vs costo de defectos escapados)
Tendencia de defectos reportados por clientes

Anti-Patrones: Métricas que Resultan Contraproducentes

Mala Métrica	Por Qué es Contraproducente	Mejor Alternativa
Bugs encontrados por tester	Incentiva reportar bugs triviales	Distribución de severidad de defectos
Test cases ejecutados por día	Incentiva testing superficial	Ratio de efectividad de pruebas
Cero defectos como meta	Incentiva ocultar o no reportar bugs	DRE con objetivos realistas
Líneas de código de test	Incentiva tests verbosos e inmantenibles	Cobertura de código + mutation score

La regla cardinal: nunca uses métricas para evaluar testers individuales. Las métricas deben evaluar el proceso, no a las personas. Cuando las métricas se convierten en evaluaciones de desempeño, la gente las manipula.

Ejercicio: Diseña un Dashboard de Métricas de QA

Escenario: Eres el QA Lead en una startup fintech. Tu equipo de 5 testers libera una app de banca móvil cada 2 semanas. El CEO quiere un “dashboard de calidad” para presentar en reuniones de directorio. El CTO quiere métricas que ayuden al equipo de desarrollo a mejorar.

Parte 1: Calcula Métricas

Dados los siguientes datos de los últimos 3 sprints:

Sprint	Tests Planificados	Tests Ejecutados	Defectos (Pre-release)	Defectos (Post-release)	Defectos Críticos Abiertos	KLOC Modificados
15	200	185	45	8	2	12
16	220	210	38	5	0	15
17	250	240	52	3	1	18

Calcula para cada sprint:

Tasa de Ejecución de Pruebas
Defect Removal Efficiency
Defect Density
Defect Escape Rate

Parte 2: Diseño del Dashboard

Diseña dos vistas de dashboard:

Dashboard del CEO (3-4 métricas máx, alto nivel, enfocado en tendencias)
Dashboard de Ingeniería (5-6 métricas, detallado, accionable)

Para cada métrica, explica: qué muestra, por qué importa y qué acción tomar si la tendencia va en la dirección equivocada.

Pista

Para los cálculos:

Tasa de Ejecución = Ejecutados / Planificados × 100
DRE = Pre-release / (Pre-release + Post-release) × 100
Defect Density = Defectos pre-release / KLOC
Defect Escape Rate = Post-release / (Pre-release + Post-release) × 100

Para los dashboards, piensa en qué le importa a cada audiencia. Al CEO le importan las tendencias y el riesgo. Al equipo de ingeniería le importan los detalles sobre los que pueden actuar.

Solución

Parte 1: Cálculos

Sprint 15:

Tasa de Ejecución: 185/200 × 100 = 92.5%
DRE: 45/(45+8) × 100 = 84.9%
Defect Density: 45/12 = 3.75 por KLOC
Escape Rate: 8/(45+8) × 100 = 15.1%

Sprint 16:

Tasa de Ejecución: 210/220 × 100 = 95.5%
DRE: 38/(38+5) × 100 = 88.4%
Defect Density: 38/15 = 2.53 por KLOC
Escape Rate: 5/(38+5) × 100 = 11.6%

Sprint 17:

Tasa de Ejecución: 240/250 × 100 = 96.0%
DRE: 52/(52+3) × 100 = 94.5%
Defect Density: 52/18 = 2.89 por KLOC
Escape Rate: 3/(52+3) × 100 = 5.5%

Análisis de tendencias: Todas las métricas están mejorando. DRE fue de 84.9% a 94.5% — una mejora significativa. Escape rate bajó de 15.1% a 5.5%. La tasa de ejecución se acerca al 96%.

Parte 2: Diseño del Dashboard

Dashboard del CEO:

Tendencia de DRE (gráfico de línea, trimestral) — muestra la efectividad general del testing. Acción si baja: investigar brechas en el proceso de testing.
Defectos Reportados por Clientes (gráfico de barras, mensual) — impacto directo en el cliente. Acción si sube: agregar más testing de regresión.
Score de Confianza de Release (gauge, por release) — compuesto del estado de criterios de salida. Acción si es bajo: retrasar release o agregar tiempo de testing.
Costo de Calidad (gráfico circular) — costos de testing vs costos de defectos escapados. Acción si los costos de defectos escapados suben: invertir más en testing.

Dashboard de Ingeniería:

Tasa de Ejecución de Pruebas (por sprint) — ¿estamos ejecutando todas las pruebas planificadas? Acción: investigar tests bloqueados, problemas de entorno.
Defect Density por Módulo (heatmap) — ¿dónde están la mayoría de defectos? Acción: enfocar testing y code reviews en módulos de alta densidad.
DRE por Sprint (línea de tendencia) — ¿nuestro testing se está volviendo más efectivo? Acción: revisar diseño de pruebas para sprints con bajo DRE.
Defectos Abiertos por Severidad (barras apiladas, diario) — ¿se están atendiendo los bugs críticos? Acción: escalar defectos critical/high que envejecen.
Antigüedad de Defectos (histograma) — ¿cuánto tiempo permanecen abiertos los bugs? Acción: establecer SLAs para resolución por severidad.
Cobertura de Automatización (porcentaje, tendencia) — ¿estamos automatizando suficientes pruebas de regresión? Acción: priorizar automatización para áreas de alto riesgo.

Puntos Clave

Las métricas deben impulsar decisiones, no solo llenar dashboards
Las métricas de proceso miden cómo pruebas; las métricas de producto miden lo que construiste
Los indicadores adelantados te permiten actuar proactivamente; los rezagados son para retrospectivas
DRE es la métrica de QA más importante — rastréala religiosamente
Nunca uses métricas para evaluar testers individuales — mide el proceso, no a las personas
Sigue el enfoque GQM: comienza con metas, deriva preguntas, luego selecciona métricas

Métricas de Testing y KPIs

Lo Que Aprenderás

Por Qué las Métricas Importan en QA

Categorías de Métricas de Testing

Métricas de Proceso

Métricas de Producto

Métricas de Proyecto

Indicadores Adelantados vs Rezagados

Métricas Clave en Detalle

Defect Density

Defect Removal Efficiency (DRE)

Cobertura de Pruebas

Defect Escape Rate

Mean Time to Repair (MTTR)

Construyendo un Dashboard de Métricas

Layout Recomendado del Dashboard

Anti-Patrones: Métricas que Resultan Contraproducentes

Ejercicio: Diseña un Dashboard de Métricas de QA

Parte 1: Cálculos

Parte 2: Diseño del Dashboard

Puntos Clave

Prueba de Conocimiento

Métricas de Testing y KPIs

Lo Que Aprenderás

Por Qué las Métricas Importan en QA #

Categorías de Métricas de Testing #

Métricas de Proceso #

Métricas de Producto #

Métricas de Proyecto #

Indicadores Adelantados vs Rezagados #

Métricas Clave en Detalle #

Defect Density #

Defect Removal Efficiency (DRE) #

Cobertura de Pruebas #

Defect Escape Rate #

Mean Time to Repair (MTTR) #

Construyendo un Dashboard de Métricas #

Layout Recomendado del Dashboard #

Anti-Patrones: Métricas que Resultan Contraproducentes #

Ejercicio: Diseña un Dashboard de Métricas de QA #

Parte 1: Cálculos #

Parte 2: Diseño del Dashboard #

Puntos Clave #

Prueba de Conocimiento

Por Qué las Métricas Importan en QA

Categorías de Métricas de Testing

Métricas de Proceso

Métricas de Producto

Métricas de Proyecto

Indicadores Adelantados vs Rezagados

Métricas Clave en Detalle

Defect Density

Defect Removal Efficiency (DRE)

Cobertura de Pruebas

Defect Escape Rate

Mean Time to Repair (MTTR)

Construyendo un Dashboard de Métricas

Layout Recomendado del Dashboard

Anti-Patrones: Métricas que Resultan Contraproducentes

Ejercicio: Diseña un Dashboard de Métricas de QA

Parte 1: Cálculos

Parte 2: Diseño del Dashboard

Puntos Clave