Selenium Grid 4: Arquitectura de Ejecución de Pruebas Distribuida

Q: ¿Qué hay de nuevo en Selenium Grid 4 comparado con Grid 3?

Grid 4 introduce arquitectura de microservicios (6 componentes independientes), API GraphQL para introspección, trazabilidad nativa OpenTelemetry, soporte Docker/Kubernetes, y comunicación asíncrona vía Event Bus.

Q: ¿Cuántos navegadores puede manejar Selenium Grid 4?

Depende de la infraestructura. Cada nodo típicamente ejecuta 3-5 sesiones. Un cluster de 20 nodos maneja 60-100 navegadores concurrentes. Con autoscaling de Kubernetes, Grid 4 puede escalar a miles.

Q: ¿Es Selenium Grid 4 gratis?

Sí, completamente gratis y open-source (Apache 2.0). Sin limitaciones de características. Solo pagas por infraestructura (VMs, cluster Kubernetes, o proveedores cloud).

Q: ¿Selenium Grid o Selenoid — cuál es mejor?

Grid 4 tiene mejor observabilidad (GraphQL, OpenTelemetry) y soporte oficial. Selenoid tiene inicio más rápido y menor uso de recursos. Elige Grid 4 para observabilidad enterprise, Selenoid para rendimiento puro.

Selenium Grid 4: pruebas distribuidas, API GraphQL, integración Docker, observabilidad con OpenTelemetry

TL;DR
Grid 4 divide el Hub antiguo en 6 microservicios: Router, Distributor, Session Map, Queue, Event Bus, Node
API GraphQL en /graphql — consulta estado del grid, capacidades de nodos, sesiones activas en tiempo real
Docker Compose para dev, Helm chart para producción Kubernetes con autoscaling KEDA
Trazabilidad OpenTelemetry integrada — ve exactamente dónde va el tiempo desde request hasta navegador
Ideal para: Equipos ejecutando 50+ sesiones de navegador paralelas que necesitan observabilidad y despliegue cloud-native No recomendado si: Necesitas <10 navegadores (usa Standalone) o quieres configuración más simple (prueba Selenoid)

Introducción a Selenium Grid 4

Selenium Grid 4 representa un rediseño arquitectónico completo del framework de ejecución distribuida de pruebas que ha sido la columna vertebral de las pruebas paralelas de navegadores durante más de una década. A diferencia de sus predecesores, Grid 4 introduce características modernas de observabilidad, una capa de comunicación completamente asíncrona y soporte nativo para despliegues en contenedores.

La cuarta versión principal aborda puntos críticos de dolor de Grid 3: resolución de problemas difícil, escalabilidad limitada y procedimientos de configuración complejos. Con soporte integrado para Docker, Kubernetes, APIs GraphQL y trazabilidad OpenTelemetry, Grid 4 aporta confiabilidad de nivel empresarial a la infraestructura de pruebas de código abierto.

Esta guía completa explora la arquitectura de Grid 4, estrategias de despliegue, opciones avanzadas de configuración y patrones de implementación del mundo real para equipos que escalan la automatización de navegadores desde docenas hasta miles de sesiones concurrentes.

Selenium Grid 4 se integra con Containerization for Testing para despliegues Docker/Kubernetes, complementa plataformas de analítica como Zebrunner Test Reporting Analytics y Allure TestOps Enterprise Management, y se compara con alternativas gestionadas en Cloud Testing Platforms.

Evolución Arquitectónica

De Hub-Node a Componentes Distribuidos

Selenium Grid 4 divide el modelo monolítico Hub-Node en seis componentes especializados que pueden desplegarse de forma independiente o combinada:

Router: Punto de entrada para todos los comandos WebDriver, distribuye solicitudes a servicios apropiados

Distributor: Gestiona el registro de nodos y asigna nuevas solicitudes de sesión a nodos disponibles según las capacidades

Session Map: Mantiene el mapeo entre IDs de sesión y los nodos que ejecutan esas sesiones

New Session Queue: Almacena solicitudes de sesión entrantes cuando todos los nodos están ocupados, implementando cola FIFO

Event Bus: Broker de mensajes asíncrono (HTTP, Redis, RabbitMQ o Kafka) para comunicación entre componentes

Node: Ejecuta comandos WebDriver en instancias de navegador reales

Esta arquitectura inspirada en microservicios permite:

Escalado horizontal de componentes individuales con cuellos de botella
Actualizaciones continuas sin tiempo de inactividad
Patrones de despliegue nativos de la nube
Mejor aislamiento de fallos

Modos Standalone, Hub-Node y Completamente Distribuido

Grid 4 soporta tres topologías de despliegue:

Modo	Caso de Uso	Componentes	Escalabilidad
Standalone	Desarrollo local, pipelines CI	Proceso todo-en-uno	Máquina única
Hub	Equipos pequeños a medianos	Hub + Nodes	Escalado vertical
Distributed	Despliegues empresariales	Componentes independientes	Escalado horizontal

El modo Standalone combina todos los componentes en un único proceso JVM, ideal para configuraciones Docker Compose o flujos de trabajo GitHub Actions. El modo Hub agrupa Router, Distributor, Session Map y Queue en un único proceso Hub mientras los Nodes se ejecutan por separado. El modo completamente distribuido despliega cada componente de forma independiente para máxima flexibilidad.

API GraphQL para Introspección de Grid

Una de las características más potentes de Grid 4 es su endpoint GraphQL que expone estado del grid en tiempo real, información de sesiones y capacidades de nodos.

Consulta de Estado del Grid

La interfaz GraphQL en /graphql proporciona metadatos ricos sobre la salud del grid:

{
  grid {
    totalSlots
    usedSlots
    sessionCount
    maxSession
    nodes {
      id
      status
      uri
      slots {
        stereotype
        sessions {
          id
          capabilities
          startTime
        }
      }
    }
  }
}

Esto permite construir dashboards personalizados, herramientas de planificación de capacidad e integración con sistemas de monitoreo como Grafana. A diferencia del limitado endpoint JSON de estado de Grid 3, la API GraphQL permite a los clientes solicitar exactamente los datos que necesitan.

Descubrimiento Dinámico de Capacidades

Los equipos pueden consultar versiones de navegadores disponibles y combinaciones de plataformas programáticamente:

{
  grid {
    nodes {
      osInfo {
        name
        version
        arch
      }
      slots {
        stereotype
      }
    }
  }
}

Esto es invaluable para frameworks de prueba que necesitan descubrir capacidades dinámicamente o validar configuraciones de matriz de pruebas contra la capacidad real del grid.

Despliegue con Docker y Kubernetes

Imágenes Docker Oficiales

El Proyecto Selenium mantiene imágenes Docker actualizadas regularmente para todos los componentes de Grid:

# docker-compose.yml para topología Hub-Node
version: "3"
services:
  selenium-hub:
    image: selenium/hub:4.15.0
    ports:

      - "4444:4444"
    environment:

      - SE_SESSION_REQUEST_TIMEOUT=300
      - SE_NODE_SESSION_TIMEOUT=300

  chrome:
    image: selenium/node-chrome:4.15.0
    shm_size: 2gb
    depends_on:

      - selenium-hub
    environment:

      - SE_EVENT_BUS_HOST=selenium-hub
      - SE_EVENT_BUS_PUBLISH_PORT=4442
      - SE_EVENT_BUS_SUBSCRIBE_PORT=4443
      - SE_NODE_MAX_SESSIONS=3

  firefox:
    image: selenium/node-firefox:4.15.0
    shm_size: 2gb
    depends_on:

      - selenium-hub
    environment:

      - SE_EVENT_BUS_HOST=selenium-hub
      - SE_EVENT_BUS_PUBLISH_PORT=4442
      - SE_EVENT_BUS_SUBSCRIBE_PORT=4443
      - SE_NODE_MAX_SESSIONS=3

Cada nodo de navegador incluye servidor VNC para depuración en vivo (variantes selenium/node-chrome-debug:4.15.0), y la grabación de video está disponible a través de imágenes standalone con contenedores sidecar selenium/video:latest.

Kubernetes con Helm Charts

Para despliegues a escala de producción, el Helm chart oficial proporciona configuración declarativa:

helm repo add selenium https://www.selenium.dev/docker-selenium
helm install selenium-grid selenium/selenium-grid \
  --set isolateComponents=true \
  --set chromeNode.replicas=5 \
  --set firefoxNode.replicas=3 \
  --set edgeNode.replicas=2

El chart soporta:

Autoescalado con KEDA (Kubernetes Event-Driven Autoscaling)
Almacenamiento persistente de grabaciones de sesiones
Configuración Ingress para acceso externo
Contenedores sidecar para agentes de observabilidad

Observabilidad con OpenTelemetry

La integración de Grid 4 con OpenTelemetry proporciona trazabilidad distribuida a través de todos los componentes, permitiendo visibilidad en flujos de solicitudes desde el cliente hasta la ejecución del navegador.

Configuración de Trazabilidad

Habilite la trazabilidad configurando variables de entorno:

SE_ENABLE_TRACING=true
SE_TRACING_EXPORTER=otlp
OTEL_EXPORTER_OTLP_ENDPOINT=http://jaeger:4317
OTEL_SERVICE_NAME=selenium-grid

Esto exporta trazas a backends compatibles con OTLP como Jaeger, Zipkin o herramientas APM comerciales. Cada comando WebDriver genera spans mostrando:

Tiempo de creación de sesión
Latencia de selección de nodo
Duración de ejecución de comando
Tiempos de ida y vuelta de red

Integración con Stacks de Monitoreo

Grid 4 expone métricas Prometheus en /metrics:

# EJEMPLO
selenium_grid_sessions_active 12
selenium_grid_sessions_queued 3
selenium_grid_node_count 8
selenium_grid_slot_utilization 0.75

Combinado con dashboards Grafana, los equipos obtienen visibilidad en tiempo real del rendimiento del grid, datos de planificación de capacidad y análisis de tasas de fallo.

Configuración Avanzada

Timeout de Solicitud de Sesión y Políticas de Reintento

Grid 4 introduce controles de timeout de grano fino:

# Configuración Hub/Router
--session-request-timeout 300  # Esperar 5min por slot disponible
--session-retry-interval 5     # Verificar slots cada 5seg
--healthcheck-interval 60      # Frecuencia de health check de nodo

# Configuración Node
--heartbeat-period 30          # Reportar estado cada 30seg
--register-period 60           # Re-registrar si desconectado
--drain-after-session-count 100 # Auto-reiniciar después de 100 sesiones

La configuración --drain-after-session-count es particularmente útil para prevenir fugas de memoria en nodos de larga duración reemplazándolos graciosamente después de un número configurado de sesiones.

Matchers de Capacidades Personalizados

Para configuraciones complejas de navegador (flags específicos de Chrome, perfiles personalizados), Grid 4 permite lógica personalizada de coincidencia de capacidades:

public class CustomCapabilityMatcher implements CapabilityMatcher {
  @Override
  public boolean matches(Capabilities nodeCapabilities,
                         Capabilities requestedCapabilities) {
    // Lógica personalizada para configuraciones especializadas de navegador
    String requiredExtension = (String) requestedCapabilities
      .getCapability("customExtension");
    return nodeCapabilities.getCapability("availableExtensions")
      .toString().contains(requiredExtension);
  }
}

Esto permite enrutar pruebas que requieren extensiones de navegador específicas, configuraciones de locale o perfiles de rendimiento a nodos apropiadamente configurados.

Configuración de Relay para Nodos Existentes

Grid 4 puede integrarse con servidores Selenium externos (Sauce Labs, BrowserStack, nodos legacy Grid 3) usando configuración relay:

java -jar selenium-server.jar relay \
  --service-url "https://ondemand.us-west-1.saucelabs.com:443/wd/hub" \
  --config relay-sauce.toml

Esto permite despliegues híbridos donde algunos navegadores se ejecutan localmente mientras otros usan proveedores en la nube, todos accesibles a través de un único endpoint Grid.

Comparación con Alternativas

Característica	Selenium Grid 4	Selenoid	Moon (Aerokube)	Zalenium
Soporte de Protocolo	WebDriver, CDP	WebDriver, CDP	WebDriver, CDP, Playwright	WebDriver
Video de Navegador	Vía sidecar Docker	Integrado	Integrado	Integrado
Nativo de Kubernetes	Helm chart	Sí	Sí	Deprecado
API GraphQL	✅ Sí	❌ No	❌ No	❌ No
OpenTelemetry	✅ Nativo	❌ Manual	✅ Nativo	❌ No
Desarrollo Activo	✅ Oficial Selenium	✅ Activo	✅ Activo	❌ Archivado
Licencia	Apache 2.0	Apache 2.0	Comercial	Apache 2.0

Selenoid ofrece tiempos de inicio más rápidos y menor uso de recursos mediante gestión directa de contenedores pero carece de las características de observabilidad de Grid 4.

Moon es la solución nativa de Kubernetes comercial de Aerokube con características avanzadas como caché de navegador y VNC/video integrados pero requiere licencia de pago.

Zalenium (ahora archivado) fue pionero en despliegue de grid basado en Docker pero ha sido superado por las imágenes Docker oficiales de Selenium.

Precios y Licencias

Selenium Grid 4: Completamente gratuito y de código abierto (licencia Apache 2.0). Sin limitaciones de características, uso comercial permitido.

Los costos de infraestructura dependen del modelo de despliegue:

VMs en la Nube: $50-500/mes para grids pequeños-medianos (AWS EC2, GCP Compute)
Clusters Kubernetes: $100-2000/mes dependiendo de la escala (EKS, GKE, AKS)
Servicios Selenium Gestionados: $150-1500/mes (proveedores compatibles con Grid 4)

El soporte comercial está disponible a través de:

Sauce Labs: Ejecución en la nube compatible con Grid desde $149/mes
BrowserStack: Infraestructura compatible con Grid desde $99/mes
Firmas de consultoría: Servicios de implementación y optimización ($150-250/hora)

Ejemplos de Integración

Integración con Pipeline CI/CD

Flujo de trabajo GitHub Actions ejecutando pruebas contra Grid:

name: E2E Tests
on: [push]
jobs:
  test:
    runs-on: ubuntu-latest
    services:
      selenium-hub:
        image: selenium/hub:4.15.0
        ports:

          - 4444:4444
      chrome:
        image: selenium/node-chrome:4.15.0
        env:
          SE_EVENT_BUS_HOST: selenium-hub
          SE_EVENT_BUS_PUBLISH_PORT: 4442
          SE_EVENT_BUS_SUBSCRIBE_PORT: 4443
    steps:

      - uses: actions/checkout@v3
      - name: Run tests
        run: mvn test -Dselenium.grid.url=http://localhost:4444

Configuración de Framework de Pruebas

Configure frameworks de prueba para usar Grid:

Java (Selenium 4):

RemoteWebDriver driver = new RemoteWebDriver(
  new URL("http://grid:4444"),
  new ChromeOptions()
);

Python (pytest-selenium):

@pytest.fixture
def selenium(selenium):
    selenium.command_executor._url = "http://grid:4444/wd/hub"
    return selenium

JavaScript (WebdriverIO):

exports.config = {
  hostname: 'grid',
  port: 4444,
  path: '/wd/hub',
  capabilities: [{
    browserName: 'chrome'
  }]
}

Mejores Prácticas

Planificación de Capacidad

Calcule la capacidad de Grid requerida usando:

Nodos Requeridos = (Total Pruebas × Duración Promedio Prueba) / (Tiempo Objetivo Finalización × Sesiones por Nodo)

Para 1000 pruebas promediando 3 minutos cada una, objetivo de finalización de 30 minutos con 5 sesiones por nodo:

Nodos Requeridos = (1000 × 3) / (30 × 5) = 20 nodos

Agregue 20% de margen para fallos y picos de cola.

Estabilidad de Nodos

Implemente gestión del ciclo de vida de nodos:

Configure --drain-after-session-count para prevenir fugas de memoria
Configure health checks con timeouts razonables
Use etiquetas de nodo para enrutar pruebas a configuraciones especializadas
Monitoree espacio en disco para logs y grabaciones de video

Consideraciones de Seguridad

Grid 4 no tiene autenticación integrada. Los despliegues de producción deberían:

Desplegar detrás de un reverse proxy con autenticación (Nginx, Traefik)
Usar segmentación de red para aislar componentes del grid
Implementar limitación de tasa para prevenir agotamiento de recursos
Escanear imágenes de navegador en busca de vulnerabilidades regularmente

AI/IA en la Gestión de Grid

Las herramientas de IA ayudan con la configuración y troubleshooting de Grid 4, pero las decisiones de infraestructura aún necesitan juicio humano.

Lo que la IA hace bien:

Generar docker-compose.yml y valores Helm a partir de descripción de requisitos
Convertir configuraciones de Grid 3 a formato Grid 4
Escribir consultas GraphQL para necesidades específicas de monitoreo
Depurar problemas comunes a partir de logs de errores

Lo que requiere humanos:

Planificación de capacidad (depende de patrones de pruebas y presupuesto)
Decisiones de topología de red (zonas de seguridad, reglas de firewall)
Elegir entre Grid 4, Selenoid y proveedores cloud
Tuning de rendimiento para cargas específicas

Prompts útiles:

“Genera un docker-compose.yml para Selenium Grid 4 con 3 nodos Chrome y 2 nodos Firefox, con grabación de video habilitada.”

“Escribe una consulta GraphQL para encontrar todas las sesiones ejecutándose por más de 5 minutos en nodos Chrome.”

“Convierte esta configuración de hub Grid 3 a modo distribuido Grid 4 con Router y Distributor separados.”

Tip de troubleshooting: Cuando las sesiones fallan, pega el error completo de los logs de Grid en la IA. Pide que explique el error y sugiera correcciones. Los mensajes de error detallados de Grid 4 (especialmente con trazas OpenTelemetry) dan suficiente contexto a la IA para diagnosticar la mayoría de problemas.

Conclusión

Selenium Grid 4 moderniza la ejecución distribuida de pruebas con arquitectura nativa de la nube, observabilidad completa y patrones de despliegue listos para producción. La API GraphQL, integración OpenTelemetry y diseño de microservicios lo hacen adecuado para organizaciones que ejecutan miles de ejecuciones de pruebas diarias.

Aunque alternativas como Selenoid ofrecen ventajas de rendimiento en escenarios específicos, el estatus oficial de Grid 4, desarrollo activo y rico ecosistema lo convierten en la opción por defecto para equipos ya invertidos en Selenium WebDriver. Para proyectos nuevos, evalúe Grid 4 junto con plataformas de ejecución en la nube y protocolos más nuevos como la paralelización integrada de Playwright para determinar el mejor ajuste para sus requisitos de arquitectura y escala.

FAQ

¿Qué hay de nuevo en Selenium Grid 4 comparado con Grid 3?

Grid 4 es una reescritura completa con arquitectura de microservicios. El Hub monolítico se divide en seis componentes independientes (Router, Distributor, Session Map, New Session Queue, Event Bus, Node) que pueden desplegarse y escalarse por separado. Las nuevas características incluyen API GraphQL para introspección en tiempo real, trazabilidad distribuida nativa OpenTelemetry, imágenes Docker oficiales y Helm charts, y comunicación asíncrona vía Event Bus (soporta Redis, RabbitMQ o Kafka). El resultado es mejor observabilidad, troubleshooting más fácil y verdadero escalado horizontal.

¿Cuántos navegadores puede manejar Selenium Grid 4?

La capacidad de Grid 4 depende completamente de tu infraestructura. Cada nodo típicamente ejecuta 3-5 sesiones de navegador concurrentes (limitado por CPU y memoria). Un cluster modesto de 20 nodos maneja 60-100 navegadores paralelos. Con Kubernetes y autoscaling KEDA, Grid 4 puede escalar a miles de sesiones concurrentes — la arquitectura no tiene límites inherentes. Para planificación de capacidad, usa la fórmula: Nodos Requeridos = (Total Pruebas × Duración Promedio) / (Tiempo Objetivo × Sesiones por Nodo).

¿Es Selenium Grid 4 gratis?

Sí, completamente gratis y open-source bajo licencia Apache 2.0. No hay limitaciones de características ni restricciones comerciales. Solo pagas por la infraestructura para ejecutarlo: VMs ($50-500/mes para grids pequeños-medianos), clusters Kubernetes ($100-2000/mes dependiendo de la escala), o servicios Selenium gestionados como Sauce Labs o BrowserStack ($99-1500/mes) si prefieres no gestionar la infraestructura tú mismo.

¿Selenium Grid o Selenoid — cuál es mejor?

Ambos son opciones sólidas con diferentes fortalezas. Grid 4 ofrece mejor observabilidad (API GraphQL, trazabilidad OpenTelemetry, métricas Prometheus), soporte oficial del Proyecto Selenium, y un Helm chart completo. Selenoid proporciona inicio de contenedores más rápido, menor uso de recursos, configuración más simple, y grabación de video integrada. Elige Grid 4 si necesitas observabilidad enterprise y ya estás usando Selenium. Elige Selenoid si priorizas rendimiento puro y operaciones más simples. Moon (sucesor comercial de Selenoid) añade soporte Playwright si necesitas ambos frameworks.

Ver También

Containerization for Testing - Despliegue Docker y Kubernetes
Cloud Testing Platforms - Alternativas de infraestructura gestionada
Zebrunner Test Reporting Analytics - Analítica de ejecución complementaria
Allure TestOps Enterprise Management - Plataforma de analítica enterprise
Test Management Systems Comparison - Comparación completa de sistemas TMS