El Agente Que No Olvida: Un Análisis Profundo de Hermes Agent — y Cómo se Diferencia de OpenClaw

Vexlint Team · · 15 min de lectura
El Agente Que No Olvida: Un Análisis Profundo de Hermes Agent — y Cómo se Diferencia de OpenClaw

Una guía extensa sobre el agente de código abierto que está redefiniendo cómo pensamos sobre la IA autónoma


Introducción: El problema del “Día de la Marmota” de los agentes de IA

Todo desarrollador que ha trabajado seriamente con un asistente de IA ha sentido la misma silenciosa frustración. Pasas una tarde enseñándole al agente las peculiaridades de tu base de código, tus convenciones de nombres, tu pipeline de despliegue y el esquema de base de datos legado que nadie documentó. Luego cierras la sesión. Cuando abres una nueva, la mayor parte de ese contexto se ha ido — y empiezas de cero.

Este ciclo de pérdida de contexto y reexplicación se ha convertido en uno de los puntos de fricción más persistentes del trabajo asistido por IA. Es como entrenar a un nuevo becario cada mañana, para siempre.

Dos proyectos de código abierto atacaron este problema desde direcciones fundamentalmente diferentes: OpenClaw, que demostró que los agentes auto-alojados podían vivir en tu infraestructura y funcionar 24/7, y Hermes Agent, que demostró que un agente no tiene que empezar de cero en cada tarea. Esta publicación es un análisis profundo de Hermes — qué es, cómo funciona, por qué explotó en popularidad y exactamente dónde diverge de OpenClaw.


Parte 1: ¿Qué es Hermes Agent?

Hermes Agent es un agente de IA autónomo, auto-mejorable y de código abierto construido por Nous Research — el laboratorio detrás de las familias de modelos Hermes, Nomos y Psyche — y lanzado en febrero de 2026 bajo licencia MIT.

El planteamiento oficial es deliberadamente directo: no es un copilot de programación atado a un IDE, y no es un envoltorio de chatbot alrededor de una sola API. En cambio, es un agente autónomo que vive en tu propio servidor, recuerda lo que aprende y se vuelve más capaz cuanto más tiempo funciona. Como dice uno de sus lemas: “No es un chatbot. No es un copilot. Un agente que vive en tu máquina y se vuelve más inteligente cada día.”

Algunos principios fundamentales definen el proyecto:

  • Auto-alojado y privado. Todos los datos permanecen en tu máquina. El proyecto anuncia sin telemetría, sin seguimiento y sin dependencia de la nube.
  • Gratis para siempre, código abierto. Un comando para instalar, un comando para iniciar.
  • Agnóstico al modelo. Funciona con Nous Portal, OpenRouter (más de 200 modelos), OpenAI o tu propio endpoint — intercambiable con un solo comando, sin cambios de código, sin dependencia.
  • Construido por entrenadores de modelos. Más allá de la automatización de tareas, funciona también como una plataforma para generar datos de entrenamiento, ejecutar experimentos de RL y exportar trayectorias para fine-tuning.

La historia de la adopción

Los números cuentan su propia historia. Según los reportes de la propia NVIDIA, Hermes Agent superó las 140.000 estrellas en GitHub en menos de tres meses y se convirtió en el agente más usado del mundo según OpenRouter. Análisis independientes describen una “ola de migración” de desarrolladores que abandonan OpenClaw, el framework previamente dominante. Sean cuales sean las cifras exactas (diferentes fuentes citan diferentes conteos de estrellas a medida que el proyecto crecía semana a semana), la trayectoria es inequívoca: este proyecto tocó una fibra sensible.


Parte 2: Cómo funciona realmente Hermes — el bucle de aprendizaje

El concepto más importante en Hermes es su bucle de aprendizaje. Esta es la característica que lo separa de prácticamente cualquier otro framework de agentes, y vale la pena entenderlo en detalle.

La mayoría de los frameworks de agentes siguen un ciclo fijo: recibir tarea → planear → ejecutar → devolver resultado. La sesión termina. Nada se retiene. La siguiente tarea comienza desde la misma base. Ejecuta el mismo tipo de tarea cien veces y el agente no mejora — se acerca a cada una como un problema nuevo.

Hermes añade una capa después de la ejecución. Cuando completa una tarea compleja, entra en lo que Nous Research llama la “Fase Reflexiva.” El ciclo completo se ve así:

  1. Experiencia — El agente completa una tarea compleja de múltiples pasos.
  2. Evaluar — Analiza su propio desempeño y lo que realmente ocurrió.
  3. Extraer — Extrae el patrón de razonamiento reutilizable.
  4. Creación de habilidades — Escribe un nuevo archivo de habilidad que codifica exactamente cómo resolvió el problema. Las habilidades son plantillas estructuradas: “cuando el contexto se ve así, este enfoque funciona.”
  5. Refinar — A medida que llega nueva evidencia, las habilidades se actualizan. Si un mejor enfoque supera consistentemente al almacenado, la habilidad se revisa.
  6. Empujón — Indicaciones periódicas animan al agente a persistir lo que ha aprendido.

La próxima vez que llega una tarea similar, el agente consulta su propia biblioteca de habilidades en lugar de razonar desde cero. El conocimiento institucional se acumula a través de las sesiones. Como lo resumió una comparación de manera memorable: OpenClaw se queda igual mientras lo usas; Hermes mejora.

Las cuatro capacidades destacadas

El blog de ingeniería de NVIDIA destacó cuatro capacidades que distinguen a Hermes de los agentes típicos:

  • Habilidades auto-evolutivas. Cada vez que el agente enfrenta una tarea compleja o recibe retroalimentación, guarda sus aprendizajes como una habilidad para poder adaptarse y mejorar con el tiempo.
  • Subagentes contenidos. Hermes trata a los subagentes como trabajadores aislados y de corta vida dedicados a una sola subtarea — cada uno con contexto enfocado y su propio conjunto de herramientas, permitiendo pipelines con costo de contexto cero.
  • Modelado del usuario. A través de las sesiones, Hermes construye una representación de ti — tus preferencias, historial de decisiones y patrones de tareas — para que se alinee progresivamente más sin que tengas que re-instruirlo cada vez. (Utiliza lo que se describe como “modelado dialéctico de usuario Honcho.”)
  • Recuperación entre sesiones. Búsqueda de texto completo sobre sesiones pasadas, con resumen por LLM, para que el agente pueda traer historia relevante de vuelta al contexto.

El Curator (v0.12)

Un lanzamiento posterior, Hermes v0.12 — apodado el “lanzamiento Curator” — reforzó esta tesis. El Curator es un sistema autónomo que mantiene tu biblioteca de habilidades sin intervención manual. Monitorea patrones de uso de habilidades, identifica habilidades de bajo rendimiento, sugiere mejoras y puede refactorizar habilidades de forma autónoma basándose en evaluaciones de calidad por rúbrica. Después de 30 días de uso, la promesa es que un despliegue de Hermes es medible y demostrablemente mejor en tus tareas específicas que el día uno.


Parte 3: Dónde vive Hermes — plataformas, backends y herramientas

Hermes está construido alrededor de la idea de estar en todas partes donde tú estás, mientras se ejecuta dondequiera que quieras.

Vive donde tú vives

Desde un único proceso gateway, Hermes se conecta a una lista notablemente larga de plataformas: CLI, Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, Microsoft Teams, Google Chat y una lista creciente más — descritas en su documentación como más de 20 plataformas. Puedes iniciar una tarea en un canal y continuarla en otro, con transcripción de notas de voz y continuidad de conversación entre plataformas integradas.

Funciona en cualquier lugar

Hermes soporta seis backends de terminal: ejecución local, contenedores Docker, SSH, Daytona, Singularity y entornos serverless Modal. Las opciones serverless (Daytona y Modal) ofrecen hibernación cuando están inactivas — tu entorno duerme cuando no se usa, costando casi nada. En contraste, OpenClaw soporta principalmente ejecución local y Docker.

Herramientas y extensibilidad

Listo para usar viene con más de 40 herramientas integradas, incluyendo búsqueda web, automatización de navegador, visión, generación de imágenes y texto-a-voz. Soporta el Model Context Protocol (MCP) para conectarse a servidores de herramientas externas, y sus habilidades son compatibles con el estándar abierto agentskills.io, haciéndolas portables y compartibles a través de un Skills Hub comunitario.

Nota sobre hardware

Como tanto el agente como el modelo subyacente están diseñados para ejecutarse localmente, la calidad del hardware moldea directamente la experiencia. NVIDIA ha posicionado sus RTX PCs y DGX Spark como compañeros ideales para despliegues locales de Hermes siempre activos, particularmente emparejados con modelos eficientes de pesos abiertos como la serie Qwen 3.6 de Alibaba, que entregan inteligencia de modelos grandes en una huella de memoria mucho menor.


Parte 4: La gran comparación — Hermes Agent vs OpenClaw

Esta es la pregunta que la mayoría de la gente realmente quiere que se responda. Los dos proyectos se superponen mucho — ambos son agentes persistentes y auto-alojados que se conectan a apps de mensajería, llaman a LLMs, ejecutan herramientas y mantienen estado. Pero sus centros de gravedad son fundamentalmente diferentes.

Un escritor capturó la inversión perfectamente: “Hermes empaqueta un gateway alrededor de un agente que aprende. OpenClaw empaqueta un agente alrededor de un gateway de mensajería.” Esa única inversión impulsa la mayoría de los trade-offs prácticos.

Orígenes y filosofía

Hermes AgentOpenClaw
Construido porNous ResearchImpulsado por la comunidad; iniciado por el desarrollador Peter Steinberger a finales de 2025
LanzadoFebrero 2026Finales de 2025
LenguajePythonTypeScript / Node.js
LicenciaMITCódigo abierto
Tesis centralUn solo agente que aprende y mejora con el tiempoUna plataforma de asistente gateway-first con amplio enrutamiento de canales
Modelo mental”Un compañero de equipo que aprende""Una herramienta que configuras”

Arquitectura: dónde se asienta el control

El Gateway de OpenClaw es el plano de control — un único proceso Node.js de larga duración que posee las sesiones, el enrutamiento, la ejecución de herramientas y el estado. Todo fluye a través de él. Enruta mensajes desde apps de chat hacia un bucle ReAct (razonar → actuar → observar), almacena la memoria como archivos Markdown planos buscables vía SQLite y utiliza un cron job de heartbeat para despertar al agente para tareas proactivas.

Hermes, en cambio, define el bucle del agente en sí mismo como el motor central de orquestación. El gateway, el planificador, el runtime de herramientas, la persistencia de sesiones y los entornos de RL están estructurados alrededor de ese bucle. Esto significa que el ciclo de aprendizaje es una preocupación arquitectónica de primera clase, no algo añadido posteriormente.

Habilidades: la diferencia más marcada

Esta es la razón más grande por la que los desarrolladores cambian.

  • Las habilidades de OpenClaw son estáticas. Son archivos escritos por humanos que tú creas, revisas, instalas y mantienes. Si una habilidad es incorrecta o incompleta, la editas manualmente. OpenClaw lanzó posteriormente ClawHub, un marketplace de plugins construidos por la comunidad — enfatizando la amplitud, con cientos (algunas fuentes citan miles) de plugins listos para usar que cubren casi todos los casos de uso.
  • Las habilidades de Hermes son autónomas. El agente las crea desde la experiencia, las refina durante el uso y las acumula a través de las sesiones. El trade-off: obtienes profundidad en tus flujos de trabajo específicos en lugar de amplitud instantánea.

El resumen limpio de un análisis: OpenClaw prioriza capacidad amplia y reactiva con bajo overhead de configuración y sin capa nativa de aprendizaje; Hermes prioriza la mejora a largo plazo en un conjunto de tareas dado.

Modelo multi-agente

Aquí es donde las cosmovisiones divergen más marcadamente:

  • OpenClaw piensa en términos de organizaciones de agentes. Soporta equipos de agentes persistentes — un agente de Slack, un agente de email, un agente de investigación, cada uno con su propio canal, identidad de bot y persona, manteniendo estado y trabajando juntos a través de sesiones. Para configuraciones multi-agente genuinas, esta es la arquitectura más fuerte, y los usuarios que ejecutan flotas de 5-10 agentes consistentemente citan esto como la razón por la que se quedan.
  • Hermes utiliza un modelo padre-subagente. El agente principal lanza subagentes aislados para ejecución paralela, pero esos subagentes no se hablan entre sí. Está optimizado para delegación y pipelines de costo de contexto cero, no para una organización permanente de personas comunicantes.

Configuración y tiempo hasta el valor

  • OpenClaw: Docker Compose te pone en marcha en menos de 30 minutos. La búsqueda web y las herramientas de archivo funcionan inmediatamente. Estás haciendo tareas reales el mismo día. Mayor capacidad de línea base de inmediato gracias a su ecosistema.
  • Hermes: Un simple comando curl de una línea instala todo (uv, Python, el repo) sin sudo. Pero un despliegue completo con backends de memoria personalizados e integraciones puede tomar de 2 a 4 horas para afinarlo. Capacidad inicial menor que mejora continuamente.

El “punto de cruce” importa aquí: OpenClaw entrega tiempo-hasta-valor más rápido; la ventaja acumulativa de Hermes se adelanta cuanto más tiempo lo uses en el mismo conjunto de tareas.

Postura de seguridad

  • Hermes entrega un modelo conservador y más seguro por defecto: endurecimiento de contenedores con sistemas de archivos raíz de solo lectura, capacidades reducidas, aislamiento de namespaces, checkpoints del sistema de archivos (snapshots automáticos antes de operaciones destructivas, con rollback) y un escáner de pre-ejecución que analiza los comandos del terminal antes de que se ejecuten. Su ecosistema más pequeño y más joven también significa una superficie de ataque más pequeña.
  • La amplitud de OpenClaw es también su riesgo: un ecosistema mucho más grande y un marketplace de plugins de terceros necesariamente introducen más superficie de ataque. Su escala viral lo convirtió en un objetivo más grande — un proyecto con cientos de miles de estrellas atrae naturalmente más atacantes que uno con muchos menos.

Costo (aproximado, ilustrativo)

Para uso moderado en solitario, estimaciones de la comunidad ponen una instancia de Hermes en un VPS barato en aproximadamente $30-65/mes en llamadas API, frente a una instancia de OpenClaw en aproximadamente $40-80/mes. La diferencia no es dramática — la verdadera pregunta, como señaló un escritor, es si preferirías gastar tu tiempo en configuración de Docker o en trabajar con el agente.

Carácter de la comunidad

  • Hermes tiende a atraer a desarrolladores profundamente metidos en el espacio del fine-tuning de LLMs y la investigación de agentes. La discusión es técnica y detallada; las funcionalidades a menudo vienen de personas que construyen sistemas de producción serios.
  • OpenClaw tiene una comunidad más amplia y amigable para principiantes con más tutoriales y guías de inicio.

⚠️ Una advertencia compartida: ninguno de los proyectos tiene un respaldo comercial, por lo que la continuidad del mantenimiento a largo plazo es un riesgo genuino que vale la pena evaluar antes de construir algo crítico sobre cualquiera de los dos.


Parte 5: ¿Entonces cuál deberías elegir?

Después de sintetizar el análisis de la comunidad (un desglose leyó más de 1.300 comentarios de Reddit), la respuesta honesta es: no hay un único ganador. Ambos tienen fortalezas reales y problemas reales, y el mayor punto de dolor no es elegir uno — es auto-alojar cualquiera de los dos. Aquí hay un marco práctico:

Elige OpenClaw si quieres mensajear a tu asistente desde cualquier lugar, necesitas orquestación multi-agente genuina, quieres programación cron determinista o quieres acceso inmediato a un gran ecosistema de plugins. Trade-off: más partes móviles, mayor huella y complejidad de configuración/actualización.

Elige Hermes si quieres un agente que mejore medible y demostrablemente en tus tareas con el tiempo, necesitas múltiples backends de sandbox (especialmente opciones serverless como Modal), valoras la ejecución más segura por defecto o estás haciendo flujos de trabajo tipo investigación con delegación a subagentes y seguridad de rollback. Trade-off: ecosistema de integraciones más pequeño, más esfuerzo de configuración y auto-evaluación que no es perfectamente confiable.

Usa ambos si estás ejecutando configuraciones complejas. La configuración a la que la comunidad sigue convergiendo: OpenClaw como capa de orquestación (planificación, programación, enrutamiento multi-canal) y Hermes como agente de ejecución para flujos de trabajo repetibles donde el aprendizaje acumulado vale la pena. Se complementan más de lo que compiten.

Migrando desde OpenClaw

Un detalle agradable para los que cambian: Hermes puede importar automáticamente tus configuraciones, memorias, habilidades y claves API de OpenClaw. Su asistente de configuración detecta un directorio existente ~/.openclaw y ofrece migrar antes de que comience la configuración, con una vista previa de simulación para que puedas ver exactamente qué se movería antes de confirmar.


Conclusión: Dos apuestas sobre lo que hace valioso a un agente

Quita los benchmarks y los conteos de estrellas, y lo que queda es una genuina bifurcación filosófica en el camino.

OpenClaw hizo una apuesta por el alcance y la amplitud: estar en todas partes, soportar todo, apoyarse en una gran comunidad de habilidades preconstruidas. Demostró que los desarrolladores quieren agentes que sobrevivan a sus pestañas del navegador.

Hermes hizo una apuesta por la profundidad y la acumulación: hacer menos cosas, pero ser medible y demostrablemente mejor en ellas cada día. Demostró que un agente no tiene que reiniciarse a cero en cada sesión.

Ninguna apuesta está equivocada. La respuesta correcta depende enteramente de si tu problema es coordinación (la fortaleza de OpenClaw) o automatización que debería mejorar con el tiempo (la fortaleza de Hermes). Lo que está claro es que la era del agente sin estado y amnésico — ese que reentrenas cada mañana como a un nuevo becario — está terminando. Y proyectos como Hermes son una gran parte de por qué.


¿Quieres una continuación que profundice en una sola pieza — los internos del refactor de habilidades del Curator, la arquitectura de seguridad o un recorrido práctico de configuración? Cada uno de esos es una publicación completa por derecho propio.