Manus el nuevo agente de IA chino que revoluciona la tecnología con Claude Sonnet y herramientas abiertas

10 marzo, 2025

El agente Manus, desarrollado por la startup china Monica, promete transformar tareas complejas mediante tecnología de código abierto y un enfoque innovador en su arquitectura.

En un emocionante giro en el ámbito de la inteligencia artificial, Manus, un agente desarrollado por la startup china Monica, ha capturado la atención del sector tecnológico. Este nuevo sistema tiene la capacidad de abordar desde la planificación de viajes hasta análisis financieros, todo sin intervención humana. Aunque se encuentra en una fase de lanzamiento limitada, sus primeras demostraciones han generado un gran interés, aunque muchos detalles técnicos permanecen ocultos.

Hoy mismo, el usuario de X, conocido como «Jian», descubrió que Manus utiliza Claude Sonnet, junto con 29 herramientas y el software de código abierto Browser Use. Este hallazgo se realizó al solicitar el código del entorno de prueba de Manus AI.

Yichao «Peak» Ji, investigador principal de Manus, confirmó la arquitectura básica del sistema y proporcionó detalles sobre su implementación técnica. Destacó que el código del entorno de prueba tiene una ligera ofuscación y está diseñado exclusivamente para recibir órdenes de los agentes de IA.

¿Qué hace especial a Manus AI?

Una de las características más destacadas de Manus AI es su sistema multiagente. Según Ji, los usuarios interactúan únicamente con un agente ejecutor al comunicarse con la plataforma. Este agente carece de visibilidad sobre los detalles de otros componentes, como el agente de conocimiento o el agente planificador. ¿Cómo impacta esto en la usabilidad? Esta arquitectura permite un control más efectivo sobre la longitud del contexto, lo que explica por qué los intentos de manipulación suelen llevar a resultados erróneos, ya que el agente ejecutor no puede acceder directamente a la información de otros agentes.

Aunque en un video de presentación se mencionó que Manus AI está alimentado por “varios modelos distintos”, Ji aclaró que actualmente se basa en Claude 3.5 Sonnet v1 y varios modelos Qwen ajustados. El equipo también está probando Sonnet 3.7, que, según Ji, muestra un gran potencial.

El investigador también subrayó la importancia del software de código abierto en el desarrollo de Manus AI, indicando que sin estas tecnologías, el proyecto no existiría. Además, se anticipa que en un futuro cercano se liberarán varias herramientas como código abierto.

Un vistazo al rendimiento de Manus AI

El sitio web de Manus ilustra cómo el agente gestiona tareas del mundo real, presentando ejemplos desde la creación de itinerarios de viaje hasta la generación de paneles de control. ¿Cómo funciona? Los usuarios simplemente describen lo que desean lograr a través de instrucciones en lenguaje natural, y Manus traduce estas solicitudes en tareas completadas.

En comparación con otros sistemas, Manus avanza más allá de los chatbots tradicionales. A diferencia de herramientas que solo ofrecen sugerencias, este agente puede ejecutar acciones directamente a través de interfaces web. Su nombre, que proviene de «Mens et Manus» (mente y mano en latín), refleja su capacidad dual para planificar y realizar tareas web, similar a lo que ofrecen OpenAI y Anthropic.

Según Monica, Manus supera a la función de investigación profunda de OpenAI en el benchmark GAIA, que evalúa a los agentes de IA en tareas prácticas. Sin embargo, la compañía ha compartido poca información sobre la tecnología subyacente, lo que dificulta la verificación independiente de estas afirmaciones.

La competencia por la supremacía de los agentes de IA

La carrera por desarrollar agentes de IA autónomos está en pleno apogeo, con progresos mixtos en la industria. OpenAI ha lanzado su sistema Operator y un nuevo marco multiagente llamado «Swarm«, aunque las pruebas iniciales han revelado desafíos significativos de fiabilidad. Por su parte, Google ha introducido el agente de navegador Mariner, que utiliza capacidades avanzadas de planificación y múltiples tipos de memoria.

Los líderes de la industria mantienen el optimismo. Tanto Hassabis de Google DeepMind como Huang de Nvidia anticipan que sistemas funcionales estarán disponibles en un plazo de dos años. Sin embargo, los investigadores de seguridad advierten sobre la necesidad de precaución, ya que estudios recientes demuestran que los agentes de IA pueden ser manipulados, lo que plantea riesgos considerables cuando estos sistemas tienen acceso a los servicios y cuentas personales de los usuarios.

Deja el primer comentario