Microsoft lanza Phi-4 un modelo de razonamiento que destaca en dispositivos móviles y PCs

1 mayo, 2025

Los nuevos modelos de Microsoft prometen un rendimiento excepcional en razonamiento avanzado, incluso en hardware limitado.

Microsoft ha ampliado su serie Phi de modelos de lenguaje compactos con tres nuevas variantes centradas en el razonamiento avanzado. Estas innovaciones, denominadas Phi-4-reasoning, Phi-4-reasoning-plus y Phi-4-mini-reasoning, están diseñadas para abordar problemas complejos mediante un razonamiento estructurado y reflexión interna, todo mientras se mantienen lo suficientemente ligeros como para funcionar en dispositivos de gama baja, incluidas las aplicaciones móviles.

Estos modelos son parte de la familia Phi, optimizados para ofrecer capacidades de razonamiento, especialmente en hardware de menor rendimiento. ¿Te imaginas resolver problemas complejos directamente desde tu teléfono? Con esta serie, Microsoft busca llevar el poder de la inteligencia artificial a un público más amplio.

Eficiencia y rendimiento con menos parámetros

El modelo Phi-4-reasoning cuenta con 14 mil millones de parámetros y fue entrenado mediante un ajuste fino supervisado, utilizando rutas de razonamiento de modelos de OpenAI. Su versión más avanzada, Phi-4-reasoning-plus, incorpora aprendizaje por refuerzo y procesa 1.5 veces más tokens que el modelo base. Esto no solo mejora la precisión, sino que también incrementa el tiempo de respuesta y el costo computacional.

Interesantemente, Microsoft afirma que estos modelos superan a modelos más grandes, como el o1-mini de OpenAI y el DeepSeek-R1-Distill-Llama-70B, a pesar de que este último tiene cinco veces más parámetros. En la evaluación AIME-2025, un referente para la Olimpiada Matemática de EE.UU., los modelos Phi también superan al DeepSeek-R1, que cuenta con 671 mil millones de parámetros. ¿Qué significa esto para el futuro del procesamiento del lenguaje?

Las mejoras en el rendimiento no se limitan a las matemáticas o ciencias. Microsoft ha observado resultados notables en programación, resolución de problemas algorítmicos y tareas de planificación. De hecho, se reporta una transferencia considerable de mejoras hacia tareas más generales, como seguir indicaciones o responder preguntas basadas en contenido extenso.

Amplía el contexto:  OpenAI lanza modelos o3 y o4-mini que piensan con imágenes y utilizan herramientas avanzadas

Phi-4-mini-reasoning lleva el razonamiento a dispositivos móviles

El modelo más pequeño de esta serie, Phi-4-mini-reasoning, está diseñado específicamente para aplicaciones móviles y sistemas embebidos, como herramientas educativas y sistemas de tutoría. Con una arquitectura de 3.8 mil millones de parámetros, fue entrenado con más de un millón de problemas matemáticos que abarcan desde la educación secundaria hasta niveles de posgrado.

A pesar de su tamaño reducido, Phi-4-mini-reasoning ha demostrado superar a modelos como OpenThinker-7B y DeepSeek-R1-Distill-Qwen-7B en diversas evaluaciones. En la resolución de problemas matemáticos, sus resultados son comparables o incluso superiores a los del o1-mini de OpenAI. ¿Cómo puede un modelo tan pequeño competir con gigantes de la IA?

Integración optimizada para Windows

Microsoft ha optimizado estos nuevos modelos para su uso en sistemas Windows. Un variante, Phi Silica, está implementada en PCs Copilot+. Este modelo se integra en herramientas como Outlook para la resumición offline de correos y en la función “Click to Do”, que ofrece funciones de texto contextual directamente en la pantalla. Además, corre de manera eficiente en unidades de procesamiento neuronal (NPU), lo que permite respuestas más rápidas y un menor consumo energético.

Los tres modelos—Phi-4-reasoning, Phi-4-reasoning-plus y Phi-4-mini-reasoning—ya están disponibles con pesos abiertos en plataformas como Azure AI Foundry y Hugging Face, lo que facilita su acceso para desarrolladores y entusiastas de la IA.

Deja el primer comentario