Microsoft llança Phi-4 un model de raonament que destaca en dispositius mòbils i PCs

1 maig, 2025

Els nous models de Microsoft prometen un rendiment excepcional en raonament avançat, fins i tot en maquinari limitat.

Microsoft ha ampliat la seva sèrie Phi de models de llenguatge compactes amb tres noves variants centrades en el raonament avançat. Aquestes innovacions, denominades Phi-4-reasoning, Phi-4-reasoning-plus i Phi-4-mini-reasoning, estan dissenyades per abordar problemes complexos mitjançant un raonament estructurat i reflexió interna, tot mantenint-se prou lleugeres com per funcionar en dispositius d’entrada de gamma baixa, incloent les aplicacions mòbils.

Aquests models són part de la família Phi, optimitzats per oferir capacitats de raonament, especialment en hardware de menor rendiment. T’imagines resoldre problemes complexos directament des del teu telèfon? Amb aquesta sèrie, Microsoft busca portar el poder de la intel·ligència artificial a un públic més ampli.

Eficàcia i rendiment amb menys paràmetres

El model Phi-4-reasoning compta amb 14 mil milions de paràmetres i va ser entrenat mitjançant un ajustament fi supervisat, utilitzant rutes de raonament de models d’OpenAI. La seva versió més avançada, Phi-4-reasoning-plus, incorpora aprenentatge per reforç i processa 1.5 vegades més tokens que el model base. Això no només millora la precisió, sinó que també incrementa el temps de resposta i el cost computacional.

Interessantment, Microsoft afirma que aquests models superen a models més grans, com el o1-mini d’OpenAI i el DeepSeek-R1-Distill-Llama-70B, malgrat que aquest últim té cinc vegades més paràmetres. En l’avaluació AIME-2025, un referent per a l’Olimpíada Matemàtica dels EE.UU., els models Phi també superen al DeepSeek-R1, que compta amb 671 mil milions de paràmetres. Què significa això per al futur del processament del llenguatge?

Les millores en el rendiment no es limiten a les matemàtiques o ciències. Microsoft ha observat resultats notables en programació, resolució de problemes algorítmics i tasques de planificació. De fet, es reporta una transferència considerable de millores cap a tasques més generals, com seguir indicacions o respondre preguntes basades en contingut extens.

Amplía el contexto:  Alibaba presenta Qwen3 una sèrie de models que competeixen amb els líders del mercat

Phi-4-mini-reasoning porta el raonament a dispositius mòbils

El model més petit d’aquesta sèrie, Phi-4-mini-reasoning, està dissenyat específicament per a aplicacions mòbils i sistemes embebuts, com eines educatives i sistemes de tutoria. Amb una arquitectura de 3.8 mil milions de paràmetres, va ser entrenat amb més d’un milió de problemes matemàtics que abasten des de l’educació secundària fins a nivells de postgrau.

Malgrat la seva mida reduïda, Phi-4-mini-reasoning ha demostrat superar a models com OpenThinker-7B i DeepSeek-R1-Distill-Qwen-7B en diverses avaluacions. En la resolució de problemes matemàtics, els seus resultats són comparables o fins i tot superiors als de l’o1-mini d’OpenAI. Com pot un model tan petit competir amb gegants de la IA?

Integració optimitzada per a Windows

Microsoft ha optimitzat aquests nous models per al seu ús en sistemes Windows. Una variant, Phi Silica, està implementada en PCs Copilot+. Aquest model s’integra en eines com Outlook per a la resumició offline de correus i en la funció “Click to Do”, que ofereix funcions de text contextual directament a la pantalla. A més, corre de manera eficient en unitats de processament neuronal (NPU), la qual cosa permet respostes més ràpides i un menor consum energètic.

Els tres models—Phi-4-reasoning, Phi-4-reasoning-plus i Phi-4-mini-reasoning—ja estan disponibles amb pesos oberts en plataformes com Azure AI Foundry i Hugging Face, facilitant-ne l’accés per a desenvolupadors i entusiastes de la IA.

Deixa el primer comentari