Nvidia ha estado en el ojo del huracán últimamente, y no es para menos. Su CEO, Jensen Huang, ha decidido romper el silencio y aclarar lo que realmente ocurrió tras el repentino desplome de las acciones de la compañía, que perdió más de 600 mil millones de dólares en un solo día. Todo comenzó en enero de 2025, cuando se anunciaron nuevos modelos de inteligencia artificial de DeepSeek que prometían reducir la necesidad de hardware especializado. Pero, ¿fue realmente un malentendido por parte de los inversores?
En una reciente entrevista, Huang explicó que la percepción de los inversores estaba equivocada. Según él, muchos pensaron que el modelo de DeepSeek significaba que la inteligencia artificial podía operar sin necesidad de una infraestructura robusta. «Los inversores tenían un modelo mental que separaba el pre-entrenamiento de la inferencia, donde la inferencia se veía como una simple pregunta y respuesta. Pero eso, claramente, es un paradigma erróneo», afirmó Huang poniendo las cartas sobre la mesa.
El verdadero corazón de DeepSeek
Pero antes de seguir, aclaremos qué es eso del DeepSeek para los que hayan estado en una cueva últimamente. Este es un modelo de inteligencia artificial que se basa en el aprendizaje profundo, y la parte crucial de su funcionamiento es lo que Huang llama el post-entrenamiento. Mientras que el pre-entrenamiento establece las bases, el post-entrenamiento es donde realmente se afina la capacidad de la IA para resolver problemas complejos.
En el caso de DeepSeek, se utiliza un enfoque de refuerzo de aprendizaje, donde el modelo original genera respuestas y aprende cuál es la mejor a través de la retroalimentación. Huang menciona que el modelo DeepSeek-R1 se desarrolló a partir de un interesante intercambio de preguntas y respuestas entre dos modelos de IA, lo que llevó a una capacidad de razonamiento más avanzada.
Sin embargo, el misterio persiste: la compañía no ha revelado detalles sobre el hardware que se utilizó para entrenar estos modelos. Esto resalta el argumento de Huang, ya que el éxito de DeepSeek no solo depende de su arquitectura de software, sino también de la potencia de los servidores que lo respaldan. ¿Estarán escondiendo algo más grande detrás de las cortinas?
Por lo tanto, mientras Nvidia parece estar recuperándose de la tormenta, la conversación sobre el verdadero potencial y las capacidades de DeepSeek sigue siendo un tema candente en la comunidad tecnológica. Huang ha dejado claro que, aunque la percepción externa puede haber sido distorsionada, el futuro de la inteligencia artificial sigue siendo brillante y lleno de posibilidades.