DeepMind presenta Gemini Robotics un avanç en la robòtica amb habilitats sorprenents

16 març, 2025

DeepMind llança models d’IA que prometen revolucionar la robòtica, permetent als robots realitzar tasques complexes i quotidianes.

La intel·ligència artificial continua donant passos sorprenents i la darrera innovació de DeepMind n’és prova. La companyia ha revelat els seus nous models de IA sota el nom de Gemini Robotics, marcant un hito en la creació de robots que no només són útils, sinó que també poden interactuar de manera més natural amb el seu entorn.

Des del seu llançament a finals de l’any passat, Gemini 2.0 ha estat la força impulsora darrere de diversos productes de Google, incloent un innovador chatbot. Però ara, DeepMind es proposa portar aquesta tecnologia a un nou nivell, enfocant-se en el desenvolupament de robots que tinguin la capacitat de realitzar tasques complexes, com ara doblar origami o tancar bosses Ziploc. T’imagines un robot que pugui entendre instruccions en llenguatge quotidià i adaptar-se a situacions imprevistes?

Què fa únics els nous models de Gemini?

Segons DeepMind, els sistemes d’IA per a robots han de sobresortir en tres àrees fonamentals: generalitat, interactivitat i destresa. La generalitat es refereix a la capacitat d’un robot per adaptar-se a situacions noves que no van ser contemplades durant el seu entrenament. D’altra banda, la interactivitat abasta com un robot respon a les persones i al seu entorn, mentre que la destresa es relaciona amb l’habilitat per realitzar tasques que requereixen precisió i habilitats motores fines.

DeepMind destaca que, tot i que les seves investigacions prèvies ja van mostrar avenços en aquestes àrees, Gemini Robotics representa un salt significatiu en rendiment. Per exemple, el robot ALOHA 2, potenciant per aquesta nova tecnologia, pot no només seguir instruccions simples, sinó també gestionar obstacles en temps real, com quan un investigador interfereix en la seva tasca de col·locar fruites en un tupper.

Amplía el contexto:  Demis Hassabis de Google Deepmind anticipa l'arribada de l'AGI en menys de deu anys

A més, DeepMind està col·laborant amb Apptronik, l’empresa darrere del robot bíped Apollo, per desenvolupar la pròxima generació de robots humanoides. Juntament amb això, llancen també Gemini Robotics-ER, un model dissenyat perquè els robòtics puguin implementar els seus propis programes utilitzant les avançades capacitats de raonament de Gemini. Aquesta eina estarà disponible per a un grup selecte de “provadors de confiança”, incloent Boston Dynamics, una subsidiària de Google.

Amb aquestes iniciatives, DeepMind no només està expandint les fronteres de la robòtica, sinó que també està establint les bases per a una nova generació de màquines que prometen ser cada vegada més útils en les nostres vides diàries.

Deixa el primer comentari