La intel·ligència artificial continua donant passos sorprenents i la darrera innovació de DeepMind n’és prova. La companyia ha revelat els seus nous models de IA sota el nom de Gemini Robotics, marcant un hito en la creació de robots que no només són útils, sinó que també poden interactuar de manera més natural amb el seu entorn.
Des del seu llançament a finals de l’any passat, Gemini 2.0 ha estat la força impulsora darrere de diversos productes de Google, incloent un innovador chatbot. Però ara, DeepMind es proposa portar aquesta tecnologia a un nou nivell, enfocant-se en el desenvolupament de robots que tinguin la capacitat de realitzar tasques complexes, com ara doblar origami o tancar bosses Ziploc. T’imagines un robot que pugui entendre instruccions en llenguatge quotidià i adaptar-se a situacions imprevistes?
Què fa únics els nous models de Gemini?
Segons DeepMind, els sistemes d’IA per a robots han de sobresortir en tres àrees fonamentals: generalitat, interactivitat i destresa. La generalitat es refereix a la capacitat d’un robot per adaptar-se a situacions noves que no van ser contemplades durant el seu entrenament. D’altra banda, la interactivitat abasta com un robot respon a les persones i al seu entorn, mentre que la destresa es relaciona amb l’habilitat per realitzar tasques que requereixen precisió i habilitats motores fines.
DeepMind destaca que, tot i que les seves investigacions prèvies ja van mostrar avenços en aquestes àrees, Gemini Robotics representa un salt significatiu en rendiment. Per exemple, el robot ALOHA 2, potenciant per aquesta nova tecnologia, pot no només seguir instruccions simples, sinó també gestionar obstacles en temps real, com quan un investigador interfereix en la seva tasca de col·locar fruites en un tupper.
A més, DeepMind està col·laborant amb Apptronik, l’empresa darrere del robot bíped Apollo, per desenvolupar la pròxima generació de robots humanoides. Juntament amb això, llancen també Gemini Robotics-ER, un model dissenyat perquè els robòtics puguin implementar els seus propis programes utilitzant les avançades capacitats de raonament de Gemini. Aquesta eina estarà disponible per a un grup selecte de “provadors de confiança”, incloent Boston Dynamics, una subsidiària de Google.
Amb aquestes iniciatives, DeepMind no només està expandint les fronteres de la robòtica, sinó que també està establint les bases per a una nova generació de màquines que prometen ser cada vegada més útils en les nostres vides diàries.