El codi que va revolucionar la intel·ligència artificial ara disponible per descarregar

26 març, 2025

El Computer History Museum i Google han alliberat el codi d’AlexNet, un avanç clau en la IA que va transformar la visió per ordinador.

Un hito en la intel·ligència artificial ha estat assolit amb la lliberació del codi font d’AlexNet, la innovadora xarxa neuronal creada el 2012. Aquesta iniciativa, portada a terme pel Computer History Museum en col·laboració amb Google, permet a investigadors i desenvolupadors explorar el sistema que va transformar la manera en què les màquines reconeixen imatges.

La travessia d’AlexNet va començar a la Universitat de Toronto, on un equip d’investigadors liderat per Alex Krizhevsky, Ilya Sutskever i Geoffrey Hinton, va donar vida a aquest revolucionari model. Després de cinc anys de negociacions, el codi està disponible gràcies a que Google va adquirir DNNresearch el 2013, cosa que li va atorgar els drets sobre aquesta obra mestra de la intel·ligència artificial.

Un equip petit i el seu gran impacte en la visió per computadora

AlexNet no va sorgir d’un entorn corporatiu, sinó d’un petit grup d’acadèmics a Canadà. La combinació de xarxes neuronals profundes, la base de dades ImageNet i l’ús de processadors gràfics (GPU) va permetre que aquest sistema assolís nivells de precisió sense precedents en el reconeixement d’imatges. Però, què el feia tan especial?

La capacitat d’AlexNet per classificar imatges en mil categories, que anaven des de fruites fins a vehicles, va ser considerada un canvi de joc en el seu moment. Experts com Yann LeCun han destacat aquest avanç com un “canvi de paradigma”.

A diferència de les metodologies anteriors que depenien de la programació manual, AlexNet aprenia per si mateix, identificant patrons i característiques dels objectes a les imatges. Aquest enfocament automàtic va marcar una clara distinció amb els mètodes tradicionals, que requerien instruccions explícites.

En essència, un codi neuronal és un programari que pot aprendre i adaptar-se, imitant el funcionament del cervell humà. Aquest tipus de programació no segueix ordres rigoroses, sinó que permet a les màquines comprendre i reconèixer patrons, millorant la seva efectivitat amb el temps. Així, un programa neuronal pot aprendre a identificar un gat després d’haver estat exposat a milers d’imatges de felins, deduint característiques comunes sense necessitat d’instruccions detallades.

Les aplicacions d’aquesta tecnologia són vastes i diverses. Des del reconeixement de veu fins a la detecció de fraus, passant pel diagnòstic mèdic, l’impacte d’AlexNet es fa sentir en múltiples dominis. Aquesta capacitat per “pensar” de manera flexible ha estat fonamental per al desenvolupament de les aplicacions d’intel·ligència artificial que avui utilitzem.

Un nou capítol en la investigació d’intel·ligència artificial

El fet que el codi font d’AlexNet estigui ara accessible a GitHub representa un canvi significatiu per a la comunitat científica. Aquest recurs no només documenta els inicis de l’aprenentatge profund, sinó que també es converteix en una eina fonamental per a futures investigacions.

Amb més de 172,000 cites a Google Scholar, l’article sobre AlexNet ha estat un pilar en el desenvolupament de tecnologies d’avantguarda, que inclouen sistemes de llenguatge, sintetitzadors de veu i generadors d’imatges. La velocitat de les seves contribucions ha estat sorprenent, fins al punt que Geoffrey Hinton va ser guardonat amb el Nobel de Física el 2024 per les seves contribucions a l’aprenentatge automàtic, resumit en la seva famosa frase: “Ilya va pensar que hauríem de fer-ho, Alex ho va fer funcionar i jo vaig rebre el premi Nobel”.

Recentment, Dario Amodei, CEO d’Anthropic, va expressar la seva preocupació pel espionatge industrial relacionat amb avenços en intel·ligència artificial, suggerint que algunes línies de codi podrien valer milions. No obstant això, el que s’ofereix aquí és una oportunitat única: l’accés al codi complet que va permetre a un grup d’investigadors canviar el rumb de la intel·ligència artificial amb només unes poques línies de codi.

Deixa el primer comentari