Estudio revela que motores de búsqueda AI citan fuentes incorrectas en un 60 por ciento de los casos

15 marzo, 2025

Un análisis reciente destaca preocupantes fallos de precisión en los motores de búsqueda impulsados por inteligencia artificial, lo que podría afectar la forma en que consumimos noticias.

Los motores de búsqueda basados en inteligencia artificial están enfrentando serios problemas de precisión, según un estudio realizado por el Tow Center for Digital Journalism de la Columbia Journalism Review. Este análisis reveló que más del 60 por ciento de las consultas sobre fuentes de noticias resultaron en respuestas erróneas, un hallazgo alarmante que plantea dudas sobre la confiabilidad de estas herramientas.

En el informe, los investigadores Klaudia Jaźwińska y Aisvarya Chandrasekar señalaron que aproximadamente 1 de cada 4 estadounidenses utiliza modelos de IA como alternativas a los motores de búsqueda tradicionales. Con un índice de error tan alto, es natural preguntarse: ¿qué tan seguras son estas fuentes de información?

La investigación abarcó ocho herramientas de búsqueda impulsadas por IA, las cuales mostraron variaciones significativas en sus tasas de error. Por ejemplo, Perplexity falló en el 37 por ciento de las consultas, mientras que ChatGPT Search cometió errores en el 67 por ciento de los casos, identificando incorrectamente 134 de 200 artículos. La peor actuación la tuvo Grok 3, con un asombroso 94 por ciento de errores.

Desafíos en la citación y control por parte de los editores

Los investigadores no solo se centraron en la precisión de las respuestas, sino que también exploraron la forma en que estas herramientas manejan las citaciones. Se descubrió que algunos motores de búsqueda ignoraron las configuraciones del Robot Exclusion Protocol, que los editores utilizan para restringir el acceso no autorizado.

Un ejemplo notable fue Perplexity, que identificó correctamente todos los extractos de contenido de National Geographic, a pesar de que esta última había prohibido explícitamente el acceso a sus rastreadores web.

Cuando estos motores de búsqueda citan fuentes, a menudo redirigen a los usuarios a versiones sindicadas en plataformas como Yahoo News, en lugar de llevarlos a los sitios originales de los editores. Este fenómeno se dio incluso en situaciones donde existían acuerdos de licencia formales entre los editores y las empresas de IA.

Otro problema que emergió fue la fabricación de URL. Más de la mitad de las citaciones provenientes de Google’s Gemini y Grok 3 llevaron a páginas de error debido a enlaces rotos. De 200 citaciones analizadas de Grok 3, 154 resultaron en enlaces no funcionales.

Las implicaciones de estos hallazgos son significativas para los editores, quienes se enfrentan a decisiones difíciles.

Bloquear a los rastreadores de IA podría resultar en la pérdida total de atribuciones, mientras que permitir su acceso puede llevar a un uso generalizado del contenido sin generar tráfico hacia sus propios sitios web.

Mark Howard, director de operaciones de Time, expresó su preocupación sobre la necesidad de transparencia y control sobre cómo se presenta el contenido de la revista en las búsquedas generadas por IA. Sin embargo, también mostró optimismo sobre el futuro, afirmando que «hoy es el peor día que tendrá el producto«, destacando los esfuerzos de inversión y desarrollo para mejorar estas herramientas. Aunque en lo personal… la pregunta es ¿hacia el bolsillo de quién se dirigen esas mejoras?

A pesar de los problemas, Howard hizo un llamado a la responsabilidad del usuario, sugiriendo que aquellos que creen ciegamente en la precisión de estos productos gratuitos deberían cuestionar su juicio. OpenAI y Microsoft respondieron al estudio, reconociendo los hallazgos pero sin abordar directamente los problemas específicos planteados. OpenAI destacó su compromiso de apoyar a los editores mediante la generación de tráfico a través de resúmenes, citas y enlaces claros.

Este informe se suma a investigaciones anteriores que ya habían señalado problemas similares en la forma en que ChatGPT maneja contenido relacionado con noticias.

Deja el primer comentario