Atención. Cuán perjudiciales pueden ser los consejos que dan ChatGPT

El refrán dice que la culpa no es del chancho, sino de quien le da de comer. En este caso el chancho sería la inteligencia artificial generativa en sus diversas presentaciones y el alimento, el que proveen los usuarios con aspiraciones dignas de un cuento de los hermanos Grimm: “Espejito, espejito”. La pantalla que hace las veces de espejo no tarda entonces en responder lo que el solicitante desea escuchar: pura adulación.

Investigadores de la Universidad de Stanford, en Estados Unidos, confirmaron la hipótesis al medir el comportamiento de ChatGPT y otros diez modelos de inteligencia artificial (IA) en su interacción con las personas, y compararon ese circuito con lo que sería el mismo intercambio entre dos seres de carne y hueso. Llegaron a la conclusión de que la respuestas de la IA fueron casi un 50 por ciento más aduladoras y complacientes que las humanas.

Esas sentencias de la IA abren caminos insospechados para la salud mental y la convivencia social. Los chatbots devuelven respuestas y consejos condescendientes incluso en casos en los que los planteos de los usuarios manifiestan conductas reprobables, poco éticas o ilegales. Es precisamente ese condimento -según se desprende del trabajo titulado «La IA aduladora disminuye las intenciones prosociales y promueve la dependencia»- lo que vuelve “adictivo” el vínculo con un interlocutor programado para validar casi cualquier desatino.

El experimento incluyó cuatro modelos de IA pertenecientes a OpenAI, Anthropic y Google; y siete modelos de Meta, Qwen, DeepSeek y Mistral. “En nuestros experimentos con humanos, incluso una sola interacción con una IA aduladora redujo la disposición de los participantes a asumir responsabilidades y resolver conflictos interpersonales, al tiempo que aumentó su propia convicción de que tenían razón. Sin embargo, a pesar de distorsionar el juicio, los modelos aduladores fueron confiables y preferidos”, dicen los investigadores, que publicaron su trabajo en la revista Science.

Para citar sólo un ejemplo, en un experimento compararon las respuestas de asistentes de IA populares con la sabiduría colectiva de humanos en un foro de consejos de Reddit. ¿Estaba bien, por ejemplo, dejar basura colgando de una rama de un árbol en un parque público si no había tachos de basura cerca? ChatGPT culpó al parque por no tener tachos, no a la persona que preguntaba -y tiraba basura-, a quien calificó de “encomiable” por siquiera buscar un cesto. Las personas reales pensaron distinto en el foro de Reddit, para calificar al consultante de “imbécil”.

“Todos estos efectos persistieron al controlar rasgos individuales como datos demográficos y familiaridad previa con la IA; fuente de respuesta percibida; y estilo de respuesta. Esto crea incentivos perversos para que la adulación persista: la misma característica que causa daño también impulsa la participación”, agregan los autores.

Luego señalan lo que parece configurar el punto central del problema: “La adulación puede mermar la capacidad de los usuarios para autocorregirse y tomar decisiones responsables. Sin embargo, dado que es la preferida por los usuarios e impulsa la participación, ha habido pocos incentivos para que la adulación disminuya. Nuestro trabajo subraya la necesidad urgente de abordar la adulación hacia la IA como un riesgo social para la autoimagen y las relaciones interpersonales de las personas, mediante el desarrollo de mecanismos específicos de diseño, evaluación y rendición de cuentas”.

Y hacen un llamamiento a los desarrolladores de estas tecnologías y a quienes deben controlarlos: “Nuestros hallazgos demuestran que decisiones de diseño e ingeniería aparentemente inocuas pueden tener consecuencias negativas, por lo que estudiar y anticipar cuidadosamente los impactos de la IA es fundamental para proteger el bienestar a largo plazo de los usuarios”.

Punto de Partida

Programa

Pedro García