Los modelos de IA no pueden decir la hora ni leer un calendario, revela un estudio

Estudio muestra que los modelos de IA actuales tienen dificultades con tareas básicas como leer relojes y calendarios
Foto: livescience.com

Estudio muestra que los modelos de IA actuales tienen dificultades con tareas básicas como leer relojes y calendarios

Un estudio presentado en la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR) 2025 y publicado en arXiv ha puesto de manifiesto una limitación significativa en los modelos de inteligencia artificial (IA) multimodales más avanzados, como GPT-4o, Gemini 2.0, Claude-3.5 Sonnet y Llama 3.2-Vision. Los investigadores, liderados por Rohit Saxena de la Universidad de Edimburgo, comprobaron que estos sistemas fallan con frecuencia al interpretar la hora en relojes analógicos y al calcular el día de la semana correspondiente a una fecha dada. En las pruebas, los modelos solo acertaron el 38,7% de las veces al leer relojes y el 26,3% al calcular fechas en calendarios. Según los autores, esto se debe a que tales tareas requieren razonamiento espacial y lógico, habilidades que no se desarrollan suficientemente en los modelos entrenados principalmente con ejemplos etiquetados y patrones de datos. Además, el estudio resalta que la IA no realiza cálculos matemáticos como un ordenador tradicional, sino que predice respuestas basándose en patrones, lo que limita su capacidad para tareas que exigen lógica o razonamiento abstracto. Los resultados subrayan la necesidad de mejorar los datos de entrenamiento y los métodos de razonamiento de la IA, especialmente para aplicaciones críticas y sensibles al tiempo, y advierten sobre la importancia de mantener la supervisión humana en tareas donde la precisión es esencial.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *