ChatGPT-4o supera a investigadores humanos en redacción de resúmenes en lenguaje sencillo para revisiones Cochrane

Un estudio publicado el 28 de julio en la revista Cochrane Evidence Synthesis and Methods ha concluido que ChatGPT-4o supera a los investigadores humanos en la redacción de resúmenes en lenguaje sencillo para revisiones Cochrane.

El estudio comparó 18 resúmenes del lenguaje sencillo generados por ChatGPT‑4o frente a 18 redactados por investigadores humanos, todos correspondientes a análisis publicados por Cochrane. Tras evaluaciones a ciegas realizadas por lectores profanos y miembros del grupo editorial de Cochrane, los resultados mostraron que los resúmenes generados por ChatGPT‑4o obtuvieron puntuaciones significativamente mayores en información (diferencia de 1 punto), nivel de detalle (1 punto) y legibilidad (2 puntos).

Los evaluadores encontraron difícil distinguir los resúmenes elaborados por ChatGPT o por humanos, y solo el 20 % identificó correctamente su autoría. Además, el 64 % de los evaluadores preferiría publicar estos resúmenes hechos con inteligencia artificial frente al 36 % que eligió los elaborados por humanos.

Los autores del artículo concluyen que "ChatGPT-4o muestra potencial para elaborar resúmenes en lenguaje sencillo de revisiones Cochrane al menos tan bien como los humanos y, en algunos casos, incluso ligeramente mejor". Y añaden: "Este estudio sugiere que ChatGPT-4o podría convertirse en una herramienta para redactar resúmenes comprensibles de revisiones Cochrane con una calidad cercana o equivalente a la de los autores humanos".