Un estudio publicado el 28 de julio en la revista Cochrane Evidence Synthesis and Methods ha concluido que ChatGPT-4o supera a los investigadores humanos en la redacción de resúmenes en lenguaje sencillo para revisiones Cochrane.
El estudio comparó 18 resúmenes del lenguaje sencillo generados por ChatGPT‑4o frente a 18 redactados por investigadores humanos, todos correspondientes a análisis publicados por Cochrane. Tras evaluaciones a ciegas realizadas por lectores profanos y miembros del grupo editorial de Cochrane, los resultados mostraron que los resúmenes generados por ChatGPT‑4o obtuvieron puntuaciones significativamente mayores en información (diferencia de 1 punto), nivel de detalle (1 punto) y legibilidad (2 puntos).
Los evaluadores encontraron difícil distinguir los resúmenes elaborados por ChatGPT o por humanos, y solo el 20 % identificó correctamente su autoría. Además, el 64 % de los evaluadores preferiría publicar estos resúmenes hechos con inteligencia artificial frente al 36 % que eligió los elaborados por humanos.
Los autores del artículo concluyen que "ChatGPT-4o muestra potencial para elaborar resúmenes en lenguaje sencillo de revisiones Cochrane al menos tan bien como los humanos y, en algunos casos, incluso ligeramente mejor". Y añaden: "Este estudio sugiere que ChatGPT-4o podría convertirse en una herramienta para redactar resúmenes comprensibles de revisiones Cochrane con una calidad cercana o equivalente a la de los autores humanos".