Los estudios mal diseñados o mal ejecutados pueden exagerar el efecto real de un tratamiento, haciéndolo parecer más beneficioso o perjudicial de lo que en realidad es. Si este error se repite una y otra vez, decimos que se trata de un error sistemático (sesgo) y que los resultados están sesgados.
Pensemos en un estudio sobre un tratamiento para controlar la presión arterial. Los investigadores miden la presión con un aparato (esfingomanómetro) que no está bien calibrado y da una medición de 10 milímetros de mercurio (mm Hg) por encima del valor real. En este caso, hay un error sistemático o sesgo porque siempre da la misma medida incorrecta por la mala calibración del instrumento de medición.
Del mismo modo, no podemos confiar en aquellos estudios de los que sospechamos que están mal realizados (riesgo de sesgo). Ni tampoco podemos confiar en las recomendaciones que se basan en estudios sesgados.
Por ejemplo, en un ensayo clínico los pacientes se asignan aleatoriamente al grupo que recibe el tratamiento o al grupo que no lo recibe o recibe otro tratamiento (grupo control). Pero si los investigadores o participantes que miden o informan de los resultados del estudio conocen qué tratamiento está recibiendo cada participante, podrían sesgar sus mediciones y proporcionar resultados más favorables para el brazo de interés. Esto se conoce como sesgo de medición.
El sistema GRADE evalúa hasta qué punto las limitaciones de los estudios incluidos en una revisión sistemática pueden sesgar los resultados. Existen diversas herramientas para evaluar el riesgo de sesgo según el diseño del estudio (ensayos clínicos aleatorizados, estudios observacionales, etc). Estas herramientas evalúan el riesgo de sesgo de cada estudio de manera individual.
Cuanto mayor sea la sospecha de que los resultados están sesgados, menor será la certeza de la evidencia.
Preguntas frecuentes
- ¿Qué deficiencias en los ensayos clínicos pueden aumentar el riesgo de sesgo y, por tanto, disminuir la certeza de la evidencia?
Algunas de las más habituales son las siguientes:
- Si los encargados de incluir participantes en el estudio pueden predecir o anticipar a qué grupo de tratamiento será asignado el participante, existe sesgo de selección. Es importante evitar este tipo de sesgo, para garantizar que no haya diferencias sistemáticas entre los grupos. Por ejemplo, podría darse el caso de que la mayoría de los participantes más graves se concentren en un determinado grupo del estudio, o que la mayoría de los participantes más jóvenes se concentren en un grupo.
- Si los investigadores que llevan a cabo los procedimientos del estudio saben qué tratamiento está recibiendo cada participante, podrían cambiar su conducta y sus procedimientos de manera inconsciente. Por ejemplo, podrían realizar más pruebas o análisis a aquellos participantes que se sabe que están recibiendo el tratamiento de interés, lo que se conoce como sesgo de ejecución.
- Si los investigadores o participantes que miden o reportan los resultados del tratamiento, especialmente aquellos que podrían verse influenciados por su subjetividad, saben qué tratamiento está recibiendo cada participante, podrían sesgar sus mediciones y proporcionar resultados más favorables para el brazo de interés. Esto se conoce como sesgo de medición.
- Si los encargados de incluir participantes en el estudio pueden predecir o anticipar a qué grupo de tratamiento será asignado el participante, existe sesgo de selección. Es importante evitar este tipo de sesgo, para garantizar que no haya diferencias sistemáticas entre los grupos. Por ejemplo, podría darse el caso de que la mayoría de los participantes más graves se concentren en un determinado grupo del estudio, o que la mayoría de los participantes más jóvenes se concentren en un grupo.
- ¿Qué criterios se siguen para estimar el riesgo de sesgo?
El sistema GRADE considera que el riesgo de sesgo puede ser bajo, poco claro y alto. En la siguiente tabla se resumen los criterios para estimar el riesgo de sego
Riesgo de sesgo | Interpretación | Consideraciones | Evaluación GRADE | |
---|---|---|---|---|
Bajo | La mayor parte de la información proviene de estudios con bajo riesgo de sesgo. | Es poco probable que el sesgo potencial altere seriamente los resultados. | Sin limitaciones aparentes | No hay limitaciones serias, no baje la calidad de la evidencia |
Poco claro | La mayor parte de la información proviene de estudios con riesgo de sesgo bajo o incierto (poco claro). | El potencial sesgo plantea algunas dudas sobre los resultados. | Es poco probable que las posibles limitaciones reduzcan la confianza en la estimación del efecto. | No hay limitaciones serias, no baje la calidad de la evidencia |
Es probable que las posibles limitaciones reduzcan la confianza en la estimación del efecto | Limitaciones serias, bajar un nivel | |||
Alto | La proporción de información de estudios con alto riesgo de sesgo es suficiente para afectar la interpretación de los resultados. | Sesgo plausible que debilita seriamente la confianza en los resultados. | Limitación crucial para un criterio, o algunas limitaciones para múltiples criterios, suficiente para reducir la confianza en la estimación del efecto. | Serias limitaciones, bajar un nivel |
Limitación crucial para uno o más criterios suficientes para reducir sustancialmente la confianza en la estimación del efecto | Limitaciones muy serias, bajar dos niveles |
Para saber más
- Manual GRADE (versión en español 2017): Limitaciones en el estudio (Riesgo de sesgo).