Google DeepMind presentó un co-clínico de IA el 01 de mayo de 2026, una iniciativa de investigación diseñada para examinar cómo los sistemas de IA multimodales podrían apoyar de manera más efectiva a trabajadores de la salud y a pacientes. El proyecto aborda la creciente presión sobre los sistemas de salud en todo el mundo para mejorar los resultados, reducir costos y ampliar el acceso a la atención en medio de una escasez proyectada de más de 10 millones de trabajadores de la salud para 2030, según la Organización Mundial de la Salud.
El nuevo sistema pretende explorar un modelo de “atención triádica”, en el que un agente de IA trabaja junto a un médico y un paciente en lugar de reemplazar el juicio clínico. DeepMind indicó que el objetivo es construir herramientas que puedan extender el alcance de los clínicos manteniendo a los doctores bajo control sobre las decisiones. La empresa enmarcó el esfuerzo como el siguiente paso en su investigación de IA médica, después de sistemas anteriores como MedPaLM, que se centró en pruebas de conocimiento médico, y AMIE, que realizaba consultas simuladas basadas en texto.
Una característica clave del co-clínico de IA es su capacidad para procesar más que texto. El sistema se probó con audio y video en vivo, lo que le permitió observar señales físicas como la marcha, los patrones de respiración y cambios visibles en la piel. En simulaciones de telemedicina, el modelo pudo guiar a los pacientes a través de partes de un examen físico y ayudar con tareas como revisar la técnica del inhalador o ayudar a identificar una lesión en el hombro. Esas capacidades sugieren que la IA multimodal podría, eventualmente, apoyar consultas remotas en las que la observación visual y auditiva importa.
DeepMind destacó los controles de seguridad incorporados en el sistema. El co-clínico de IA utiliza un diseño de doble agente en el que un “Planificador” revisa continuamente la interacción y comprueba si el “Orador” se mantiene dentro de límites clínicos. La compañía afirmó que esta estructura está pensada para reducir salidas inseguras y mejorar la fiabilidad en entornos médicos, donde la precisión factual y la contención son esenciales.
El equipo de investigación evaluó el sistema de varias maneras. En una prueba, adaptaron el marco de seguridad NOHARM para medir tanto respuestas incorrectas como fallos al no presentar información importante. En comparaciones ciegas que involucraron 98 consultas de atención primaria, el sistema registró cero errores críticos en 97 casos y fue preferido por médicos frente a otras herramientas de síntesis de evidencia. DeepMind señaló que esto sugiere que el modelo puede ser útil para clínicos que buscan información clínica fundamentada y de alta calidad.
El estudio también examinó qué tan bien el sistema manejó preguntas relacionadas con medicamentos usando el benchmark OpenFDA RxQA, diseñado para poner a prueba conocimientos y razonamiento sobre fármacos y tratamientos. En evaluaciones de respuesta abierta, el co-clínico de IA superó a otros modelos de vanguardia, lo que indica progreso en un área que es especialmente importante para la planificación cotidiana de la atención.
En simulaciones orientadas a pacientes, sin embargo, los doctores humanos siguieron desempeñándose mejor en general. Trabajando con médicos académicos de Harvard y Stanford, el equipo de investigación ejecutó un estudio aleatorizado que involucró 20 escenarios clínicos sintéticos y 10 actores médicos-pacientes. En más de 140 áreas evaluadas, los médicos superaron a la IA al detectar señales de alarma y al dirigir exámenes físicos, aunque el sistema igualó o superó el desempeño de los médicos en 68 categorías, incluyendo triaje. Los hallazgos sugieren que la herramienta puede ser más valiosa como sistema de apoyo que como sustituto de la experiencia clínica.
DeepMind señaló que el objetivo más amplio es desarrollar IA que pueda ayudar a los médicos de maneras confiables, fundamentadas clínicamente y adaptables a entornos reales de atención. La compañía continúa con colaboraciones de investigación en varios países, incluidos Estados Unidos, India, Australia, Nueva Zelanda, Singapur y los Emiratos Árabes Unidos, mientras trabaja para probar el sistema en entornos de salud más diversos.