– Se lanza el primer LLM en vídeo médico de código abierto del mundo, y se hace un llamamiento a la comunidad global de desarrolladores para que lo impulsen aún más
, /PRNewswire/ — United Imaging Intelligence (UII) ha presentado uAI NEXUS MedVLM, un modelo pionero de lenguaje a gran escala para vídeo médico que ofrece una precisión espacial y temporal sin precedentes en entornos clínicos.
UII ha liberado el código fuente del modelo e introduce un nuevo referente integral para su evaluación en toda la industria. La investigación ha sido aceptada en CVPR 2026, una de las principales conferencias de IA, lo que subraya su reconocimiento por parte de la comunidad global de visión artificial.
uAI NEXUS MedVLM se basa en un conjunto de datos monumental que comprende 531.850 pares de instrucciones de vídeo en 8 escenarios clínicos, incluyendo cirugía robótica, procedimientos laparoscópicos, endoscopia, cirugía abierta y cuidados de enfermería.
Con tan solo 4B/7B parámetros, uAI NEXUS MedVLM supera significativamente a los principales modelos base de propósito general, incluidos GPT-5.4 y Gemini 3.1, en tareas clave de vídeo médico. Alcanza una precisión del 89,4 % en la evaluación de la seguridad quirúrgica, en comparación con GPT-5.4 (1,8 %) y Gemini 3.1 (10,1 %). En la localización espaciotemporal de acciones, ofrece un mIoU hasta 14 veces superior al de GPT-5.4 y 4 veces superior al de Gemini 3.1. En la generación de informes de vídeo, obtiene una puntuación de 4,2 sobre 5, superando sustancialmente a GPT-5.4 (2,5) y Gemini 3.1 (2,4).
(Fuente: Las estadísticas de rendimiento anteriores provienen del artículo de investigación: https://arxiv.org/abs/2512.06581)
Lanzamiento de un desafío global abierto para acelerar la innovación colaborativa
Para impulsar el desarrollo de modelos de aprendizaje automático (LLM) para vídeo médico, UII ha lanzado por fases su conjunto de datos MedVidBench, comenzando con la publicación en código abierto de 6.245 muestras de prueba de referencia rigurosas. Esta iniciativa, que abarca ocho conjuntos de datos quirúrgicos diversos, representa un hito mundial tanto en escala como en precisión clínica.
Los desarrolladores pueden evaluar sus modelos en una clasificación unificada, donde las propuestas se comparan automáticamente con datos de referencia privados. Los resultados se reflejan en una clasificación global que se actualiza continuamente, lo que permite una evaluación del rendimiento transparente y comparable entre los modelos.
UII invita a investigadores, desarrolladores e instituciones sanitarias de IA de todo el mundo a participar en este desafío abierto y contribuir al avance de la inteligencia artificial aplicada al vídeo médico mediante la innovación colaborativa.
Página del Proyecto: https://uii-ai.github.io/MedGRPO/
Impulsando la inteligencia en todo el espectro de tareas de vídeo médico
La comprensión de vídeos médicos ha sido durante mucho tiempo una de las fronteras más formidables de la inteligencia artificial, exigiendo una percepción espacial microscópica, una lógica temporal compleja y una precisión clínica inquebrantable. Históricamente, el progreso se ha visto paralizado por la grave escasez de datos clínicos y el coste prohibitivo de la anotación por parte de expertos.
UII ha superado este obstáculo. Mediante el diseño de un marco de anotación masivo, fotograma a fotograma, en diversos vídeos clínicos, hemos mapeado rigurosamente atributos críticos: trayectorias de instrumentos, posicionamiento espacial, acciones quirúrgicas precisas e indicadores de riesgo cruciales. Esta base de datos sin precedentes dota a uAI NEXUS MedVLM de una plataforma de inteligencia clínica completa y robusta.
Construido sobre esta base, el modelo integra a la perfección percepción, razonamiento y toma de decisiones. Ofrece una localización espacio-temporal de instrumentos de alta precisión y un reconocimiento automatizado de procedimientos, aplicando razonamiento avanzado para transformar secuencias de vídeo complejas en informes clínicos estructurados, descripciones regionales y resúmenes rápidos del flujo de trabajo. Más allá de la observación pasiva, eleva estos conocimientos a una toma de decisiones activa que respalda la predicción del siguiente paso, la evaluación de la habilidad quirúrgica y una evaluación integral del riesgo para la seguridad.
Transformando la innovación de la IA en un impacto clínico real
Diseñado para su implementación clínica, uAI NEXUS MedVLM permite una toma de decisiones más informada y un control de calidad basado en datos en todos los flujos de trabajo quirúrgicos, al tiempo que reduce la curva de aprendizaje para los médicos y mejora la eficiencia y la consistencia de la formación.
De cara al futuro, uAI NEXUS MedVLM puede servir como motor perceptivo y cognitivo central para la IA integrada que opera en el mundo físico. Juntos, forman un sistema de circuito cerrado de percepción visual, razonamiento cognitivo y ejecución física, avanzando hacia un ecosistema sanitario más automatizado, estandarizado e inteligente.
Foto – https://mma.prnewswire.com/media/2964990/image1.jpg
Foto – https://mma.prnewswire.com/media/2964989/image2.jpg


