提前五年预测2型糖尿病风险?EHR新突破
在个性化医疗中,电子健康记录(EHR)基础模型已成为关键引擎 ,医疗AI也依靠EHR数据(病历、检验、诊断等)预测住院风险、诊断疾病。
但传统的EHR模型局限于单一数据模态,依赖EHR的医疗AI也正在触顶。
NVIDIA与谷歌旗下的Verily的最新研究,实现了个体化医疗突破。
通过将多基因风险评分(PRS)嵌入电子健康记录(EHR)基础模型,他们打造出了全球首个基因、病历、AI三合一系统。

架构升级:PRS+EHR的融合
过去五年,ETHOS、CLMBR、Delphi等医疗AI主要依赖EHR数据,但缺陷也明显,无法揭示遗传风险,临床指标、影像、生活方式与基因信息间的关系被割裂。仅靠EHR训练出的模型,即使规模巨大,也难以捕捉影响个体健康全貌的基因预设。
这项研究开创性的在EHR基础模型中引入了多基因风险评分(PRS)。
PRS可理解为“基因层面的预测权重”,综合数千个基因位点,计算个体对疾病(如糖尿病、冠心病、抑郁症)的遗传易感性。研究人员提出了两种核心技术来实现融合:
交叉注意力机制(Cross-Attention):借鉴于编码器-解码器的模式,对齐和整合多种模态的表示,让模型能理解基因与症状的对应关系。
适配器模块(Adapter Modules): 通过学习到的适配器模块生成矢量化模态嵌入。对于PRS这种静态模态(如基因组),其嵌入作为前缀被放置在健康轨迹的序列之前 。这种方法避免了传统事后集成的局限性,实现了PRS与EHR数据的原生联合学习,增强了个性化预测能力。简单说就是将静态(基因)与动态(病历)信息通过矢量化嵌入整合,保持时间序列上下文一致。

数据多样化:预测复杂疾病
该模型训练基于All of Us研究项目的数据集,该数据集个由美国国家卫生研究院(NIH)发起,囊括了多元族裔(非裔、亚裔、拉美裔等),尽量去确保其通用性。
All of Us的数据评估结果显示,模型对多种疾病,特别是2型糖尿病、精神分裂症、抑郁症和冠状动脉疾病的预测价值得到了有力证明。该模型在预测2型糖尿病(T2D)时,AUC提升3.6%,精准率(Precision)提升23%,实现了早期预测能力的量化突破。
从临床角度看,这样的底层创新,为患者带来了更早、更准确的疾病预测能力和疾病风险分层 。
当基因数据、EHR、可穿戴设备、心理行为等全部接入时,医疗AI不仅会预测“你可能得病”,更能实时告诉你“如何避免生病”。

加入PRS的模型更适合初诊场景
对于2型糖尿病(T2D)等常见复杂慢性病,基因层面的介入让医疗系统能够对高风险个体进行更早、更准确的识别,从而提前示警。
同时该模型通过自回归生成能为个体生成多条未来健康轨迹,研究人员称这一能力为健康数字孪生,这一数字孪生不仅能预测疾病,更能模拟和试验干预措施(如减重、用药),从而支持前瞻性的医疗决策与仿真。




