“这个孩子不到14岁。他以前曾因结缔组织异常而在北京访问过骨科,例如扁平脚和脚踝腔。医生认为,由于涉嫌基于儿童的韧带放松和外部特征,他遭到了Mafan综合征的怀疑。基因测试未检测到Mafan,眼睛中没有镜头损失。”
最近,该国稀有疾病领域的第一个人工智能模型“协和陶库”向患者开放。随着“孩子有什么疾病?”的混乱,他(化名)将孩子的病情进入模型的对话框。
与他对这些医院的判断不同,“协和陶库”给出了其他疾病:鉴于患者的基因检测是阴性的,眼睛中没有典型的病变,因此也有必要专注于对Loeys-Dietz综合综合征和先天性结缔组织下肿瘤综合症综合征的研究。建议结合多个基因面板重新测试,例如FBN1/TGFBR1/TGFBR2。
在诊断出疾病的同时,大型模型还提供了医疗建议和建议的医疗部门,并建议他让孩子接受许多补充检查,例如全身磁共振血管成像检查和皮肤活检病理学检查。
马凡氏综合症是中国“第一种罕见疾病目录”中的一种疾病,在中国的发病率约为1/20,000-1/10,000。在罕见疾病的领域,由于少数单疾病患者及其临床表型可能与其他罕见或常见疾病相混淆,因此有很多患者误诊并反复寻求治疗,就像他的牙的孩子一样。
AI模型的干预使可能破坏了僵局。
在缺乏罕见疾病的医生和绝大多数医院缺乏诊断罕见疾病的多学科联合诊断的能力的情况下,使用AI最初是可靠的吗?大型模型给出的诊断推理逻辑链可以与经验丰富的稀有医生相提并论吗?单型罕见疾病的患者很少见。小样本中的培训会影响模型性能吗?
2025年2月28日是第18个国际稀有疾病日。考虑到以上问题,第一日报与“ Concord and Taichu”的研发团队进行了深入的对话 - 中国科学院自动化研究所的北京联合医学院医院和相关专家。
符合中国人口特征的第一个国际稀有疾病模型
2025年2月16日,由北京联合医学院医院和中国科学院自动化协会共同开发的“康科德陶将”罕见模型已在两年的技术研究后正式进入临床申请阶段。
“ Concordon Taichu”基于Concord在过去的一个世纪中积累的高质量临床记录,专家诊断和治疗逻辑,权威医学知识库(教科书/指南/稀有疾病文献)以及科学研究和教学数据集,从而从临床决策中实现了对药物临床试验管理的临床决策辅助。
第一金融新闻了解到,在开发大型模型之前,北京联合医学院医院已经有了人工智能球螺旋体。应用效果和方法已经发表,可以促使具有副资历或以上的医生以诊断罕见疾病,准确率为80%。在临床应用“ Concord Taichu”临床应用之前,它是在北京联合医学院医院的罕见疾病联合门诊诊所进行的一年,大型模型的相互作用能力可以进一步提高这一水平。
“进入临床应用后,患者的自然语言提供了多少有效信息取决于诊断的准确性。从过去两周中我们收集的500多个患者使用记录来看,大型模型给出了最初的筛查结论,基本上是可靠的。”国家主要科学技术基础设施(Peking Union)的虚拟人类研究平台主任Jin Ye告诉First Financial Daily。
尽管很少有单型疾病的患者,但疾病类型多种多样,全球罕见患者人数多达4亿。罕见疾病的较少,较少的医生可以诊断出罕见的疾病。一些调查表明,我国罕见疾病的误诊率也超过40%,平均诊断时间超过4年,诊断和治疗的同质性较差。此外,罕见疾病的患者通常会迅速发展。更有效的诊断路径意味着它可能为患者带来显着的生存益处和生活质量的改善。
近年来,AI技术在医疗领域的应用显示出很大的潜力,但是在罕见疾病的领域,由于缺乏数据,知识信誉低以及不透明的决策逻辑,传统的AI模型很难满足诊断和治疗罕见疾病的需求。
“协和泰古”大型模型可以通过互动对话模拟专业医生的逻辑推理链,从而为患者提供了复杂表型的初步筛查。同时,根据患者的基本疾病病程的分类,它为补充检查和测试提供了建议。患者可以根据模型建议在本地改善临床检查,并促使第一个医生考虑罕见疾病的可能性。
“这意味着,通过支持不同级别的医疗机构的建议,以根据国家直接报告数据进行分层管理和双向转诊,并可以优化患者的医疗治疗路径,并可以减轻患者的医疗负担。”金你说。
她认为,2019年,国家卫生委员会在全国范围内部署了一个合作网络,用于诊断和治疗罕见疾病。作为唯一的国家领导部门,北京联合医学院医院承担了协作网络医院和公共福利基因检测的转诊,咨询和教学的任务。目前,该网络覆盖了全国400多家医院。在此基础上,大型模型可以优化和提高医疗机构合作的效率,自由和合理性。
同时,在高诊断率和罕见疾病的诊断率遗漏的情况下,不容忽视的问题是罕见疾病医生的稀缺性。医生的专业版本可以显示从症状到诊断的关键节点和分支逻辑。视觉决策过程不仅可以为患者提供科学有效的诊断和治疗建议,而且还可以帮助医生快速掌握诊断和治疗思想。
Jin Ye认为,任何AI工具都无法替代医生在诊断和治疗中的作用。但是,与国家和省级领先医院的医生相比,大型模型有助于提高小学医生的诊断和治疗能力。通过人机合作,主要专家还可以进行高级诊断和治疗。
如何抑制AI幻觉?
数据是大型模型的基础。一般而言,其质量和数量直接影响大型模型的性能和准确性。但是,第一个财务日报得知,“ Concordum Taichu”用于学习的数据量并不大。
Jin Ye解释说,一般的大型模型通常需要使用最经典的教科书和大量数据来实现培训和调整。但是,罕见疾病领域中有许多类型的疾病,有些疾病通常在全球范围内只有少量或十二例。甚至可以说,“有数百例案例”是国际社会中最大的临床人群。因此,罕见疾病的纪律特征和数据大小确定它本质上不是一般大型模型的首选解决方案区域。
“如何解决技术中小样本学习的问题?如何通过推理和结合知识来快速地束缚疾病的特征?采用哪种诊断逻辑?可以在稀有疾病和具有相似表型的常见疾病之间进行分化诊断?这些是应用困难和技术困难。”金你说。
为此,联合跨学科大型模型团队开发了诸如主动感知互动,差异诊断和“数据 +知识”混合动力驱动器等技术,并引入了DeepSeek-R1的深度推理能力。
团队的研发工程师接受了采访,认为今年DeepSeek-R1的出现表明,通过加强学习方法,可以有效提高大型模型的推理能力。 “ Concord·Taichu”大型模型采用了由双轮“数据 +知识”驱动的“小样本学习”模型,并结合了大型模型的强大推理能力,并最终实现了可信的辅助决策。
据他说,当学习“协和泰古”大型模型时,通常有必要收集和标记少于50例罕见病病例和类似尺度的常见疾病病例,以最初改善罕见疾病的“学习”。
除了独立的知识迭代外,“可以有效抑制AI幻觉”也是该模型的核心优势之一。避免AI幻觉的核心是用严格筛选的数据和深入控制的知识来限制模型的推理过程。
采访的研发工程师认为,如果没有高质量数据和高精度知识的限制,AI的幻觉将是不可避免的。在互联网平台上,稀有疾病数据非常稀缺。如果允许大型模型通过大量的公共数据学习,则不可避免地会有数据偏差,并且大型模型的诊断推理过程也将产生知识幻觉 - 大型模型可能会使用从Internet数据中学到的自有偏见的知识来完成推理过程。
工程师说:“因此,我们需要使大型模型的诊断决策过程与医生的临床思维高度一致,以避免幻觉。”
“ Concordon Taichu”介绍了DeepSeek-R1的深层推理能力,并将其与北京联合医学院医院的高精度知识和案例相结合,以实现低敏化的AI推理。
Jin Ye说,确保学习数据来自UnionPay不仅是由于数据质量控制考虑因素,而且还因为医院中的这些数据体现了大量专家的基于证据的决策基础和多学科推理的逻辑。
罕见的疾病针对特定的人群,并且在诊断和治疗方面非常严格。需要检查专业机构和医生,因此他们对患者公共服务方法的价值最能反映其价值。
“医学问题相对复杂,容忍度较低,需要谨慎和谨慎对待。我们认为,通过优化知识和案例的培训更加脚踏实地和安全。”金你说。
同时,在应用大型模型之后,有必要连续迭代和优化。将来,研发团队可能会提供“协和泰古”的更多科学研究目的,因此确保高质量数据更为关键。
Jin Ye还提到,对于其他常见疾病,医疗保健和科学AI的AI是相对独立的,但是由于95%的稀有疾病没有有效的药物,因此有必要在稀有疾病领域结合医学和科学和智能应用。 “因此,从'Concorde Taichu'大型模型设计开始时,我们将来考虑了多种可扩展性的可能性,尤其是对科学能力的强大AI的支持。”金你说。