新闻公告

News

首页 · 新闻公告 · 北邮要闻 · 正文

我校教师王光宇在国际顶级期刊《Nature》子刊发文 提出肺部疾病的通用智能识别框架,发布国内首个大型胸部X光片数据集

发布时间 : 2021-05-01 14:29 出处 : 信息与通信工程学院 点击数 :

4月15日,北京邮电大学信息与通信工程学院王光宇(研究员、博导)在顶级国际学术期刊《自然》子刊 (Nature Biomedical Engineering)在线发表文章,提出了基于X-ray影像的肺部疾病通用智能识别框架,并对肺炎进行检测和严重程度评估。此智能系统通过了多中心、真实世界场景的临床验证,并且在新冠肺炎的智能分诊的科技应对疫情过程中发挥作用。此项工作的代码和数据集发布到了国家生物信息中心云平台,是目前国内最大规模、多临床场景的胸部X光片数据集,希望进一步推动信息领域与生物医学的创新交叉研究工作。

本论文由北京邮电大学等国内外多家机构合作完成,王光宇为第一作者及通讯作者,北京邮电大学为第一完成单位1这也是我校首次以第一完成单位在该期刊发表研究成果。

图1. 真实世界场景下肺部疾病的通用智能识别框架

目前,基于数据驱动的人工智能方法在医学影像的领域中不断突破。然而在复杂、开放的真实场景下进行临床验证时,仍存在诸多挑战。尤其是在新冠疫情期间,各国的计算机科学家们发布了上千种机器学习算法,认为这些算法能根据胸部 X 光片、CT 图像诊断或预测新冠肺炎。然而剑桥大学的一项研究发现,由于算法偏见和不可重复性等问题,科学论文和预印本提到的相关机器学习算法很少具有潜在的临床应用价值2。为解决智慧医疗场景中所面临的这些挑战,团队从鲁棒的AI框架设计、高质量的数据集构建,多中心临床验证等层面开展深入的研究工作,并经过了严格的同行评议过程。对此项研究成果,王光宇老师也应期刊编辑邀请在Nature Portfolio Community以《Building an intelligent diagnosis system for the real-world clinical applications using chest X-ray images》为题发表发表评论和深度解读3

具体地,对放射科医师来说,要在胸片上发现肺炎并进一步鉴别诊断是很困难的。尤其在疫情期间,影像是重要的辅助诊断工具。相较在标准实验室里进行的分子检测,X-ray扫描的速度快,也能更直观地观察到肺部的病理学特征及变化。开发智能影像AI系统可以帮助放射科医生和医生进行快速诊断并预测危重等级,这在医疗系统超负荷的情况下具有尤其重要的临床应用价值。在方法层面,研究团队提出了基于胸部X-ray图像的通用处理框架。由于X-ray拍摄容易出现扭曲、变形、饰物遮挡等问题,通过关键点检测,智能矫正和肺部-病灶分割等模块,可以将X-ray图像进行自动的预处理和标准化。此外,临床影像报告的叙述中包含许多身体部位和健康状况的关键信息,是临床诊断和疾病治疗证据的主要组成部分。我们基于影像报告,通过自然语言处理(Natural language processing, NLP)技术抽取了影像发现(Radiologist findings)和疾病标签, 包括肺炎、胸腔积液、肺肿块等等。由于同一张X-ray影像中多种影像发现/疾病常常并存,研究团队设计了新颖的多标签分类模型,可以对临床场景下的肺部疾病进行精准识别。最终,该智能识别系统经受住了真实世界研究的考验--在来自4个队列的不同临床场景,及多国家的数千张外部影像数据上,进行回顾性和前瞻性测试均具有良好的泛化性能。

图2. AI 系统辅助临床流程

在这项工作中,科研团队采用了多源多中心的14万张胸部X-ray图像构建了深度学习系统。这是国内乃至世界上最大规模的多临床场景胸部X-ray影像数据集4。已有的开源胸部X-ray数据来源于国外住院人群,如斯坦福大学团队发布的ChestX-ray14。相比较于已有开源数据集,我们这个数据集包括了多种临床真实场景和人群,如住院、门诊、体检。比如,其中的体检数据集包含大量健康数据,门诊包含不同肺部异常的轻症患者,可以供研究者对健康人群建模,构建疾病异常检测AI系统。该研究数据集已经通过国家生物信息中心平台发布,以协助来自不同国家和地区的研究团队和临床医生开展研究。

王光宇,研究员,博士生导师。研究方向为人工智能与生物医学大数据,智慧医疗、医学信息学。在Cell、Nature Biomedical Engineering、Nature Communications等国际著名期刊发表学术论文多篇。如,科技抗疫中实行了新冠病毒肺炎的智能诊断及重症预测技术,引领了全球在这个方向的创新研究;开展了面向多源异构医学电子文本的跨医院、跨科室的信息智能抽取等重大技术挑战的研究,相关成果已发表在国际顶级期刊与会议上。主持或参与多项国际或国内合作项目,包括国家重点研发计划《医学人工智能产品检测共性关键技术及标准研究》、国家自然科学基金《基于RWS的晕厥临床不良事件风险评估与智能预警关键技术研究》等,致力于以信息技术为内核,解决生物医学问题的重大挑战。

王光宇老师隶属张平院士团队。张平院士团队作为我国网络通信领域的优势团队,面向国家战略需求和交叉学科发展需要,凝聚多学科力量,开展信息科学前沿交叉研究,在工业互联网、智慧医疗“新基建”及培育我国经济发展的新动能方面正不断作出重要贡献。

参考资料

[1] Guangyu Wang*#, Xiaohong Liu*, Jun Shen*, et al. Kang Zhang#, Weimin Li#, Tianxin Lin#. (2021). A deeplearning pipeline for the diagnosis and discrimination of viral, non-viral and COVID-19 pneumonia from chest X-ray images. Nature Biomedical Engineering,https://dx.doi.org/10.1038/s41551-021-00704-1

[2] Roberts, M., Driggs, D., Thorpe, M. et al. Common pitfalls and recommendations for using machine learning to detect and prognosticate for COVID-19 using chest radiographs and CT scans. Nature Machine Intelligence 3, 199–217 (2021).https://doi.org/10.1038/s42256-021-00307-0

[3]https://bioengineeringcommunity.nature.com/posts/building-an-intelligent-diagnosis-system-for-the-real-world-clinical-applications-using-cxr-images

[4]http://miracle.grmh-gdl.cn/chest_xray_ai

分享到