国家超级计算天津中心
新闻中心

“天河”系列超级计算机应用成果报道——人工智能眼底筛查研究


根据世界卫生组织在2019年10月发布的《世界视野报告》,全球有超过4.18亿人患有青光眼、糖尿病性视网膜疾病(DR)、年龄相关性黄斑变性(AMD)或其他可能导致失明的眼部疾病。

2019年国家卫生健康委员会数据显示,我国眼科医生的数量仅在四万左右,大部分的眼科医生集中在东部沿海以及一、二线城市。全国平均来看,1名医生大约承担约3万人的眼科疾病治疗工作,眼科医生分布不均衡以及数量不足等问题限制了大规模眼底筛查的普及,除此之外,眼科医生的专业水平和经验也会影响筛查结果。因此,需要使用人工智能技术辅助医生进行眼底筛查,降低筛查时间成本,提高医生筛查效率。

近期,南开大学智能计算系统(NKiCS)研究室李涛教授研究团队基于天河系列超级计算机资源,利用深度学习技术对彩色眼底图像进行分析,作为医生的辅助诊断手段,对医疗行业的发展、推动智慧医疗有着重大的意义。

应用成果

高质量的医疗数据集对于利用深度学习技术实现眼底图像智能分析十分重要,但是医疗数据集涉及到病人的隐私,而且获取难度大、标注成本高。南开大学智能计算系统(NKiCS)研究室李涛教授研究团队联合北京上工医信科技有限公司、中国微循环学会、同仁医院眼科专家组等,共同从来自全国26个省份,近500家临床医院的160多万张眼底图像库中,通过专业人员抽取、眼科专家标注、计算机专家建模评测,发布了面向糖尿病视网膜病变分类和病变点分割的数据集OIA-DDR,以及基于眼底图像的多类型病变分类的数据集OIA-ODIR。

OIA-DDR数据集包含13673张眼底图像,是我国目前最大的公开眼底图像数据集,包含了四种糖尿病视网膜病变相关的病变标注,757张包含像素级和bounding-box级的病变点标注,如图1所示。眼科专家将根据DR严重程度将图像分为5类:无、轻度、中度、严重和增生性DR,第6类是质量较差的图像。该数据集发表在Diagnostic assessment of deep learning algorithms for diabetic retinopathy screening[J]. Information Sciences, 2019。

图1 OIA-DDR数据集中的带有bounding-box标注的示例图像,原始图像位于左侧,标注图像位于右侧,绿色标记表示EX,红色标记表示MA,蓝色标记表示HE,浅蓝色标记表示SE。

OIA-ODIR数据集包含正常眼以及其他7种眼底疾病的标注,是国内首次推出的基于一张眼底图像进行多类型疾病检测的眼底数据集,共有10000张眼底图像,取样人群年龄涵盖全年龄段人群,其中30周岁至80周岁的人群占比超过96%;该数据主要针对双眼多疾病同步诊断,如图2所示,每张眼底图像包含8个疾病标签,分别为:正常眼(N)、糖尿病性视网膜病变(D)、青光眼(G)、白内障(C)、年龄相关性黄斑变性(A)、高血压性视网膜病变(H)、病理性近视(M)和其他眼部疾病/异常(O)。

图2 OIA-ODIR数据集中的示例图像

DR的分类具有一定的挑战性,因为眼底数据集存在类间差异小、类内差异大、病变微小和数据分布不平衡特点。解决DR分类的关键是找到细微视觉差异相对应的鉴别性特征,如微动脉瘤、出血、渗出等。然而,传统的卷积神经网络很难识别小的病灶,而且DR数据分布不平衡会导致模型过分关注样本多的DR分级,严重影响最终的分级性能,因此该团队提出了一种将CAB(类别注意力机制)和GAB(全局注意力机制)相结合的新模型CABNet(如图3所示),可以用端到端方式有效地训练,进行细粒度的DR分级,并通过注意力机制学习判别特征。在OIA-DDR等共三个数据集上的大量实验表明,CABNet可以实现更优的分类性能。该成果发表在CABNet: Category attention block for imbalanced diabetic retinopathy grading, IEEE Transactions on Medical Imaging., 2020。

图3 CABNet的整体结构

该团队针对OIA-ODIR数据集的特点搭建了一个用于多标签分类的基准网络结构,如图4所示,该网络结构共包括三个部分。第一部分为主干网络,将每个患者的左眼和右眼作为输入,进而提取患者双眼各自的图像特征;第二部分为特征融合模块,负责对左右眼的特征进行融合,主要采用最常用的逐元素相加、逐元素相乘和特征拼接等三种特征融合方法;第三部分为分类模块,由八个独立的二分类器组成,输入为特征融合层输出的一维特征,每个二分类器输出为是否存在某种疾病。针对基准网络结构的深度和宽度,实验显示单纯地增加网络的深度并不能为多标签分类任务带来明显的性能提升,而适当地增加网络的宽度,在一定程度上可以融合不同疾病的特征,可以为多标签分类任务带来较好的性能提升。该成果发表在A Benchmark of Ocular Disease Intelligent Recognition: One Shot for Multi-disease Detection, Bench 2020。

图4 ODIR基准测试网络结构

上述研究工作得到了国家自然科学基金和天津市自然科学重点基金项目资助。论文的计算工作得到了国家超级计算天津中心的大力支持。