专利名称 ---【 一种基于深度学习的染色体自动计数方法 】

基本信息
申请号
CN201811250267.0
申请日
20181025
公开(公告)号
CN109523520B
公开(公告)日
20190326
申请(专利权)人
北京大学第三医院;中国科学院计算技术研究所
申请人地址
100191 北京市海淀区花园北路49号
发明人
乔杰;赵屹;田婵;肖立;于天琦;罗纯龙;于富海;罗宇凡;王曼卿;赵相然; 专利类型 发明专利
摘要
本发明公开了一种基于深度学习的染色体自动计数方法,包括以下步骤:(1)图像收集和预处理步骤;(2)图像分类和回归步骤;(3)模型训练步骤;(4)测试计数步骤,其中,在步骤(2)中采用新的抽样策略,并对Faster R‑CNN模型损失函数进行了改进。本发明所需的数据来源于真实显微镜视野下的G显带染色体,所述方法无需复杂实验过程,成本低廉,耗时更短,能够自动准确完成目标染色体计数。本发明使用1000例标注的染色体图训练模型,随后用175例标注的染色体图做测试,统计显示175例共包含8023条染色体,测试的准确率为98.95%,召回率为98.67%。测试结果显示用机器计数后人工校正的方法完成一份报告的染色体计数所需时间短于目前的1/3。
主权项
1.一种基于深度学习的染色体自动计数方法,所述方法包括以下步骤:(1)图像收集和预处理步骤:收集并标注显微镜下分裂中期细胞真实影像图,标记出染色体的矩形框,并随机划分训练集和测试集,对训练集数据进行预处理和数据扩增;(2)图像分类和回归步骤:以步骤(1)预处理和扩增后数据为基础构建Faster R-CNN模型进行图像分类和回归,所述模型包括对数据进行粗分类和回归的候选区域提取网络、以及对候选区域提取网络生成的候选框进行细分类和精确回归预测的Fast R-CNN网络,其中,候选区域提取网络的抽样范围包括困难负例,Fast R-CNN网络的多任务损失函数为原始Fast R-CNN的多任务损失函数与截断的归一化排斥损失函数之和;所述的截断的归一化排斥损失函数为式(I)所示:其中,其中,P+是由候选区域提取网络产生且与某个ground-truth的IoU大于0.5的候选矩形框的集合,P是属于P+的一个候选矩形框,BP是由Faster R-CNN对P进行回归之后的预测框,G P是与P的IoU最大的ground -truth,R P是与P的IoU第二大的ground -truth,当预测候选框偏移真实目标时,根据偏移量的大小,损失函数会在0到1之间连续变化;所述的Fast R-CNN网络的多任务损失函数为(III)所示:Ltotal=Lreg+Lcls+αgLTNRepulsion (III)其中,Lreg为原始Fast R-CNN的回归损失函数,Lcls为原始Fast R-CNN的分类损失函数,α是衡量排斥损失重要程度的权重系数;(3)模型训练步骤:使用步骤(2)建立的模型针对训练集数据进行模型训练;(4)测试计数步骤:将测试集数据经过与步骤(1)相同的数据预处理,输入到经过步骤(3)训练后的模型中,获得预测的目标类别和目标计数信息,并以可视化方式输出计数结果。

 

IPC信息
IPC主分类号
G06T7/00

 

法律状态信息
法律状态公告日
20190326
法律状态
公开 法律状态信息
CN201811250267 20190326 公开 公开
法律状态公告日
20190419
法律状态
实质审查的生效 法律状态信息
CN201811250267 20190419 实质审查的生效 实质审查的生效IPC(主分类):G06T 7/00
法律状态公告日
20201218
法律状态
授权 法律状态信息
CN201811250267 20201218 授权 授权

 

代理信息
代理机构名称
北京市众天律师事务所 11478
代理人姓名
李新军


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器