资讯

文献综述翻译:基于机器学习的巴氏涂片图像分类

 华夏病理 3046 评论
[导读] 作者:广东医科大学附属第三医院(佛山市顺德区龙江医院)张波,郝兴辉

子宫颈癌是严重威胁女性健康常见的恶性肿瘤之一[1],是继乳腺癌之后的全球第二大最常见的女性癌症。大部分由于子宫颈鳞状上皮细胞感染高危型人乳头瘤病毒引起,由于疾病进展需要较长过程,故可以早期发现而治愈。临床表现不特异并且起病隐匿,死亡率逐年升高。用于子宫颈癌筛查的液基细胞学 (Liquid-based cytology,LBC)/巴氏涂片(Pap smears)检查是一种基于细胞图像分析的高效的癌前细胞检测技术,根据判读标准细胞形态被分为正常或异常。传统人工子宫颈涂片检查评估细胞学异常易出现假阴性和假阳性结果,对于子宫颈癌的早期诊断易误诊或漏诊。随着疾病发病的年轻化及病毒感染率的升高,迫使更加自动化和更高准确性的检查手段的产生及运用。精准细胞学分类可以提高早癌筛查效率,利用计算机辅助技术可以有效分析识别子宫颈上皮内瘤变 (cervical intraepithelial neoplasia,CIN),目前医学成像中的计算机辅助系统已从人工智能(Artificial Intelligence,AI)技术的非凡发展中受益匪浅。计算机辅助筛查可以降低子宫颈癌发病风险,对临床预后具有重要意义,高精度的自动筛查技术尽早应用于检测子宫颈癌至关重要,尤其是在医疗资源有限的国家。然而,资源和计算成本的限制阻碍了AI自动化辅助子宫颈癌筛查系统的广泛应用,而且使用机器学习的现有方法尚有一些不尽人意的缺点包括在复杂情况下的泛化能力差以及效率、准确性和泛化能力低。随机森林方法是最常用方法,但如果使用大量决策树,随机森林方法将显得较迟钝且对于实时预测无效[2]。此外,当前的分类方法例如深度学习(Deep learning,DL) 或手工制作技术大多依赖于单个检测结构,并且处理复杂度高且准确性低。但Janiesch等人[3]的一项研究显示DL近年来对在语音识别和图像识别方面取得了长足进步,适合应用于癌细胞分类的计算机辅助系统。

本研究系统回顾和分析2022年10月之前发表的使用机器学习对子宫颈癌分类方法的文献,整合分析被用作评估策略之一,评估并进行数据分析比较当前与子宫颈癌细胞分类相关的重要研究。研究发现随着医学研究进步而增加了许多与之相关的现代技术,特别是在图像处理、药物研发、计算机辅助诊断和癌症研究领域,越来越多的学者采用了DL用于处理医学图像。卷积神经网络是用于通过DL过程对细胞形态图像进行分类的方法之一。除此之外,分类器、聚类算法、随机森林、Ada Boost、MLP算法、特征提取网络、deepcyo、支持向量机(SVM)等几种方法能够在准确性、特异性、敏感性、精密度和f值方面达到高性能的评价值。因此,机器学习可以补偿传统的癌症诊断方法,并可能通过筛查过程在早期发现癌症。作者在the Web of Science and Scopus databases初步搜索基于子宫颈癌细胞为关键词相关论文3048篇,所有重复的论文从搜索论文列表中删除。筛选的第一阶段排除了2999份出版物,而第二阶段根据本研究的不同排除和纳入标准检查了49篇论文,删除重复筛查记录后保留45篇文章。再对所有45篇文章标题和重要内容进行仔细检查,以确保符合纳入标准,并确保文章与本研究的研究目标相关。排除18种经验数据与研究目的无显著相关性的出版物,最后,有27篇论文可供评估,具体流程详见(图1)。

文献综述翻译:基于机器学习的巴氏涂片图像分类 

Figure1.Flow diagram of the proposed advanced search study.

卷积神经网络(Convolutional neural network,CNN)是目前分类过程的最佳方法之一。先前与CNN相关的研究人员已经研究了几种技术,例如基于CNN的长短期记忆分类器、基于区域的分类器、轻量级、ResNet-50等。Chitra等人[4]引入了一种使用Sooty Tern Optimization (STO)优化算法和基于CNN的长短期记忆分类器(CNN-LSTM))进行分类的技术,与其他文献综述相比取得了更好的性能结果。研究结果表明,准确性99.80%、特异性99%、敏感性98.83%、F评分97.8,研究显示28.5%优于随机森林,19.46%比集合分类器更好。Elakkiya等人[5]提出了一种基于深层特征的子宫颈癌前病变和恶性病变的识别和分类方法,无需进行初始分类和分割。本研究结果显示目前具有四种不同的分类方法,分别是基于神经网络的分类、线性模型分类、非线性分类模型以及其他分类等。表明与其他方法相比,基于神经网络的分类方法具有更高的准确性,得出使用机器学习对子宫颈细胞进行分类的最流行方法是神经网络分类的结论见(图2),从此图可见神经网络方法能够实现更高的准确度(超过99%),并且被证明能够检测不同数据集中的被测试的细胞的类别。

文献综述翻译:基于机器学习的巴氏涂片图像分类 

Figure2.Graph of classification performance accuracy.

综合比较结果表明,MFFOA-DL3模型的表现优于其他类似方法;与现有技术相比,Boruta分析显示出更好的性能方法;DeepCyto是用于精确特征提取巴氏涂片图像分类的强大工具。在应对大规模数据的复杂性和识别预后模式时,机器学习已被证明优于传统的统计模型。它在增强子宫颈癌治疗方面具有很大的临床潜力。但是,预测研究和模型的局限性,例如简化、信息不足、过拟合以及缺乏可解释性等方面,表明需要额外的努力来提高临床结果预测的准确性、可靠性和实用性。除此之外,基于多域混合DL框架的子宫颈细胞辅助分类的新颖筛选方法有望用于早期子宫颈癌检测,所有机器学习体系结构都在子宫颈癌细胞中提供了出色的细胞核图像分割,但并未解决重叠的细胞核图像分割和Z-stack协议栈分割问题。由此可见,机器学习仍有尚待完善的关键之处,但目前在子宫颈癌早期筛查方面已显出其优越的发展前景。

点此下载原文献:

参考文献:

[1]Nur Ain Alias 1, Wan Azani Mustafa 1,2, Mohd Aminudin Jamlos 3, et al. Pap Smear Images Classification Using Machine Learning: A Literature Matrix.Diagnostics 2022, 12, 2900.

[2]Lilhore, U.K.Poongodi, M. Kaur, A. et al. Model for Detection of Cervical Cancer Using Causal Analysis and Machine Learning Techniques. Comput. Math. Methods Med. 2022, 2022, 4688327.

[3]Janiesch, C, Zschech, P.,Heinrich, K. Machine learning and deep learning. Electron. Mark. 2021, 31, 685–695.

[4] Chitra, B. Kumar, S. Early cervical cancer diagnosis using Sooty tern-optimized CNN-LSTM classifier. Int. J. Imaging Syst. Technol.2022, 32, 1846–1860.

[5]Elakkiya, R.;Teja, K.S.S. Jegatha Deborah, L. et al. Imaging based cervical cancer diagnostics using small object detection—Generative adversarial networks. Multimed. Tools Appl. 2022, 81, 191–207.

本站欢迎原创文章投稿,来稿一经采用稿酬从优,投稿邮箱tougao@ipathology.com.cn

相关阅读

  •   数据加载中

我要评论

0条评论