基于机器学习算法的前列腺癌诊断模型研究

曹文哲a,应俊a,张亚慧a,马海洋b,陈广飞a,周丹c

中国人民解放军总医院 a.生物医学工程研究室;b.骨科;c.医务部,北京100853

[摘 要]目的 基于机器学习的3种算法建立诊断预测模型,比较3种模型对前列腺癌的诊断价值。方法 选择2008~2014年在中国人民解放军总医院进行前列腺穿刺活检的患者956例(其中前列腺癌463例,前列腺增生493例),采用Logistic回归分析,筛选出预测因子(年龄、游离之前列腺特异抗原、游离之前列腺特异抗原百分比、前列腺体积和前列腺特异性抗原密度)。应用基于机器学习的BP神经网络、Logistic回归和随机森林算法构建诊断预测模型,比较3种模型对前列腺癌的预测准确性。结果Logistic回归、BP神经网络和随机森林模型对前列腺癌的诊断能力比任一单项指标都高,3种模型的灵敏度分别为77.5%、77.4%、76.2%,特异度分别为74.8%、76.8%、76.9%,精确度分别为76%、77%、77%,受试者工作特征曲线下面积(AUC)分别为0.831、0.832、0.833,3种模型对前列腺癌的诊断能力没有显著性差异。结论上述结果验证了3种模型均具有较高的诊断有效性,可将模型纳入泌尿决策,协助临床医生对前列腺癌患者进行诊断和治疗,并减少不必要的活检。

[关键词]前列腺癌;前列腺增生;诊断模型;Logistic回归;BP神经网络;随机森林

前列腺癌(Prostate Cancer,PC)是男性人群中最常见的非皮肤癌,是男性癌症死亡的第二大来源[1]。在美国,前列腺癌的发病率居所有男性恶性肿瘤的第1位,在中国前列腺癌的发病率近年来呈持续快速增长趋势[2]。早期诊断、早期治疗是提高前列腺癌患者生存率和降低病死率的关键,但在前列腺癌的诊断和治疗过程中存在过度诊断和过度治疗的难题。前列腺特异性抗原(Prostate Specifc Antigen,PSA)及其衍生物在临床上广泛应用于前列腺癌的早期筛查,但是许多非前列腺癌因素会影响血清PSA浓度,从而导致漏诊或不必要的活检。某些情况下,PSA或衍生物并不能有效区分前列腺癌和前列腺增生(Benign Prostate Hyperplasia,BPH),这与严重的炎症可能会影响PSA在血液中的水平有关[3]

一项Meta分析[4]显示,建立优化模型能够提高诊断前列腺癌的精确度,为了突破单一指标诊断模式的局限性,研究人员开发了许多前列腺癌预测模型,来协助临床医生准确的诊断和治疗该疾病,如Partin列线图[5]、Kattan和Stephenson列线图[6-8]、D’Amico风险分类器[9]、卡普拉评分[10]和其他方法[11-13]。近10年来,很多研究人员构建了非线性形式的预测模型,有些模型能够较好地预测前列腺癌,但并不能帮助临床医生有效区分前列腺癌和前列腺增生[14]。分类器是当前研究的热点,因为它能准确预测前列腺癌并可以自我解释,目前有4种预测模型应用比较广泛:列线图[15]、决策树[16]、Logistic回归和贝叶斯网络[17]

本研究采用基于机器学习理论的Logistic回归、BP神经网络和随机森林算法,在训练集中利用筛选出的预测因子构建前列腺癌的诊断模型,在测试集中利用灵敏度、特异度、精确度、ROC曲线下的面积(Area Under Curve,AUC)评价3种模型的优劣。

1 材料和方法

1.1 研究人群

选取中国人民解放军总医院病理科2008~2014年经病理检查诊断为前列腺癌和前列腺增生的患者956例,其中前列腺增生患者493例,前列腺癌患者463例。所有研究对象资料完整,指标变量包括年龄、总PSA浓度(Total Prostate Specifc Antigen,tPSA)、 游 离PSA浓 度(Free Prostate Specifc Antigen,fPSA),游离PSA百分比(fPSA/tPSA)、前列腺体积、PSA密度(Prostate Specifc Antigen Density,PSAD),本研究中的前列腺体积由改进公式进行计算[18],即前列腺体积=左右径(cm)×前后径(cm) ×上下径(cm)×0.52。所有研究对象在进行PSA检查前均无前列腺癌病史和前列腺手术史,服用5α-还原酶抑制剂等药物的患者可能会影响血清PSA的水平而被排除在外。

1.2 预测变量和Logistic回归分析

应用流行病学研究设计,将数据集中全部前列腺癌患者作为病例组,全部前列腺增生患者作为对照组,从数据集中随机抽取3/4的数据作为训练集,剩余1/4数据作为测试集,随机分组后训练集有766例患者数据用于模型构建。研究纳入以下指标:年龄、血清总PSA、游离PSA、游离PSA百分比、前列腺体积及PSA密度,分析前列腺癌患者和前列腺增生患者两组间各指标的差异性,检验水平α=0.05。用Logistic回归分析筛选前列腺癌的独立预测因子并构建诊断预测模型,自变量筛选采用以似然比检验为依据的前向步进法(Forward: LR),纳入标准为P<0.05,剔除标准为P>0.1,统计软件为SPSS 21.0。在训练集中利用筛选出的变量构建Logistic回归模型,在测试集中利用Logistic回归模型对前列腺癌的诊断性能进行评估。

1.3 BP人工神经网络

反向传播(Back Propagation,BP)神经网络,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP神经网络模型拓扑结构包括输入层(Input layer)、隐含层(Hide Layer)和输出层(Output Layer)。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐含层、输入层逐层反传。此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。作为一个非线性的人工智能系统,它可以寻找变量之间的复杂相互关系,识别及建模输入变量和输出直接非线性关系等[19],典型BP神经网络结构模型,见图1。

图1 典型BP神经网络结构模型

柯氏定理指出,任何连续函数都可以通过利用三层BP神经网络准确地实现。本文采用一个三层神经网络,其输出层有1个神经元表示前列腺癌的可能性。输入层的5个神经元表示由多因素Logistic回归分析得到的5个独立预测因子。困难在于隐藏的神经元数目的选择。首先,基于经验公式确定其大致范围,然后在训练集中根据10倍交叉验证的方法确定最优节点的数量[20],建模之前,所有输入变量需进行标准化以达到改善训练集性能的目的。

1.4 随机森林模型

随机森林由Leo Breiman提出[21],被广泛地应用于分类研究。在随机森林构建过程中,自助样本集从原始的训练样本集中随机选取,用于每一个树分类器的形成,每一棵树所应用的变量是从所有变量中随机选取,每次抽样生成的袋外数据(Out of Band,OOB)被用来预测分类的正确率,对每次预测结果进行汇总得到错误率的OOB估计,然后评估组合分类器判别的正确率[22]。随机森林中最重要的参数是每个节点处随机抽取的变量数,本文通过逐渐增加变量个数的方法进行优化。随机森林中另外两个重要的参数是构建分类树的个数和叶节点的大小[23]。两次随机过程使得随机森林具有较稳定的错误率,同时应用袋外数据来衡量分类器的性能。

变量重要性评分用于评价变量对于结局发生的影响,变量的重要性评分越高,则表明该变量越有能力对结局变量进行分类,袋外数据作为测试样本可以用来评估各个变量在分类中的重要性[24],本研究根据精确度平均减少值和节点不纯度减少平均值分别画出各变量的重要性评分。

表1 前列腺癌与前列腺增生两组间各指标比较(±s

2 结果

2.1 Logistic回归模型结果

将前列腺癌组(463例)的年龄、血清总PSA、游离PSA、游离PSA百分比、前列腺体积及PSA密度与前列腺增生组(493例)做Wilcoxon秩和检验,两组各项指标均值均具有统计学差异(P<0.05),见表1。其中前列腺癌组的年龄、血清总PSA、游离PSA及PSA密度均值比前列腺增生组高,前列腺癌组的游离PSA百分比、前列腺体积比前列腺增生组低。

在训练集(其中前列腺癌患者368例,前列腺增生患者398例)中利用单因素Logistic回归分析,可知每个变量都有显著性意义。在训练集中对纳入研究的6个指标利用多因素Logistic回归进行分析,经变量筛选后得到的主要指标有年龄、游离PSA、游离PSA百分比、前列腺体积及PSA密度,见表2。

表2 在训练集上的Logistic分析结果

年龄(OR:1.086,95%CI:1.06~1.11)是前列腺癌的危险因素,游离PSA、PSA密度每提高一个水平,患前列腺癌的风险分别提高1.446倍、2.858倍,前列腺癌的游离PSA百分比水平较低,是前列腺增生患者的0.001倍。年龄、游离PSA、游离PSA百分比、前列腺体积及PSA密度之间的交互关联作用,见图2,方框中圆影的大小代表了两指标的交互关联程度。

图2 各指标之间的交互关联作用

利用筛选出的年龄、游离PSA、游离PSA百分比、前列腺体积及PSA密度在训练集上构建Logistic回归模型,利用测试集对模型进行评估,新建模型和年龄、游离PSA、游离PSA百分比、前列腺体积及PSA密度的ROC曲线,见图3。由图3可知,Logistic回归模型比各单一指标诊断前列腺癌的水平都要高,PSA密度的诊断水平次之。

图3 Logistic回归模型和各指标的ROC曲线

2.2 BP神经网络模型结果

应用BP神经网络方法对前列腺癌与前列腺增生进行分类预测,算法通过R软件实现。将完整数据集随机地分成两部分,其中3/4为训练样本,1/4为测试样本。研究采用三层BP神经网络,输入层有5个节点,输入参数包括年龄、游离PSA、游离PSA百分比、前列腺体积及PSA密度。根据优化的网络结构得到隐含层神经元的最佳数目为9,即隐含层有9个节点。模型评价采用错误率(Error Rate)、灵敏度(Sensitivity)、特异度(Specifcity)和AUC四种指标,其中灵敏度和特异度是按照概率0.5为判别阈值预测分类的评价结果,AUC则是综合评价的结果。

训练集中5个指标组合建立的BP神经网络模型预测前列腺癌的结果,见表3。由表3可知,模型在训练集中的特异度为82.5%、灵敏度为78.9%,在测试集中的特异度为76.8%、灵敏度为77.4%,模型的精确度为77%。在ROC分析中,BP神经网络模型ROC曲线下面积AUC=0.832(图4),由上述结论可知,BP神经网络模型能够较好的诊断预测前列腺癌。

表3 Logistic回归、BP神经网络与随机森林模型结果比较

图4 BP神经网络模型和各指标的ROC曲线

2.3 随机森林模型结果

应用随机森林方法对前列腺癌与前列腺增生进行分类预测,算法通过R软件实现。根据患者的年龄、游离PSA、游离PSA百分比、前列腺体积、PSA密度及实验室检查信息建立随机森林预测模型,对前列腺癌与前列腺增生进行分类评价研究。

为了准确地评价随机森林分类模型的效果,随机地将样本分成两部分,其中3/4为训练样本,1/4为测试样本,按此方法随机组成100个训练集和100个测试集,利用训练集建立预测模型,然后利用测试集对模型进行效果评价。在训练集中对于决策树节点分支选择的变量个数,我们采用逐一增加变量的方法进行建模以寻找最优模型,当决策树节点所选变量数为2时,模型的误判率均值是最低的。在确定决策树节点最优变量个数后,进一步确定随机森林模型中决策树数量,当决策树数量大概达到500时,模型误差趋于稳定,达到最优模型(图5),对模型中的二元响应变量赋值,1代表前列腺癌,0表示前列腺增生。

图5 模型误差与决策树数量关系图

在测试集中利用优化的随机森林模型给出每个变量的重要性评分,结果见图6。图6给出了两种测算方式下的自变量重要程度对比,其中横坐标是变量重要性评分,纵坐标给出了模型中的各个变量,坐标轴中从上往下排列的各个变量评分逐渐减小,评分越大表示对应的变量对模型的分类影响越大。由图6可以看出,前列腺癌患者的PSA密度、前列腺体积两个指标得分较高,另外检查指标游离PSA、游离PSA百分比也对分类起一定的作用。除此以外,年龄对模型分类有一定贡献。与上述两种模型中前列腺体积无诊断价值相比,随机森林模型中前列腺体积指标重要性评分较高,这可能与前列腺体积与其他指标的交互关联有关。

图6 随机森林变量重要性评分

注:MDA:平均精度下降值;MDG:平均Gini不纯度下降值。

2.4 3种模型结果的比较

表3中给出了Logistic回归、BP神经网络与随机森林模型4项评价指标的结果,由表中可以看出随机森林模型的特异度和ROC曲线下面积略高于Logistic回归和BP神经网络模型,但其灵敏度比Logistic回归和BP神经网络模型略低。3种模型的精确度相当,在检验水平α=0.05下对3种模型作差异性检验,结果P>0.05。由此可见3种模型的综合诊断效果没有显著性差异。与此同时,3种模型ROC曲线下面积AUC都较高,并且比任何一项单一指标对前列腺癌的诊断更有效,证实了3种模型在前列腺癌诊断预测中具有较大的潜力。

3 讨论

在当前的研究中,Logistic回归、BP神经网络与随机森林模型可以用来评价前列腺癌的患病概率,并进行危险分层。利用诊断模型结合临床、实验室、病理、经直肠前列腺超声检查结果,可以帮助泌尿科医生更高效地诊断前列腺癌。国外研究人员将人工神经网络原理同前列腺癌诊治中的其他指标相结合,应用于提高前列腺癌的诊断效率,取得了很好的效果[25]

本研究中3个模型的优势在于模型对血清PSA值范围没有限制,其区间(0.09~98.23 ng/mL)涵盖了整个数据集,并在训练集和测试集中进行了评估和测试,因此在临床使用中十分简便,提高了诊断效率与诊断准确率,在不同程度上减少了不必要的穿刺。利用Logistic回归分析筛选纳入指标时血清总PSA被排除在外,这可能与患者年龄、地区、不同患者不同病史及药物影响有关[26-29]

先前的研究表明[30],游离PSA百分比和PSA密度在前列腺癌的诊断预测中具有较高的价值。本研究中PSA密度诊断能力中等以上,游离PSA百分比诊断能力低。大量国内外文献[31-32]报道,前列腺癌患者PSA密度明显高于前列腺增生患者,也有研究[33]表明:在前列腺癌的早期诊断中,PSA密度的敏感度、特异度及准确度明显提高,其作用优于总PSA,而游离PSA百分比的作用不及PSA密度,这与本文研究结果一致。对于PSA密度的诊断阈值,目前争议较大。相关研究[34-35]表明,前列腺癌患者的平均前列腺体积比前列腺增生患者大,本研究佐证了这一点。在Logistic回归和BP神经网络模型中前列腺体积的诊断能力最差,而在随机森林中前列腺体积的重要性评分仅次于PSA密度,这与前列腺体积和其他指标的交互有关,所以同时考虑多重因素的交互影响并加以避免更加合理。

由于前列腺癌的患病人群比较大,本研究模型的外推性还需更多的数据进行验证。因此,本研究中的3个模型更适合于前列腺癌风险系数较高的人群以及可能的前列腺穿刺活检患者[36]。在前列腺癌的诊断预测研究中,Porter等[37]采用了广泛使用的6种预测模型,其中包括人工神经网络和Logistic回归模型,发现人工神经网络模型的诊断作用似乎与Logistic回归相同,这与本研究没有显著性差异的结果一致。

值得注意的是,研究结果当中存在抽样误差,由于血清总PSA区间范围和样本大小存在差异,尽管3种模型在数据集内部进行了测试评估,但还需要其他独立数据集的验证才能推广到更多人群。随着诊疗技术的发展,越来越多的检测指标供临床医生参考,但并不是指标越多,诊断效果越好,相反,不好的指标会误导临床医生的诊断,从而降低诊断的准确性。通过ROC曲线,可提炼出与疾病有相关性的指标,建立优化组合模型,提高前列腺癌的诊断效能,减少不必要的活检对医疗系统和前列腺癌患者产生的影响,减少医疗成本和患者活检的痛苦以及可能出现的并发症。

[参考文献]

[1]Siegel R,Naishadham D,Jemal A.Cancer statistics,2013[J].CA Cancer J Clin,2013,63(1):11-30.

[2]韩苏军,张思维,陈万青,等.中国前列腺癌发病现状和流行趋势分析[J].临床肿瘤学杂志,2013,18(4):330-334.

[3]Yuksel S,Dizman T,Yildizdan G,et al.Application of soft sets to diagnose the prostate cancer risk[J].J Inequal Appl,2013,(1):229.

[4]Louie KS,Seigneurin A,Cathcart P,et al.Do prostate cancer risk models improve the predictive accuracy of PSA screening?A meta-analysis[J].Ann Oncol,2015,26(5):1031-1032.

[5]Huang Y,Isharwal S,Haese A,et al.Prediction of patient-specifc risk and percentile cohort risk of pathological stage outcome using continuous prostate-specifc antigen measurement,clinical stage and biopsy Gleason score[J].BJU Int,2011,107(10):1562-1569.

[6]Smaletz O,Scher HI,Small EJ,et al.Nomogram for overall survival of patients with progressive metastatic prostate cancer after castration[J].J Clin Oncol,2002,20(19):3972-3982.

[7]Stephenson AJ,Scardino PT,Eastham JA,et al.Postoperative nomogram predicting the 10-year probability of prostate cancer recurrence after radical prostatectomy[J].J Clin Oncol,2005,23(28):7005-7012.

[8]Stephenson AJ,Scardino PT,Eastham JA,et al.Preoperative nomogram predicting the 10-year probability of prostate cancer recurrence after radical prostatectomy[J].J Natl Cancer Inst,2006,98(10):715-717.

[9]D’Amico AV,Whittington R,Malkowicz SB,et al.Biochemical outcome after radical prostatectomy or external beam radiation therapy for patients with clinically localized prostate carcinoma in the prostate specifc antigen era[J].Cancer,2002,95(2):281-286.

[10]Cooperberg MR,Pasta DJ,Elkin EP,et al.The University of California,San Francisco cancer of the prostate risk assessment score:a straightforward and reliable preoperative predictor of disease recurrence after radical prostatectomy[J].J Urol,2005,173(6):1938-1942.

[11]Haese A,Chaudhari M,Miller MC,et al.Quantitative biopsy pathology for the prediction of pathologically organ-confned prostate carcinoma:a multiinstitutional validation study[J].Cancer,2003,97(4):969-978.

[12]Veltri RW,Chaudhari M,Miller MC,et al.Comparison of logistic regression and neural net modeling for prediction of prostate cancer pathologic stage[J].Clin Chem,2002,48(10):1828-1834.

[13]Veltri RW,Miller MC,Partin AW,et al.Prediction of prostate carcinoma stage by quantitative biopsy pathology[J].Cancer,2001,91(12):2322-2328.

[14]Bermejo P,Vivo A,Tárraga PJ,et al.Development of Interpretable Predictive Models for BPH and Prostate Cancer[J].Clin Med Insights Oncol,2015,9:15-24.

[15]Shariat SF,Karakiewicz PI,Suardi N,et al.Comparison of nomograms with other methods for predicting outcomes in prostate cancer:a critical analysis of the literature[J].Clin Cancer Res,2008,14(14):4400-4407.

[16]Chun FK,Karakiewicz PI,Briganti A,et al.A critical appraisal of logistic regression-based nomograms,artificial neural networks,classification and regression-tree models,lookup tables and risk-group stratification models for prostate cancer[J].BJU Int,2007,99(4):794-800.

[17]Lacave C,Luque M,Díez FJ.Explanation of Bayesian networks and influence diagrams in Elvira[J].IEEE Trans Syst Man Cybern B Cybern,2007,37(4):952-965.

[18]Terris MK,Stamey TA.Determination of prostate volume by transrectal ultrasound[J].J Urol,1991,145(5):984-987.

[19]Lawrentchuk N,Lockwood G,Davies P,et al.Predicting prostate biopsy outcome:artificial neural networks and polychotomous regression are equivalent models[J].Int Urol Nephrol,2011,43(1):23-30.

[20]Subasi A.Automatic recognition of alertness level from EEG by using neural network and wavelet coefficients[J].Expert Syst Appl,2005,28(4):701-711.

[21]Svetnik V,Liaw A,Tong C,et al.Random forest:a classifcation and regression tool for compound classification and QSAR modeling[J].J Chem Inf Comput Sci,2003,43(6):1947-1958.

[22]Wolpert DH,Macready WG.An Efficient Method to Estimate Bagging’s Generalization Error[J].Mach Learn,1999,35(1):41-55.

[23]Ishwaran BH,Kogalur UB,Blackstone EH,et al.Random Survival Forests1[J].Ann Appl Stat,2008,2(3):841-860.

[24]Díaz-Uriarte R,Alvarez de Andrés S.Gene selection and classifcation of microarray data using random forest[J].BMC Bioinformatics,2006,7:3.

[25]Panebianco V,Sciarra A,Marcantonio A,et al.Conventional imaging and multiparametric magnetic resonance (MRI,MRS,DWI,MRP)in the diagnosis of prostate cancer[J].Q J Nul Med Mol Imaging,2012,56(4):331-342.

[26]Ng CF,Chiu PK,Lam NY,et al.The Prostate Health Index in predicting initial prostate biopsy outcomes in Asian men with prostate-specifc antigen levels of 4-10 ng/mL[J].Int Urol Nephrol,2014,46(4):711-717.

[27]Lee AG,Choi YH,Cho SY,et al.A prospective study of reducing unnecessary prostate biopsy in patients with high serum prostate-specifc antigen with consideration of prostatic infammation[J].Korean J Urol,2012,53(1):50-53.

[28]Romero Otero J,Garcia Gomez B,Campos Juanatey F,et al.Prostate cancer biomarkers:an update[J].Urol Oncol,2014,32(3):252-260.

[29]Pourmand G,Ramezani R,Sabahgoulian B,et al.Preventing Unnecessary Invasive Cancer-Diagnostic Tests:Changing the Cut-off Points[J].Iran J Public Health,2012,41(2):47-52.

[30]Catalona WJ,Southwick PC,Slawin KM,et al.Comparison of percent free PSA,PSA density and age-specific PSA cutoffs for prostate cancer detection and staging[J].Urology,2000,56(2):255-260.

[31]Lee SE,Chung JS,Han BK,et al.Relationship of prostatespecific antigen and prostate volume in Korean men with biopsy-proven benign prostatic hyperplasia[J].Urology,2008,71(3):395-398.

[32]Azuma K,Numata K,Hashine K,et al.Utility of prostate specific antigen doubling time in repeat biopsy for prostate cancer[J].Nihon Hinyokika Gakkai Zasshi,2006,97(1):42-47.

[33]Moreira DM,Gerber L,Thomas JA,et al.Association of prostate-specific antigen doubling time and cancer in men undergoing repeat prostate biopsy[J].Int J Urol,2012,19(8):741-747.

[34]Bermejo P,Vivo A,Tárraga PJ,et al.Development of Interpretable Predictive Models for BPH and Prostate Cancer[J].Clin Med Insights Oncol,2015,25(9):15-24.

[35]王春霞,潘小杰,范桂红,等.四种影像学检查在诊断前列腺癌中的应用评价[J].中国医疗设备,2014,29(5):170-172,160.

[36]Karakiewicz PI,Benayoun S,Kattan MW,et al.Development and validation of a nomogram predicting the outcome of prostate biopsy based on patient age,digital rectal examination and serum prostate specifc antigen[J].J Urol,2005,173(6):1930-1934.

[37]Porter CR,Crawford ED.Combining artificial neural networks and transrectal ultrasound in the diagnosis of prostate cancer[J].Oncology(Williston Park),2003,17(10):1395-1399.

Diagnostic Model Research of Prostate Cancer Based on Machine Learning Algorithm

Abstract:Objective To establish diagnostic prediction models based on three machine learning algorithms and compare the value of the three models in the diagnosis of prostate cancer (PC).Methods The research selected the clinical data of 956 patients (including 463 cases of prostate cancer and 493 cases of benign prostatic hyperplasia) with prostate biopsy in the General Hospital of PLA during 2008~2014.Predictors were screened by Logistic regression which included age,free prostate-specifc antigen (fPSA),the percentage of free prostate-specifc antigen (free PSA/total PSA),prostate volume,and PSA density (PSAD).The paper further compared the diagnostic accuracy of three models in the prediction of prostate cancer by using BP neural network,Logistic regression (LR),and random forest algorithm based on machine learning.Results The diagnostic capability of Logistic regression,BP neural networks,and random forest model for prostate cancer was higher than any a single indicator.Retrospectively,the sensitivity of the three models were 77.5%,77.4%,and 76.2% ;the specifcity was 74.8%,76.8%,and 76.9%;the accuracy was 76%,77%,and 77%.The area under the ROC curve (AUC) was 0.831 for LR model,0.832 for BP neural networks model,and 0.833 for the random forest model respectively,which indicated that there were no statistically signifcant difference existing in the three modes in terms of diagnostic effectiveness.Conclusion The above results verifed the high diagnostic validity of these three models,which all could be incorporated into urologic decision making to assist clinicians carry out diagnosis and treatment so as to reduce the unnecessary biopsies.

Key words:prostate cancer;benign prostate hyperplasia;diagnostic model;Logistic regression;BP neural networks;random forest

CAO Wen-zhea,YING Juna,ZHANG Ya-huia,MA Hai-yangb,CHEN Guang-feia,ZHOU Danc
a.Department of Biomedical Engineering;b.Department of Orthopedics;c.Department of Medical Management,General Hospital of PLA,Beijing 100853,China

[中图分类号]TN957.51

[文献标志码]A

doi:10.3969/j.issn.1674-1633.2016.04.006

[文章编号]1674-1633(2016)04-0030-06

收稿日期:2016-01-22

基金项目:国家自然科学基金(61501518)。

通讯作者:周丹,教授,博士生导师。