汪静, 谢垚, 陈莉, 赵润鹏, 于慧, 叶凌锋, 彭启松, 王盛, 韩亚飞
目的 探讨炎症指标与复杂性阑尾炎的相关性,构建基于机器学习的预测模型并评估其预测效能,为复杂性阑尾炎的诊疗提供新思路。方法 回顾性分析2024年1月至2025年6月南京市江宁医院肝胆胰外科收治的330例急性阑尾炎病人的临床资料,根据术中所见与病理结果将其分为非复杂性阑尾炎组(151例)和复杂性阑尾炎组(179例)。收集病人的人口学信息和炎症指标等变量,采用Hold-out验证法,将病人按7∶3比例随机分为训练集(230例)和测试集(100例)。训练集中男性116例,女性114例,125例为复杂性阑尾炎;测试集中男性55例,女性45例,54例为复杂性阑尾炎。通过LASSO回归及多因素logistic回归分析筛选与复杂性阑尾炎发生有显著关联的变量,逻辑回归(logistic regression,LR)、决策树(decision tree,DT)、随机森林(random forest,RF)、极限梯度提升(extreme gradient boosting,XGBoost)、轻量级梯度提升机(light gradient boosting machine,LightGBM)、支持向量机(support vector machines,SVM)、人工神经网络(artificial neural network,ANN)7种机器学习预测模型,通过F1分数、曲线下面积(area under the curve,AUC)、敏感度等指标评估不同模型的预测效能,沙普利可加性模型解释算法(Shapley additive explanations,SHAP)图描述不同指标的重要性并可视化解释模型预测结果。结果 在训练集中经LASSO回归分析和多因素logistic分析筛选出5个显著变量:系统免疫炎症指数(systemic immune-inflammation index,SII),C反应蛋白/白蛋白比值(CAR),中性粒细胞百分比/白蛋白比值(NPAR),血小板/淋巴细胞比值(PLR)和年龄,基于上述变量在测试集构建了7种机器学习预测模型,其中XGBoost模型的预测性能最佳,AUC为0.786(95%CI:0.686~0.876),特异度为91.11%,准确度为75.52%,F1分数为0.733。SHAP发现CAR水平、年龄以及NPAR水平对预测复杂性阑尾炎贡献较大。结论 基于SII、CAR、NPAR、PLR和年龄构建的预测复杂性阑尾炎发生的7种模型,XGBoost模型表现最佳,可为临床提供一个早期预测和治疗复杂性阑尾炎的有效工具。