多组学方法揭示儿童和青少年新发1型糖尿病的疾病特征 SO006-308 | EASD2024
谭慧玲1,岳彤1,施雨1,潘澜心1,郑冬雪1,丁宇1,骆斯慧1,郑雪瑛1,翁建平1
1图书馆VIP附属第一医院(安徽省立医院),内分泌科
背景:肠道菌群及代谢物改变被认为是导致1型糖尿病 (T1D) 发病的关键环境因素。在队列研究中利用多种组学技术有望揭示患者特定的疾病特征并确定潜在的治疗靶点。本研究旨在探索儿童和青少年中新发1型糖尿病患儿的肠道微生物、血清代谢物和脂质特征。
方法:本研究为横断面研究,纳入109名T1D患者、56名健康对照者。T1D患者平均年龄为10岁,平均病程为1.6年。所有研究参与者均接受临床检查,并收集血液和粪便样本。本研究使用宏基因组测序分析肠道微生物群,用液相色谱-质谱法分析血清代谢物和脂质。筛选出各组学疾病特征标志物后行各组学特征标志物的联合分析。
结果:宏基因组分析显示,T1D患者和健康对照者的微生物特征不同,在物种水平上,T1D患者Prevotella_sp900557255丰度降低。代谢组学分析发现,T1D患者的代谢物轮廓较正常人发生改变,其特点是初级胆汁酸生物合成增加,亚油酸代谢减少。脂质组学分析发现,T1D患者的脂质较正常人改变,MG(15:1)(一种单甘油酯)水平降低,差异脂质富集于不饱和脂肪酸生物合成途径。联合分析发现差异菌群Prevotella_sp900557255水平和MG(15:1) 水平呈正相关,提示Prevotella_sp900557255可能通过MG(15:1)参与儿童和青少年T1D的发生。
结论:我们的研究结果表征了儿童和青少年新发T1D的肠道微生物、血清代谢物和血清脂质特征,并进一步探究了其可能的关联机制,从而为基于微生物组的T1D诊断和干预策略提供了参考。
点评:
1型糖尿病(T1D)是一种遗传易感个体在环境因素下诱发的自身免疫性疾病。T1D的遗传易感性无法解释其发病率呈逐步增长的原因。近年来,越来越多的研究证实环境因素在此过程中发挥了重要作用,这其中备受关注的是肠道菌群。然而,大多数研究只针对T1D患者肠道微生物、血清代谢物或脂质进行单一组学研究,且肠道微生物与血清代谢物/脂质间的相互作用在T1D进展中的影响尚未完全阐明。同时,T1D具有极强的异质性,成人和青少年起病患者的临床表现、治疗效果等均具有异质性,而目前针对新诊T1D儿童和青少年的整合的多组学特征及相关潜在的通路机制仍未被完全揭示。基于上述,本研究聚焦儿童和青少年新发T1D患者,旨在阐明T1D患者肠道菌群、代谢组、脂质组特征及其相互作用,为后续T1D的诊治提供新思路。
妊娠期糖尿病亚型的胰岛素敏感性和妊娠结局异质性研究 SO030-495| EASD2024
龚一昕1, 王群华2, 陈素玉1, 刘昱婕2, 黎承华1, 康蓉1, 王璟1, 魏甜1, 王沁1, 李先铭1, 骆斯慧1, 翁建平1, 郑雪瑛1, 丁宇1
1图书馆VIP附属第一医院(安徽省立医院),内分泌科;2图书馆VIP附属第一医院(安徽省立医院),妇产科
背景:妊娠期糖尿病(GDM)的发病机制涉及胰岛素抵抗和胰岛β细胞功能不全。研究发现以空腹血糖升高为特征和以餐后血糖升高为特征的糖尿病亚型涉及不同的病理生理机制和结局风险。本研究旨在通过分析GDM亚型的胰岛素敏感性和妊娠结局差异进行GDM临床表型异质性探究。
方法:在图书馆VIP附属第一医院建立妊娠期糖尿病前瞻性队列,招募孕周<28周孕妇入组。根据口服葡萄糖耐量试验结果(OGTT)分为血糖正常组(NGT)、孤立性空腹高血糖(IFG)和孤立性餐后高血糖组(IGT)。检测孕中期血清C肽和胰岛素分泌,计算稳态模型评估胰岛素抵抗指数(HOMA-IR)和定量胰岛素敏感性检测指数(QUICIK-I),随访至分娩并记录产妇结局(剖宫产、妊娠期高血压、子痫前期、妊娠期增重)和新生儿结局(大于胎龄儿[LGA]、早产、新生儿呼吸窘迫综合征、新生儿脑损伤等)。
结果:与IGT组相比,IFG组孕妇年龄较小(31.1 vs. 31.6 岁,P=0.003)、孕前体质量指数(BMI)较高(23.3 vs. 22.6 kg/m2,P=0.001)、受教育程度更低(本科及以上83.9 vs. 88.9%,P=0.029)、初产妇较少(54.2 vs. 66.2%,P<0.001)、更可能患有多囊卵巢综合征(17.7 vs. 7.6%,P=0.043)、孕早期空腹血糖较高(4.85 vs. 4.69 mmol/l,P=0.013),差异有统计学意义。IFG组孕妇的胰岛素抵抗程度高于IGT组(HOMA-IR 3.11 vs. 2.25,QUICKI-I 0.54 vs. 0.59,both P<0.01),IGT组胰岛β细胞功能较差(C肽2.00 vs. 2.26 ng/ml,P<0.05)。在妊娠结局方面,IFG组妊娠期过度增重(RR 1.62,95%CI 1.18-2.23)、LGA(RR 1.45,95%CI 1.03-2.03)发生风险高于IGT组。IGT组子代发生早产风险高于IFG组(RR 1.80,95%CI 1.02-3.36)。IGT组新生儿脑损伤发生风险较NGT组显著增加(RR 2.03,95%CI 1.04-4.09),而IFG组较NGT组新生儿脑损伤风险未见统计学差异(RR 1.42,95%CI 0.56-3.35)。
结论:GDM亚型在胰岛素生理特征和妊娠结局方面呈现异质性。根据GDM不同表型有针对性的调整治疗策略有助于促进血糖正常化和改善不良妊娠结局。
点评:
糖尿病的异质性研究是近年的热点,也是精准医疗的一环。糖尿病的发病机制复杂,尽管都表现为血糖升高,不同亚型的血糖谱特征和并发症结局转归呈现差异。这项研究对妊娠期糖尿病进行了表型异质性探索,研究发现妊娠期空腹血糖升高患者区别于餐后血糖升高患者的基线特征和胰岛素生理特征,两组间妊娠结局也存在一定差异,例如我们创新性的发现了空腹血糖升高的妊娠期糖尿病患者发生妊娠期过度增重、大于胎龄儿的风险较餐后血糖升高患者显著增加,而餐后血糖升高的患者发生早产和新生儿脑损伤的风险显著增加。我们的发现为妊娠期糖尿病的精准医疗和优化母儿两代人的结局提供了依据。
机器学习方法揭示代谢相关脂肪性肝病(MAFLD)合并多支血管斑块(PVP)患者的蛋白质组和脂质组学特征 SO088-948 | EASD2024
涂芷馨1,岳彤1,丁宇1,郑雪瑛1,骆斯慧1,翁建平1
1图书馆VIP附属第一医院,内分泌科
目的:使用机器学习算法探索基于蛋白质组和脂质组特征的代谢相关脂肪性肝病(MAFLD)与动脉粥样硬化之间的潜在关联。
方法:我们采集了符合MAFLD诊断标准的24名患者的血样。根据颈动脉和下肢动脉中是否均有斑块形成(基于血管超声检查),将患者分为PVP组和非PVP组。对血清样本进行基于数据独立采集的定量蛋白质组学分析,并采用液相色谱-质谱联用技术进行非靶向脂质组学分析。通过蛋白互作网络(PPI)定位关键蛋白,特征变量的筛选采用最小绝对收缩和选择算子(LASSO)回归,并通过随机森林(RF)分析构建模型,特征变量重要性使用SHapley加性解释进行评估。
结果:我们定量分析了7591个蛋白质组和1486种脂质代谢物。蛋白组学分析提示,PVP组和非PVP组之间有109种差异表达蛋白(P<0.05,|log2FC|≥1.5)。通过PPI网络分析,发现PPIA、TXN、CFL1、ARF1和SHH等蛋白在MAFLD与PVP的相互作用中起到关键作用,这些蛋白质参与氧化应激、炎症反应和免疫调节,可能导致内皮功能障碍和细胞外基质重构。2组之间有161种脂质代谢产物存在显著差异。使用LASSO回归选择了前15个特征纸质代谢物,并在RF模型中进行了进一步分析。通过SHAP值,我们确定了能够显著预测PVP的关键脂质代谢产物。对这些代谢产物进行了KEGG通路分析,结果显示鞘脂信号通路是涉及的主要通路。
结论:通过结合机器学习算法和多组学技术,我们发现了MAFLD患者中与PVP相关的蛋白质组和脂质组特征的改变。这些变化可能与鞘脂代谢的重塑有关,为理解MAFLD与血管并发症发展之间的关系提供了新的视角。
点评:
该研究通过应用机器学习算法,结合蛋白质组学和脂质组学的多组学分析方法,探索了代谢相关脂肪性肝病(MAFLD)患者合并多支血管斑块(PVP)的分子机制。研究设计严谨,利用LASSO回归和随机森林模型筛选和验证关键特征变量,并使用SHAP值对这些特征的贡献进行解释,提高了结果的可信度和解释性。发现的关键蛋白和脂质代谢物为理解MAFLD与血管并发症的潜在联系提供了新的生物学见解,尤其是鞘脂信号通路的突出作用。总体而言,研究内容具有创新性和探索性,使用先进的分析方法为相关疾病的机制研究提供了新的视角。然而,研究样本量较小,可能限制了结果的普遍适用性,需要在更大规模的队列中进行验证以进一步支持其结论。
基于机器学习模型识别代谢相关脂肪性肝病患者心血管疾病风险因素SO102-1063| EASD2024
张文皓1, 丁宇1, 岳彤1,郑雪瑛1, 骆斯慧1
1图书馆VIP附属第一医院(安徽省立医院),内分泌科
背景:非酒精性脂肪肝(NAFLD)与动脉粥样硬化性心血管疾病(ASCVD)风险增加相关,但其具体机制尚不明确。更重要的是,新定义的代谢相关脂肪性肝病(MAFLD)与ASCVD风险的关系研究较少。数据驱动的机器学习(ML)技术可能有助于发现MAFLD患者中与ASCVD最相关的风险因素。
方法:本研究对2010年1月1日至2022年5月26日期间在我院接受治疗的5,906名MAFLD患者的电子健康记录进行了深入分析。研究的主要目标是观察ASCVD的发生情况,该疾病包括冠心病、中风或因心力衰竭而住院。为了准确预测ASCVD的风险,本研究收集了涵盖8类常见心血管风险因素的40个关键特征,构建了一个预测因素池。在特征筛选阶段,采用了3种机器学习方法,包括LASSO回归、逻辑回归分析和互信息分析,以识别最具预测价值的特征。随后通过12种机器学习算法来构建ASCVD预测模型,并运用一系列评估指标,如受试者工作特征曲线下面积、准确率、灵敏度、特异性、阳性预测值、阴性预测值以及F1评分,来衡量各模型的性能,最终选出预测性能最为优异的模型。此外,为了更深入地理解各特征对模型预测结果的影响,本研究采用SHAP(Shapley加性解释)来评估特征的重要性。
结果:本研究共纳入了5,906名符合条件的MAFLD患者,平均年龄为57.5岁(SD:14.6岁),其中2,483名为女性(42.0%)。在这些患者中,2,113人(35.8%)有ASCVD病史。研究最终确定了12个独立的预测因子,这些因子被认为是评估ASCVD风险的重要临床特征。12种机器学习模型的测试集AUROC范围为0.755到0.816。其中,极限梯度提升模型(XGBoost)表现最佳,测试集AUC为0.816,准确率为76.4%;训练集AUC为0.856,准确率为77.7%。此外,研究利用SHAP值对模型中的特征进行了量化解释,提供了全局和局部两种视角的分析。结果显示,年龄超过60岁、血清总胆固醇超过5mmol/L、收缩压高于140 mmHg、舒张压低于70 mmHg或高于100 mmHg、eGFR低于90 ml/min/1.73m²,以及空腹血糖超过20 mmol/L的患者,其SHAP值显著为正,表明这些MAFLD患者属于ASCVD高风险群体。
结论:XGBoost模型表现优异,能够通过易于获取的患者参数识别出MAFLD患者中的ASCVD风险。将这些模型应用于临床后,患者将有望从早期的ASCVD诊断和治疗中获益。
点评:
这项研究通过深入分析大规模电子健康记录,并运用机器学习技术,成功识别了代谢相关脂肪性肝病患者中的动脉粥样硬化性心血管疾病风险因素,展示了显著的临床应用潜力。研究综合应用了12种主流机器学习模型,并通过对比发现XGBoost模型在性能上最为突出,提供了较为精准的风险预测结果。通过LASSO回归、逻辑回归及互信息分析筛选出的12个关键预测因子,并结合SHAP解释模型,增强了模型的可解释性,为临床决策提供了有力的支持。该研究开发的预测模型具有较高的准确率,有助于临床医生基于常规数据有效识别ASCVD高风险人群,从而实现早期干预。整体而言,这项研究不仅展示了机器学习技术在MAFLD患者ASCVD风险预测中的巨大潜力,也为相关领域的未来研究奠定了坚实基础。通过进一步优化模型和开展外部验证,该成果有望在临床实践中得到广泛应用。