• 中国精品科技期刊
  • 《中文核心期刊要目总览》收录期刊
  • RCCSE 中国核心期刊(5/114,A+)
  • Scopus收录期刊
  • 美国《化学文摘》(CA)收录期刊
  • WHO 西太平洋地区医学索引(WPRIM)收录期刊
  • 《中国科学引文数据库(CSCD)》核心库期刊 (C)
  • 中国科技核心期刊
  • 中国科技论文统计源期刊
  • 《日本科学技术振兴机构数据库(中国)》(JSTChina)收录期刊
  • 美国《乌利希期刊指南》(UIrichsweb)收录期刊
  • 中华预防医学会系列杂志优秀期刊(2019年)

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

多基因风险评分与机器学习建模策略下轻度认知障碍发展为阿尔茨海默病的预后研究

王荣 陈帅 赵彩丽 李梓盟 崔靖 王晓聪 赵春妮 刘龙

王荣, 陈帅, 赵彩丽, 李梓盟, 崔靖, 王晓聪, 赵春妮, 刘龙. 多基因风险评分与机器学习建模策略下轻度认知障碍发展为阿尔茨海默病的预后研究[J]. 中华疾病控制杂志, 2023, 27(6): 684-690. doi: 10.16462/j.cnki.zhjbkz.2023.06.012
引用本文: 王荣, 陈帅, 赵彩丽, 李梓盟, 崔靖, 王晓聪, 赵春妮, 刘龙. 多基因风险评分与机器学习建模策略下轻度认知障碍发展为阿尔茨海默病的预后研究[J]. 中华疾病控制杂志, 2023, 27(6): 684-690. doi: 10.16462/j.cnki.zhjbkz.2023.06.012
WANG Rong, CHEN Shuai, ZHAO Caili, LI Zimeng, CUI Jing, WANG Xiaocong, ZHAO Chunni, LIU Long. Prognostic study of mild cognitive impairment progressing to Alzheimer′s disease based on polygenic risk score and machine learning modeling strategy[J]. CHINESE JOURNAL OF DISEASE CONTROL & PREVENTION, 2023, 27(6): 684-690. doi: 10.16462/j.cnki.zhjbkz.2023.06.012
Citation: WANG Rong, CHEN Shuai, ZHAO Caili, LI Zimeng, CUI Jing, WANG Xiaocong, ZHAO Chunni, LIU Long. Prognostic study of mild cognitive impairment progressing to Alzheimer′s disease based on polygenic risk score and machine learning modeling strategy[J]. CHINESE JOURNAL OF DISEASE CONTROL & PREVENTION, 2023, 27(6): 684-690. doi: 10.16462/j.cnki.zhjbkz.2023.06.012

多基因风险评分与机器学习建模策略下轻度认知障碍发展为阿尔茨海默病的预后研究

doi: 10.16462/j.cnki.zhjbkz.2023.06.012
基金项目: 

国家自然科学基金 81903418

国家自然科学基金 82173632

详细信息
    通讯作者:

    刘龙,E-mail: biostat-ll@sxmu.edu.cn

    赵春妮,E-mail: 1964340853@qq.com

  • 中图分类号: R749.16

Prognostic study of mild cognitive impairment progressing to Alzheimer′s disease based on polygenic risk score and machine learning modeling strategy

Funds: 

National Natural Science Foundation of China 81903418

National Natural Science Foundation of China 82173632

More Information
  • 摘要:   目的  本研究从全基因组和候选基因组的角度探究多基因风险评分(polygenic risk score, PRS)与机器学习对轻度认知障碍(mild cognitive impairment, MCI)发展为阿尔茨海默病(alzheimer′s disease, AD)的预后预测性能, 为MCI发展为AD的第5年预后预测建模提供更有力的方法理论依据。  方法  借助聚类与阈值(clumping and thresholding, C+T)、多基因风险评分-连续收缩(polygenic risk scores-continuous shrinkage, PRS-CS)、随机生存森林(random survival forest, RSF)、生存支持向量机(survival support vector machine, SSVM)4种常用统计方法对MCI发展为AD的第5年生存情况进行预测建模。利用C+T与PRS-CS得到的AD遗传风险得分作为独立的预测因子纳入Cox比例风险回归模型, RSF与SSVM则从候选基因组角度直接纳入所有与AD有关的单核苷酸多态性(single nucleotide polymorphism, SNPs)进行统计建模。最后, 采用C指数作为模型预测效果的评价指标。  结果  无论是C+T还是PRS-CS方法, 在全基因组和候选基因组两种情况下的C指数差值均 < 0.01, 而两种方法的C指数差值最大为0.04, 二者差异均无统计学意义; 机器学习的方法明显好于PRS方法, RSF和SSVM的C指数均能达到0.76, 较C+T、PRS-CS高0.07、0.11, 差异有统计学意义(均P < 0.05)。  结论  机器学习方法表现优异, 为MCI发展为AD的预后预测提供了更为可行的统计建模方案。
  • 图  1  PRS与MCI发展为AD的K-M生存曲线

    1. C+T: 聚类与阈值; 2. PRS-CS:多基因风险评分-连续收缩; 3. MCI:轻度认知障碍; 4. AD:阿尔茨海默病。

    Figure  1.  K-M survival curves of PRS and MCI progressing into AD

    图  2  全基因组和候选基因组下PRS方法的十折交叉验证结果比较

    1. C+T: 聚类与阈值; 2. PRS-CS:多基因风险评分-连续收缩。

    Figure  2.  Comparison of ten-fold cross-validation results of PRS methods for whole genomes and candidate genomes

    图  3  候选基因组下PRS方法与机器学习方法十折交叉验证结果比较

    1. C+T: 聚类与阈值; 2. PRS-CS:多基因风险评分-连续收缩; 3. RSF:随机生存森林; 4. SSVM:生存支持向量机。

    Figure  3.  Comparison of ten-fold cross-validation results between the PRS method and machine learning method under candidate genomes

    表  1  基本信息

    Table  1.   Basic information

    变量 MCI(n=299) AD(n=130)
    年龄/岁(x±s) 72.57±7.39 73.46±6.85
    受教育程度(x±s) 15.97±2.87 16.09±2.91
    性别[人数(占比/%)]
      男 181(60.53) 81(62.30)
      女 118(39.47) 49(37.70)
    注:1. MCI:轻度认知障碍。2. AD:阿尔茨海默病。
    下载: 导出CSV

    表  2  PRS方法与机器学习方法十折交叉验证结果均值的多重比较

    Table  2.   Multiple comparisons of the means of ten-fold cross-validation results between the PRS method and machine learning method

    方法Ⅰ 方法Ⅱ 95% CI P
    PRS-CS C+T -0.098 1~0.020 2 0.190
    RSF -0.167 2~-0.048 9 0.001
    SSVM -0.169 2~-0.050 9 0.001
    C+T PRS-CS -0.020 2~0.098 1 0.190
    RSF -0.128 3~-0.010 0 0.023
    SSVM -0.130 3~-0.012 0 0.020
    RSF PRS-CS 0.048 9~0.167 2 0.001
    C+T 0.010 0~0.128 3 0.023
    SSVM -0.061 2~0.057 2 0.946
    SSVM PRS-CS 0.050 9~0.169 2 0.001
    C+T 0.012 0~0.130 3 0.020
    RSF -0.057 2~0.061 2 0.946
    注:1. RSF:随机生存森林。2. PRS-CS:多基因风险评分-连续收缩。3. C+T: 聚类与阈值。4. SSVM:生存支持向量机。5. 多重比较的P值使用Bonferroni法进行校正。
    下载: 导出CSV
  • [1] Nussbaum RL, Ellis CE. Alzheimer's disease and parkinson's disease[J]. N Engl J Med, 2003, 348(14): 1356-1364. DOI: 10.1056/NEJM2003ra020003.
    [2] Petersen RC. Mild cognitive impairment[J]. Continuum (Minneap Minn), 2016, 22(2 Dementia): 404-418. DOI: 10.1212/CON.0000000000000313.
    [3] Li HT, Yuan SX, Wu JS, et al. Predicting conversion from MCI to AD combining multi-modality data and based on molecular subtype[J]. Brain Sci, 2021, 11(6): 674. DOI: 10.3390/brainsci11060674.
    [4] Mamani NM. Machine learning techniques and polygenic risk score application to prediction genetic diseases[J]. ADCAIJ, 2020, 9(1): 5-14. DOI: 10.14201/ADCAIJ20209154.
    [5] Baker E, Escott-Price V. Polygenic risk scores in Alzheimer's disease: current applications and future directions[J]. Front Digit Health, 2020, 2: 14. DOI: 10.3389/fdgth.2020.00014.
    [6] Li J, Lu Q, Wen Y. Multi-kernel linear mixed model with adaptive lasso for prediction analysis on high-dimensional multi-omics data[J]. Bioinformatics, 2020, 36(6): 1785-1794. DOI: 10.1093/bioinformatics/btz822.
    [7] Privé F, Vilhjálmsson BJ, Aschard H, et al. Making the most of clumping and thresholding for polygenic scores[J]. Am J Hum Genet, 2019, 105(6): 1213-1221. DOI: 10.1016/j.ajhg.2019.11.001.
    [8] Ge T, Chen CY, Ni Y, et al. Polygenic prediction via Bayesian regression and continuous shrinkage priors[J]. Nat Commun, 2019, 10(1): 1776. DOI: 10.1038/s41467-019-09718-5.
    [9] Ishwaran H, Kogalur UB, Blackstone EH, et al. Random survival forests[J]. Thorac Oncol, 2008, 2(3): 841-860. DOI: 10.1214/08-AOAS169.
    [10] Evers L, Messow CM. Sparse kernel methods for high-dimensional survival data[J]. Bioinformatics, 2008, 24(14): 1632-1638. DOI: 10.1093/bioinformatics/btn253.
    [11] Deng Y, Cheng S, Huang H, et al. Toward better risk stratification for implantable cardioverter-defibrillator recipients: implication of machine learning models[J]. J Cardiovasc Dev Dis, 2022, 9(9): 310-325. DOI: 10.3390/jcdd9090310.
    [12] Kunkle BW, Grenier-Boley B, Sims R, et al. Genetic meta-analysis of diagnosed Alzheimer's disease identifies new risk loci and implicates Aβ, tau, immunity and lipid processing[J]. Nat Genet, 2019, 51(3): 414-430. DOI: 10.1038/s41588-019-0358-2.
    [13] Leonenko G, Baker E, Stevenson-Hoare J, et al. Identifying individuals with high risk of Alzheimer's disease using polygenic risk scores[J]. Nat Commun, 2021, 12(1): 4506. DOI: 10.1038/s41467-021-24082-z.
    [14] Ritchie K. Mild cognitive impairment: an epidemiological perspective[J]. Dialogues Clin Neurosci, 2004, 6(4): 401-408. DOI: 10.31887/DCNS.2004.6.4/kritchie.
  • 加载中
图(3) / 表(2)
计量
  • 文章访问数:  198
  • HTML全文浏览量:  73
  • PDF下载量:  34
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-08-08
  • 修回日期:  2022-10-27
  • 网络出版日期:  2023-07-10
  • 刊出日期:  2023-06-10

目录

    /

    返回文章
    返回