• 中国精品科技期刊
  • 《中文核心期刊要目总览》收录期刊
  • RCCSE 中国核心期刊(5/114,A+)
  • Scopus收录期刊
  • 美国《化学文摘》(CA)收录期刊
  • WHO 西太平洋地区医学索引(WPRIM)收录期刊
  • 《中国科学引文数据库(CSCD)》核心库期刊 (C)
  • 中国科技核心期刊
  • 中国科技论文统计源期刊
  • 《日本科学技术振兴机构数据库(中国)》(JSTChina)收录期刊
  • 美国《乌利希期刊指南》(UIrichsweb)收录期刊
  • 中华预防医学会系列杂志优秀期刊(2019年)

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

女性非小细胞肺癌潜在相关基因的生物信息学分析及功能预测

汪向海 朱玉

汪向海, 朱玉. 女性非小细胞肺癌潜在相关基因的生物信息学分析及功能预测[J]. 中华疾病控制杂志, 2023, 27(3): 281-287. doi: 10.16462/j.cnki.zhjbkz.2023.03.006
引用本文: 汪向海, 朱玉. 女性非小细胞肺癌潜在相关基因的生物信息学分析及功能预测[J]. 中华疾病控制杂志, 2023, 27(3): 281-287. doi: 10.16462/j.cnki.zhjbkz.2023.03.006
WANG Xiang-hai, ZHU Yu. Integrative bioinformatic and functional analyses of genes related to non-small cell lung cancer in female[J]. CHINESE JOURNAL OF DISEASE CONTROL & PREVENTION, 2023, 27(3): 281-287. doi: 10.16462/j.cnki.zhjbkz.2023.03.006
Citation: WANG Xiang-hai, ZHU Yu. Integrative bioinformatic and functional analyses of genes related to non-small cell lung cancer in female[J]. CHINESE JOURNAL OF DISEASE CONTROL & PREVENTION, 2023, 27(3): 281-287. doi: 10.16462/j.cnki.zhjbkz.2023.03.006

女性非小细胞肺癌潜在相关基因的生物信息学分析及功能预测

doi: 10.16462/j.cnki.zhjbkz.2023.03.006
基金项目: 

安徽省高等学校优秀人才支持计划项目 gxyq2021256

安徽省卫生健康委员会科研项目 AHWJ2021b073

皖南医学院弋矶山医院引进人才基金 YR202118

详细信息
    通讯作者:

    朱玉,E-mail:kutuomonk@wnmc.edu.cn

  • 中图分类号: R817.1

Integrative bioinformatic and functional analyses of genes related to non-small cell lung cancer in female

Funds: 

Excellent Talents Support Program of Colleges and Universities in Anhui Province gxyq2021256

Scientific Research Project of Anhui Provincial Health Commission AHWJ2021b073

Talent Introduction Fund of Yijishan Hospital of Wannan Medical College YR202118

More Information
  • 摘要:   目的  通过对女性非小细胞肺癌(non-small cell lung cancer, NSCLC)相关基因的生物信息学分析和功能预测,探讨女性NSCLC的发病机制和预后生物标志物。  方法  从基因表达综合数据库(Gene Expression Omnibus, GEO)下载女性NSCLC患者的数据,使用limma包鉴定差异表达基因(differentially expressed genes, DEGs)。对DEGs进行基因本体(Gene Ontology, GO)和Kyoto Encyclopedia of Genes and Genomes(KEGG)分析和构建蛋白质相互作用(protein-protein interaction, PPI) 网络分析。利用igraph包筛选关键DEG,利用Oncomine数据库及NSCLC细胞系验证关键DEGs的表达情况,并采用Log-rank检验分析关键DEGs的表达水平与女性NSCLC患者预后的关联。  结果  共筛选出500个DEGs,GO富集分析表明,DEGs主要参与细胞增殖、细胞迁移和细胞外结构组成(均有P < 0.05)。KEGG富集分析表明,这些途径主要与细胞外基质(extracellular matrix, ECM)受体相互作用、蛋白质消化吸收和白细胞跨内皮迁移信号有关。通过PPI网络分析得到3个关键DEGs:白细胞介素-6(interleukin-6, IL-6)、表皮细胞生长因子(epidermal growth factor, EGF)和基质金属蛋白酶-9(matrix metalloprotein-9, MMP-9)。Oncomine数据库分析和NSCLC细胞系结果显示NSCLC组织和细胞系中IL-6的表达较低,而EGF和MMP-9的表达较高。Log-rank检验表明IL-6(χ2= 6.90,P=0.009)和EGF(χ2= 7.73,P=0.005)表达与女性NSCLC患者预后有关。  结论  在女性NSCLC患者中,IL-6和EGF可能是NSCLC发病与预后机制中的重要基因,是治疗的潜在靶点。
  • 肺癌已经成为世界范围内一个主要的公共卫生问题。研究[1-4]表明,女性非小细胞肺癌(non-small cell lung cancer, NSCLC)发病率较高,预后较差。目前,女性NSCLC患者是一个特殊而庞大的恶性肿瘤患者群体。环境因素和遗传易感性可能是导致女性NSCLC风险的主要因素[5]。在本研究中,从基因表达综合数据库(Gene Expression Omnibus, GEO)下载了女性NSCLC患者的基因表达微阵列,并使用limma包分析NSCLC组织与正常肺组织间基因表达谱的差异,筛选出差异表达基因(differentially expressed genes, DEGs),评估其临床价值与疾病的严重程度和预后。本研究旨在进一步探讨女性NSCLC发生的分子机制及其生物学标志物,为NSCLC的早期诊断、精确治疗和预后提供依据。

    从GEO数据库下载GSE19804和GSE31210芯片数据集, 两个芯片平台都是GPL570。GSE19804的数据包括60例女性NSCLC组织样本和肺癌旁组织[6]。GSE31210包含246例组织样本,其中含121例女性NSCLC样本和9例正常女性肺癌旁组织[7]。使用limma包鉴定DEGs,DEGs筛选标准:为|log2FC|>1且FDR < 0.01。通过检索Oncomine数据库,分析不同NSCLC数据集中关键DEGs的相对表达水平,验证筛选结果。

    利用cluster Profiler包对DEG进行基因本体(Gene Ontology, GO)和Kyoto Encyclopedia of Genes and Genomes(KEGG)分析和功能注释。研究分析了DEGs的主要生物学过程和肿瘤相关的信号通路,以期对DEGs的机制和功能有更全面的了解。

    STRING是一个强大的PPI在线分析网站。利用该网站构建了关键DEG的PPI网络,随后利用igraph包计算PPI网络各节点中心度,关键DEGs的定义为中心度前3位的DEGs。

    人正常支气管上皮细胞系(16HBE)、肺腺癌细胞系(PC9)和肺鳞状细胞癌系(SK-MES-1)购自中国科学院生物化学与细胞生物学研究所。16HBE和PC9细胞培养使用RPMI-1640培养基中。SK-MES-1细胞培养使用DMEM培养基中。培养基中添加10%胎牛血清(fetal bovine serum, FBS),细胞在37 ℃、含5% CO2的恒温培养箱中常规培养。

    用TRIzol试剂(Invitrogen)从培养细胞中提取总RNA。用反转录试剂盒(TaKaRa)合成cDNA。本研究用SYBR Premix Ex Taq Ⅱ试剂盒(TaKaRa)进行实时荧光定量聚合酶链式反应(Real-time fluorescence quantitative polymerase chain reaction, Real-time PCR),以GAPDH为内参基因,根据Real-time PCR所得出的Ct值及2-ΔΔCT方法计算结果。见表 1

    表  1  各基因引物
    Table  1.  Primers for each gene
    基因引物 引物序列
    IL-6上游引物 GAGATACCACTCCCAACAGACC
    IL-6下游引物 AAGTGCATCATCGTTGTTCATACA
    EGF上游引物 TCTGAACCCGGACGGATTG
    EGF下游引物 GACATCGCTCGCGAACGTAG
    MMP-9上游引物 GAGATACCACTCCCAACAGACC
    MMP-9下游引物 CCGAGTTGGAACCACGACGC
    GAPDH上游引物 GGAGCGAGATCCCTCCAAAAT
    GAPDH下游引物 GGCTGTTGTCATACTTCTCATGG
    下载: 导出CSV 
    | 显示表格

    GSE31210数据集含有121例女性NSCLC患者生存数据,故利用该数据集分析关键DEGs表达水平与患者预后间的关联。

    利用最大选择秩统计量(maxstat包)识别关键DEGs的最佳离散化节点,将女性NSCLC患者分为高表达和低表达两组,采用Log-rank检验比较两组患者的总生存率。用Dunnett t检验比较不同细胞系间关键DEGs表达水平差异。数据分析和结果可视化均使用R 3.3.2软件。检验水准α=0.05。

    GSE19804含有60例女性研究对象,平均年龄61.15岁,差异基因分析发现GSE19804含1 160个DEGs。GSE31210含121例女性研究对象,平均年龄61.15岁,差异基因分析发现780个DEGs。两者含500个共同的DEGs。见图 1

    图  1  GSE19804和GSE31210数据集中筛选DEGs
    Figure  1.  Screening DEGs in GSE19804 and GSE31210 datasets

    利用cluster Profiler包对500个DEGs进行GO和KEGG富集分析。GO分析结果显示,在生物学过程中,DEGs主要富集于上皮细胞增殖调控、细胞迁移、细胞外结构组成(均有P < 0.05)。在细胞成分方面,DEGs主要富集于糖胺聚糖结合、细胞外基质结构和酰胺结合(均有P < 0.05)。在分子功能中,DEGs主要富集于糖胺聚糖结合、细胞外基质结构构建和酰胺结合(均有P < 0.05)。KEGG富集分析的结果表明,DEGs主要富集于ECM受体相互作用、蛋白质消化和吸收,以及白细胞横向迁移(均有P < 0.05)。见图 2

    图  2  DEGs的GO分析和KEGG分析
    注:A:生物学过程;B:细胞成分;C:分子功能;D: KEGG富集分析的气泡图。
    Figure  2.  GO and KEGG analysis of DEGs

    将500个DEGs导入STRING进行分析,得到PPI网络。PPI网络由482个节点蛋白和1 678个相互作用组成。最后筛选出3个位于关键位置的基因:白细胞介素-6(interleukin-6, IL-6)、表皮生长因子(epidermal growth factor, EGF)和基质金属蛋白酶9(matrix metalloproteinase 9, MMP-9)。IL-6、EGF和MMP-9的中心度分别为75、58和42。见图 3

    图  3  使用STRING在线工具对DEGs进行PPI网络分析
    Figure  3.  PPI network analysis of DEGs using STRING online tool

    在GSE19804和GSE31210中3个DEGs呈相同的表达模式,IL-6在女性NSCLC组织表达水平下降,而EGF和MMP-9在女性NSCLC组织表达水平上升。进一步分析GSE31210数据集中3个DEGs的表达水平与女性NSCLC患者预后的关联,共有121例女性NSCLC患者生存数据。生存分析显示,IL-6(χ2 = 6.90,P=0.009)和EGF(χ2 = 7.73,P=0.005)与女性患者的NSCLC预后相关。见图 4图 5

    图  4  女性NSCLC组织样本和癌旁组织中IL-6、EGF和MMP-9的相对表达水平
    注:A-C:GSE19804中表达情况(60对NSCLC组织和癌旁组织);D-F:GSE31210中表达情况(121例NSCLC样本和9例癌旁组织)。
    Figure  4.  Relative expression levels of IL-6, EGF and MMP-9 in female NSCLC tissue samples and adjacent tissues
    图  5  IL-6、EGF和MMP-9的表达水平与女性NSCLC患者生存期的关联
    Figure  5.  Relationship between expression levels of IL-6, EGF and MMP-9 and survival time of female patients with NSCLC

    对8个数据集的分析发现,女性NSCLC组织中IL-6的表达低于正常肺组织(P < 0.001),而NSCLC组织中EGF(P=0.035)和MMP-9(P < 0.001)的表达高于正常肺组织,见图 6

    图  6  Oncomine数据库中IL-6、EGF和MMP-9表达水平分析
    注:1~8代表 8个不同的研究数据集,红色代表过度表达,蓝色代表低表达。
    Figure  6.  Expression levels of IL-6, EGF and MMP-9 in Oncomine database

    采用Real-time PCR检测NSCLC细胞和16HBE细胞中IL-6、EGF和MMP-9的表达,NSCLC细胞中IL-6的表达低于16HBE细胞系(P < 0.001),而NSCLC细胞中EGF和MMP-9的表达高于16HBE细胞系(P < 0.001),见图 7

    图  7  细胞中IL-6、EGF和MMP-9的相对表达水平
    注:A:IL-6在16HBE、PC9、SK-MES-1细胞中的相对表达水平;B:EGF在16HBE、PC9、SK-MES-1细胞中的相对表达水平;C:MMP-9在16HBE、PC9、SK-MES-1细胞中的相对表达水平;a P<0.01。
    Figure  7.  Relative expression levels of IL-6, EGF and MMP-9 in cells

    随着医疗研究的不断发展,女性NSCLC患者在新发肺癌病例中的比例增加[8]。目前,女性NSCLC的具体分子机制尚未完全阐明,已有研究[9]表明其涉及许多基因的异常表达、失活和突变,以及多种相关信号通路的参与。随着第二代测序技术的发展,利用生物信息学方法分析女性NSCLC患者的治疗靶点是当前的研究热点[10]。本研究使用生物信息学在GSE19804和GSE31210数据集中筛选出500个女性NSCLC患者共同的DEGs。

    接着对这些DEGs的功能富集分析表明,它们主要参与细胞增殖、细胞迁移和血管发育调控。KEGG分析表明,它主要与ECM受体相互作用、蛋白质消化和吸收、白细胞跨内皮迁移和其他信号通路有关,这些发现有助于进一步探讨其机制。本课题还筛选出3个与女性NSCLC发生发展密切相关的关键基因(IL-6、EGF和MMP-9),为NSCLC的后续治疗研究提供了可能的靶点。

    IL-6通过两种途径调节肿瘤活性,其主要促瘤作用是产生辅助性T细胞(T helper 17 cell, Th17),抑制树突状细胞和CD8+T细胞活性,IL-6还可以通过抑制调节细胞抑制恶性肿瘤[11]。在大肠癌中,还观察到IL-6介导的代谢性免疫抑制和胰腺癌之间的复杂相互作用[12]。在本研究中发现IL-6在NSCLC组织中的表达低于正常肺组织。因此,根据课题初步研究结果推测IL-6在肿瘤免疫过程中具有双向调节作用。NSCLC患者血清IL-6的低表达水平可能是促进NSCLC发生发展的重要因素之一,但其具体机制尚不清楚。

    EGF是一种由53个氨基酸残基组成的低分子量肽链,是一种强促有丝分裂剂。它能促进肿瘤细胞生长,诱导肿瘤细胞侵袭,与肝癌、胃癌、乳腺癌等恶性肿瘤患者的预后密切相关[13-14]。MMP-9是降解细胞外基质的最重要的蛋白水解酶,是MMP家族中一种重要的基质金属蛋白酶。它是一种Zn2+依赖的细胞外蛋白水解酶,可降解细胞外基质并促进肿瘤细胞的侵袭和转移[15]

    综上所述,基于大数据通过生物信息学分析,获得了女性NCSLC患者的3个关键DEGs及其生物学功能。GEO和Oncomine数据库分析发现,女性NSCLC组织中IL-6的表达低于正常肺组织,而EGF和MMP-9的表达高于正常肺组织。此外,Real-time PCR证实了IL-6、EGF和MMP-9在NCSLC细胞中的表达,这进一步支持了生物信息学分析的结果。其中,IL-6和EGF与女性NSCLC的预后相关,为后续研究女性NCSLC的预后提供了一个潜在的靶点。目前,关于IL-6与NCSLC发生发展的相关性研究较少。虽然大数据可以揭示相关性,但仍需要做进一步的基础和临床研究。

  • 图  1  GSE19804和GSE31210数据集中筛选DEGs

    Figure  1.  Screening DEGs in GSE19804 and GSE31210 datasets

    图  2  DEGs的GO分析和KEGG分析

    注:A:生物学过程;B:细胞成分;C:分子功能;D: KEGG富集分析的气泡图。

    Figure  2.  GO and KEGG analysis of DEGs

    图  3  使用STRING在线工具对DEGs进行PPI网络分析

    Figure  3.  PPI network analysis of DEGs using STRING online tool

    图  4  女性NSCLC组织样本和癌旁组织中IL-6、EGF和MMP-9的相对表达水平

    注:A-C:GSE19804中表达情况(60对NSCLC组织和癌旁组织);D-F:GSE31210中表达情况(121例NSCLC样本和9例癌旁组织)。

    Figure  4.  Relative expression levels of IL-6, EGF and MMP-9 in female NSCLC tissue samples and adjacent tissues

    图  5  IL-6、EGF和MMP-9的表达水平与女性NSCLC患者生存期的关联

    Figure  5.  Relationship between expression levels of IL-6, EGF and MMP-9 and survival time of female patients with NSCLC

    图  6  Oncomine数据库中IL-6、EGF和MMP-9表达水平分析

    注:1~8代表 8个不同的研究数据集,红色代表过度表达,蓝色代表低表达。

    Figure  6.  Expression levels of IL-6, EGF and MMP-9 in Oncomine database

    图  7  细胞中IL-6、EGF和MMP-9的相对表达水平

    注:A:IL-6在16HBE、PC9、SK-MES-1细胞中的相对表达水平;B:EGF在16HBE、PC9、SK-MES-1细胞中的相对表达水平;C:MMP-9在16HBE、PC9、SK-MES-1细胞中的相对表达水平;a P<0.01。

    Figure  7.  Relative expression levels of IL-6, EGF and MMP-9 in cells

    表  1  各基因引物

    Table  1.   Primers for each gene

    基因引物 引物序列
    IL-6上游引物 GAGATACCACTCCCAACAGACC
    IL-6下游引物 AAGTGCATCATCGTTGTTCATACA
    EGF上游引物 TCTGAACCCGGACGGATTG
    EGF下游引物 GACATCGCTCGCGAACGTAG
    MMP-9上游引物 GAGATACCACTCCCAACAGACC
    MMP-9下游引物 CCGAGTTGGAACCACGACGC
    GAPDH上游引物 GGAGCGAGATCCCTCCAAAAT
    GAPDH下游引物 GGCTGTTGTCATACTTCTCATGG
    下载: 导出CSV
  • [1] Levy DT, Meza R, Zhang YA, et al. Gauging the effect of U.S. tobacco control policies from 1965 through 2014 using SimSmoke[J]. Am J Prev Med, 2016, 50(4): 535-542. DOI: 10.1016/j.amepre.2015.10.001.
    [2] Sauer AG, Siegel RL, Jemal A, et al. Updated review of prevalence of major risk factors and use of screening tests for cancer in the United States[J]. Cancer Epidemiol Biomarkers Prev, 2017, 26(8): 1192-1208. DOI: 10.1158/1055-9965.EPI-17-0219.
    [3] Vavalà T, Levra MG, Novello S. Lung cancer in never smokers: a different disease[J]. Curr Respir Care Rep, 2014, 3(1): 26-34. DOI: 10.1038/nrc2190.
    [4] Kim JH, Park K, Yim SH, et al. Genome-wide association study of lung cancer in Korean non-smoking women[J]. J Korean Med Sci, 2013, 28(6): 840-847. DOI: 10.3346/jkms.2013.28.6.840.
    [5] Huber RM. Is lung cancer in never-smokers a different disease?-Back to the figures[J]. J Thorac Oncol, 2007, 2(9): 787-788. DOI: 10.1097/JTO.0b013e318153f3c5.
    [6] Lu TP, Tsai MH, Lee JM, et al. Identification of a novel biomarker, SEMA5A, for non-small cell lung carcinoma in nonsmoking women[J]. Cancer Epidemiol Biomarkers Prev, 2010, 19(10): 2590-2597. DOI: 10.1158/1055-9965.EPI-10-0332.
    [7] Yamauchi M, Yamaguchi R, Nakata A, et al. Epidermal growth factor receptor tyrosine kinase defines critical prognostic genes of stage Ⅰ lung adenocarcinoma[J]. PLoS One, 2012, 7(9): e43923. DOI: 10.1371/journal.pone.0043923.
    [8] Stiles BM, Rahouma M, Hussein MK, et al. Never smokers with resected lung cancer: different demographics, similar survival[J]. Eur J Cardiothorac Surg, 2018, 53(4): 842-848. DOI: 10.1093/ejcts/ezx390.
    [9] Choi JR, Park SY, Noh OK, et al. Gene mutation discovery research of non-smoking lung cancer patients due to indoor radon exposure[J]. Ann Occup Environ Med, 2016, 28(1): 13. DOI: 10.1186/s40557-016-0095-2.
    [10] Zhao JG, Wang JF, Feng JF, et al. HHIP overexpression inhibits the proliferation, migration and invasion of non-small cell lung cancer[J]. PLoS One, 2019, 14(11): e0225755. DOI: 10.1371/journal.pone.0225755.
    [11] Tsukamoto H, Fujieda K, Senju S, et al. Immune-suppressive effects of interleukin-6 on T-cell-mediated anti-tumour immunity[J]. Cancer Sci, 2018, 109(3): 523-530. DOI: 10.1111/cas.13433.
    [12] Flint TR, Janowitz T, Connell CM, et al. Tumor-induced IL-6 reprograms host metabolism to suppress antitumour immunity[J]. Cell Metab, 2016, 24(5): 672-684. DOI: 10.1016/j.cmet.2016.10.010.
    [13] Jiang W, Tian W, Ijaz M, et al. Inhibition of EGF induced migration and invasion by sulfated polysaccharide of sepiella maindroni ink via the suppression of EGFR/Akt/p38/MAPK/MMP-2 signaling pathway in KB cells[J]. Biomed Pharmaeother, 2017(11): 95-102. DOI: 10.1016/j.biopha.2017.08.050.
    [14] Kim J, Kong JN, Chang H, et al. EGF induces epithelial-mesenchymal transition through phospho-Smad2/3-Snail signalling pathway in breast cancer cells[J]. Oncotarget, 2016, 7(51): 85021-85032. DOI: 10.18632/oncotarget.13116.
    [15] Ni Y, Ye X, Wan C, et al. Percutaneous microwave ablation(MWA)increased the serum levels of VEGF and MMP-9 in stage Ⅰ non-small-cell lung cancer (NSCLC)[J]. Int J Hyperthermia, 2017, 33(4): 435-439. DOI: 10.1080/02656736.2017.1284350.
  • 期刊类型引用(1)

    1. 蓝肖玲,方丽妮,潘雪梅. 钴胺素转运蛋白1在肺腺癌中的表达及其与患者预后的关系研究. 中国当代医药. 2023(35): 111-114 . 百度学术

    其他类型引用(1)

  • 加载中
图(7) / 表(1)
计量
  • 文章访问数:  427
  • HTML全文浏览量:  226
  • PDF下载量:  24
  • 被引次数: 2
出版历程
  • 收稿日期:  2021-08-03
  • 修回日期:  2021-12-28
  • 网络出版日期:  2023-04-04
  • 刊出日期:  2023-03-10

目录

/

返回文章
返回