Integrative bioinformatic and functional analyses of genes related to non-small cell lung cancer in female
-
摘要:
目的 通过对女性非小细胞肺癌(non-small cell lung cancer, NSCLC)相关基因的生物信息学分析和功能预测,探讨女性NSCLC的发病机制和预后生物标志物。 方法 从基因表达综合数据库(Gene Expression Omnibus, GEO)下载女性NSCLC患者的数据,使用limma包鉴定差异表达基因(differentially expressed genes, DEGs)。对DEGs进行基因本体(Gene Ontology, GO)和Kyoto Encyclopedia of Genes and Genomes(KEGG)分析和构建蛋白质相互作用(protein-protein interaction, PPI) 网络分析。利用igraph包筛选关键DEG,利用Oncomine数据库及NSCLC细胞系验证关键DEGs的表达情况,并采用Log-rank检验分析关键DEGs的表达水平与女性NSCLC患者预后的关联。 结果 共筛选出500个DEGs,GO富集分析表明,DEGs主要参与细胞增殖、细胞迁移和细胞外结构组成(均有P < 0.05)。KEGG富集分析表明,这些途径主要与细胞外基质(extracellular matrix, ECM)受体相互作用、蛋白质消化吸收和白细胞跨内皮迁移信号有关。通过PPI网络分析得到3个关键DEGs:白细胞介素-6(interleukin-6, IL-6)、表皮细胞生长因子(epidermal growth factor, EGF)和基质金属蛋白酶-9(matrix metalloprotein-9, MMP-9)。Oncomine数据库分析和NSCLC细胞系结果显示NSCLC组织和细胞系中IL-6的表达较低,而EGF和MMP-9的表达较高。Log-rank检验表明IL-6(χ2= 6.90,P=0.009)和EGF(χ2= 7.73,P=0.005)表达与女性NSCLC患者预后有关。 结论 在女性NSCLC患者中,IL-6和EGF可能是NSCLC发病与预后机制中的重要基因,是治疗的潜在靶点。 Abstract:Objective To explore the pathogenesis and prognostic biomarkers of non-small cell lung cancer (NSCLC) in female patients by bioinformatic analysis and functional prediction of potential NSCLC-associated genes. Methods Gene expression profile data for female patients with NSCLC were downloaded from the Gene Expression Omnibus (GEO) database, and differentially expressed genes (DEGs) were identified using limma package. Gene Ontology (GO), Kyoto Encyclopedia of Genes and Genomes (KEGG) and protein-protein interaction (PPI) analyses were performed for DEGs. The igraph package was used to screen the key DEGs from PPI. The expression pattern of key DEGs were confirmed in Oncomine database and NSCLC cell lines. The Log-rank test was used to assess the association between key DEGs and overall survival. Results A total of 500 DEGs were identified, and GO analysis showed that these genes were mainly involved in cell proliferation, cell migration, and extracellular structure organization (P < 0.05). The KEGG analysis indicated that these genes were primarily related to ECM-receptor interactions, protein digestion and absorption, and leukocyte transendothelial migration signalling. Three key DEGs [interleukin-6 (IL-6), epidermal growth factor (EGF), matrix metalloprotein-9 (MMP-9)] were screened from the PPI network. The expression of IL-6 was downregulated in NSCLC tissues and cell lines, while EGF and MMP-9 expressions were upregulated. The log-rank test found that IL-6 and EGF were associated with overall survival of female patients with NSCLC. Conclusions In female patients, IL-6 (χ2 =6.90, P=0.009) and EGF (χ2 =7.73, P=0.005) may be key genes for pathogenesis and prognosis of NSCLC, and represent novel therapeutic targets. -
肺癌已经成为世界范围内一个主要的公共卫生问题。研究[1-4]表明,女性非小细胞肺癌(non-small cell lung cancer, NSCLC)发病率较高,预后较差。目前,女性NSCLC患者是一个特殊而庞大的恶性肿瘤患者群体。环境因素和遗传易感性可能是导致女性NSCLC风险的主要因素[5]。在本研究中,从基因表达综合数据库(Gene Expression Omnibus, GEO)下载了女性NSCLC患者的基因表达微阵列,并使用limma包分析NSCLC组织与正常肺组织间基因表达谱的差异,筛选出差异表达基因(differentially expressed genes, DEGs),评估其临床价值与疾病的严重程度和预后。本研究旨在进一步探讨女性NSCLC发生的分子机制及其生物学标志物,为NSCLC的早期诊断、精确治疗和预后提供依据。
1. 资料与方法
1.1 差异基因筛选与Oncomine数据库验证
从GEO数据库下载GSE19804和GSE31210芯片数据集, 两个芯片平台都是GPL570。GSE19804的数据包括60例女性NSCLC组织样本和肺癌旁组织[6]。GSE31210包含246例组织样本,其中含121例女性NSCLC样本和9例正常女性肺癌旁组织[7]。使用limma包鉴定DEGs,DEGs筛选标准:为|log2FC|>1且FDR < 0.01。通过检索Oncomine数据库,分析不同NSCLC数据集中关键DEGs的相对表达水平,验证筛选结果。
1.2 GO和KEGG富集分析
利用cluster Profiler包对DEG进行基因本体(Gene Ontology, GO)和Kyoto Encyclopedia of Genes and Genomes(KEGG)分析和功能注释。研究分析了DEGs的主要生物学过程和肿瘤相关的信号通路,以期对DEGs的机制和功能有更全面的了解。
1.3 女性NSCLC关键DEGs的筛选
STRING是一个强大的PPI在线分析网站。利用该网站构建了关键DEG的PPI网络,随后利用igraph包计算PPI网络各节点中心度,关键DEGs的定义为中心度前3位的DEGs。
1.4 细胞系验证关键DEGs表达情况
人正常支气管上皮细胞系(16HBE)、肺腺癌细胞系(PC9)和肺鳞状细胞癌系(SK-MES-1)购自中国科学院生物化学与细胞生物学研究所。16HBE和PC9细胞培养使用RPMI-1640培养基中。SK-MES-1细胞培养使用DMEM培养基中。培养基中添加10%胎牛血清(fetal bovine serum, FBS),细胞在37 ℃、含5% CO2的恒温培养箱中常规培养。
1.5 RNA提取和Real-time PCR检测
用TRIzol试剂(Invitrogen)从培养细胞中提取总RNA。用反转录试剂盒(TaKaRa)合成cDNA。本研究用SYBR Premix Ex Taq Ⅱ试剂盒(TaKaRa)进行实时荧光定量聚合酶链式反应(Real-time fluorescence quantitative polymerase chain reaction, Real-time PCR),以GAPDH为内参基因,根据Real-time PCR所得出的Ct值及2-ΔΔCT方法计算结果。见表 1。
表 1 各基因引物Table 1. Primers for each gene基因引物 引物序列 IL-6上游引物 GAGATACCACTCCCAACAGACC IL-6下游引物 AAGTGCATCATCGTTGTTCATACA EGF上游引物 TCTGAACCCGGACGGATTG EGF下游引物 GACATCGCTCGCGAACGTAG MMP-9上游引物 GAGATACCACTCCCAACAGACC MMP-9下游引物 CCGAGTTGGAACCACGACGC GAPDH上游引物 GGAGCGAGATCCCTCCAAAAT GAPDH下游引物 GGCTGTTGTCATACTTCTCATGG 1.6 关键DEGs表达水平与患者预后间关联
GSE31210数据集含有121例女性NSCLC患者生存数据,故利用该数据集分析关键DEGs表达水平与患者预后间的关联。
1.7 统计学方法
利用最大选择秩统计量(maxstat包)识别关键DEGs的最佳离散化节点,将女性NSCLC患者分为高表达和低表达两组,采用Log-rank检验比较两组患者的总生存率。用Dunnett t检验比较不同细胞系间关键DEGs表达水平差异。数据分析和结果可视化均使用R 3.3.2软件。检验水准α=0.05。
2. 结果
2.1 发现500个女性NSCLC患者共同的DEGs
GSE19804含有60例女性研究对象,平均年龄61.15岁,差异基因分析发现GSE19804含1 160个DEGs。GSE31210含121例女性研究对象,平均年龄61.15岁,差异基因分析发现780个DEGs。两者含500个共同的DEGs。见图 1。
2.2 500个DEGs的生物学功能分析
利用cluster Profiler包对500个DEGs进行GO和KEGG富集分析。GO分析结果显示,在生物学过程中,DEGs主要富集于上皮细胞增殖调控、细胞迁移、细胞外结构组成(均有P < 0.05)。在细胞成分方面,DEGs主要富集于糖胺聚糖结合、细胞外基质结构和酰胺结合(均有P < 0.05)。在分子功能中,DEGs主要富集于糖胺聚糖结合、细胞外基质结构构建和酰胺结合(均有P < 0.05)。KEGG富集分析的结果表明,DEGs主要富集于ECM受体相互作用、蛋白质消化和吸收,以及白细胞横向迁移(均有P < 0.05)。见图 2。
2.3 构建DEGs的PPI网络
将500个DEGs导入STRING进行分析,得到PPI网络。PPI网络由482个节点蛋白和1 678个相互作用组成。最后筛选出3个位于关键位置的基因:白细胞介素-6(interleukin-6, IL-6)、表皮生长因子(epidermal growth factor, EGF)和基质金属蛋白酶9(matrix metalloproteinase 9, MMP-9)。IL-6、EGF和MMP-9的中心度分别为75、58和42。见图 3。
2.4 关键DEGs的表达及其与女性NSCLC预后的关系
在GSE19804和GSE31210中3个DEGs呈相同的表达模式,IL-6在女性NSCLC组织表达水平下降,而EGF和MMP-9在女性NSCLC组织表达水平上升。进一步分析GSE31210数据集中3个DEGs的表达水平与女性NSCLC患者预后的关联,共有121例女性NSCLC患者生存数据。生存分析显示,IL-6(χ2 = 6.90,P=0.009)和EGF(χ2 = 7.73,P=0.005)与女性患者的NSCLC预后相关。见图 4、图 5。
2.5 Oncomine数据库分析女性NSCLC组织和正常肺组织中IL-6、EGF和MMP-9表达
对8个数据集的分析发现,女性NSCLC组织中IL-6的表达低于正常肺组织(P < 0.001),而NSCLC组织中EGF(P=0.035)和MMP-9(P < 0.001)的表达高于正常肺组织,见图 6。
2.6 IL-6、EGF和MMP-9在细胞中的表达水平
采用Real-time PCR检测NSCLC细胞和16HBE细胞中IL-6、EGF和MMP-9的表达,NSCLC细胞中IL-6的表达低于16HBE细胞系(P < 0.001),而NSCLC细胞中EGF和MMP-9的表达高于16HBE细胞系(P < 0.001),见图 7。
3. 讨论
随着医疗研究的不断发展,女性NSCLC患者在新发肺癌病例中的比例增加[8]。目前,女性NSCLC的具体分子机制尚未完全阐明,已有研究[9]表明其涉及许多基因的异常表达、失活和突变,以及多种相关信号通路的参与。随着第二代测序技术的发展,利用生物信息学方法分析女性NSCLC患者的治疗靶点是当前的研究热点[10]。本研究使用生物信息学在GSE19804和GSE31210数据集中筛选出500个女性NSCLC患者共同的DEGs。
接着对这些DEGs的功能富集分析表明,它们主要参与细胞增殖、细胞迁移和血管发育调控。KEGG分析表明,它主要与ECM受体相互作用、蛋白质消化和吸收、白细胞跨内皮迁移和其他信号通路有关,这些发现有助于进一步探讨其机制。本课题还筛选出3个与女性NSCLC发生发展密切相关的关键基因(IL-6、EGF和MMP-9),为NSCLC的后续治疗研究提供了可能的靶点。
IL-6通过两种途径调节肿瘤活性,其主要促瘤作用是产生辅助性T细胞(T helper 17 cell, Th17),抑制树突状细胞和CD8+T细胞活性,IL-6还可以通过抑制调节细胞抑制恶性肿瘤[11]。在大肠癌中,还观察到IL-6介导的代谢性免疫抑制和胰腺癌之间的复杂相互作用[12]。在本研究中发现IL-6在NSCLC组织中的表达低于正常肺组织。因此,根据课题初步研究结果推测IL-6在肿瘤免疫过程中具有双向调节作用。NSCLC患者血清IL-6的低表达水平可能是促进NSCLC发生发展的重要因素之一,但其具体机制尚不清楚。
EGF是一种由53个氨基酸残基组成的低分子量肽链,是一种强促有丝分裂剂。它能促进肿瘤细胞生长,诱导肿瘤细胞侵袭,与肝癌、胃癌、乳腺癌等恶性肿瘤患者的预后密切相关[13-14]。MMP-9是降解细胞外基质的最重要的蛋白水解酶,是MMP家族中一种重要的基质金属蛋白酶。它是一种Zn2+依赖的细胞外蛋白水解酶,可降解细胞外基质并促进肿瘤细胞的侵袭和转移[15]。
综上所述,基于大数据通过生物信息学分析,获得了女性NCSLC患者的3个关键DEGs及其生物学功能。GEO和Oncomine数据库分析发现,女性NSCLC组织中IL-6的表达低于正常肺组织,而EGF和MMP-9的表达高于正常肺组织。此外,Real-time PCR证实了IL-6、EGF和MMP-9在NCSLC细胞中的表达,这进一步支持了生物信息学分析的结果。其中,IL-6和EGF与女性NSCLC的预后相关,为后续研究女性NCSLC的预后提供了一个潜在的靶点。目前,关于IL-6与NCSLC发生发展的相关性研究较少。虽然大数据可以揭示相关性,但仍需要做进一步的基础和临床研究。
-
表 1 各基因引物
Table 1. Primers for each gene
基因引物 引物序列 IL-6上游引物 GAGATACCACTCCCAACAGACC IL-6下游引物 AAGTGCATCATCGTTGTTCATACA EGF上游引物 TCTGAACCCGGACGGATTG EGF下游引物 GACATCGCTCGCGAACGTAG MMP-9上游引物 GAGATACCACTCCCAACAGACC MMP-9下游引物 CCGAGTTGGAACCACGACGC GAPDH上游引物 GGAGCGAGATCCCTCCAAAAT GAPDH下游引物 GGCTGTTGTCATACTTCTCATGG -
[1] Levy DT, Meza R, Zhang YA, et al. Gauging the effect of U.S. tobacco control policies from 1965 through 2014 using SimSmoke[J]. Am J Prev Med, 2016, 50(4): 535-542. DOI: 10.1016/j.amepre.2015.10.001. [2] Sauer AG, Siegel RL, Jemal A, et al. Updated review of prevalence of major risk factors and use of screening tests for cancer in the United States[J]. Cancer Epidemiol Biomarkers Prev, 2017, 26(8): 1192-1208. DOI: 10.1158/1055-9965.EPI-17-0219. [3] Vavalà T, Levra MG, Novello S. Lung cancer in never smokers: a different disease[J]. Curr Respir Care Rep, 2014, 3(1): 26-34. DOI: 10.1038/nrc2190. [4] Kim JH, Park K, Yim SH, et al. Genome-wide association study of lung cancer in Korean non-smoking women[J]. J Korean Med Sci, 2013, 28(6): 840-847. DOI: 10.3346/jkms.2013.28.6.840. [5] Huber RM. Is lung cancer in never-smokers a different disease?-Back to the figures[J]. J Thorac Oncol, 2007, 2(9): 787-788. DOI: 10.1097/JTO.0b013e318153f3c5. [6] Lu TP, Tsai MH, Lee JM, et al. Identification of a novel biomarker, SEMA5A, for non-small cell lung carcinoma in nonsmoking women[J]. Cancer Epidemiol Biomarkers Prev, 2010, 19(10): 2590-2597. DOI: 10.1158/1055-9965.EPI-10-0332. [7] Yamauchi M, Yamaguchi R, Nakata A, et al. Epidermal growth factor receptor tyrosine kinase defines critical prognostic genes of stage Ⅰ lung adenocarcinoma[J]. PLoS One, 2012, 7(9): e43923. DOI: 10.1371/journal.pone.0043923. [8] Stiles BM, Rahouma M, Hussein MK, et al. Never smokers with resected lung cancer: different demographics, similar survival[J]. Eur J Cardiothorac Surg, 2018, 53(4): 842-848. DOI: 10.1093/ejcts/ezx390. [9] Choi JR, Park SY, Noh OK, et al. Gene mutation discovery research of non-smoking lung cancer patients due to indoor radon exposure[J]. Ann Occup Environ Med, 2016, 28(1): 13. DOI: 10.1186/s40557-016-0095-2. [10] Zhao JG, Wang JF, Feng JF, et al. HHIP overexpression inhibits the proliferation, migration and invasion of non-small cell lung cancer[J]. PLoS One, 2019, 14(11): e0225755. DOI: 10.1371/journal.pone.0225755. [11] Tsukamoto H, Fujieda K, Senju S, et al. Immune-suppressive effects of interleukin-6 on T-cell-mediated anti-tumour immunity[J]. Cancer Sci, 2018, 109(3): 523-530. DOI: 10.1111/cas.13433. [12] Flint TR, Janowitz T, Connell CM, et al. Tumor-induced IL-6 reprograms host metabolism to suppress antitumour immunity[J]. Cell Metab, 2016, 24(5): 672-684. DOI: 10.1016/j.cmet.2016.10.010. [13] Jiang W, Tian W, Ijaz M, et al. Inhibition of EGF induced migration and invasion by sulfated polysaccharide of sepiella maindroni ink via the suppression of EGFR/Akt/p38/MAPK/MMP-2 signaling pathway in KB cells[J]. Biomed Pharmaeother, 2017(11): 95-102. DOI: 10.1016/j.biopha.2017.08.050. [14] Kim J, Kong JN, Chang H, et al. EGF induces epithelial-mesenchymal transition through phospho-Smad2/3-Snail signalling pathway in breast cancer cells[J]. Oncotarget, 2016, 7(51): 85021-85032. DOI: 10.18632/oncotarget.13116. [15] Ni Y, Ye X, Wan C, et al. Percutaneous microwave ablation(MWA)increased the serum levels of VEGF and MMP-9 in stage Ⅰ non-small-cell lung cancer (NSCLC)[J]. Int J Hyperthermia, 2017, 33(4): 435-439. DOI: 10.1080/02656736.2017.1284350. 期刊类型引用(1)
1. 蓝肖玲,方丽妮,潘雪梅. 钴胺素转运蛋白1在肺腺癌中的表达及其与患者预后的关系研究. 中国当代医药. 2023(35): 111-114 . 百度学术
其他类型引用(1)
-