各个发表的8分生信,基于铜死亡的肿瘤分型,结合WGCNA+机器学习+SCISSOR算法+单细胞+表达验证。其实一点也不难!
一、文章信息
- 发表杂志名称:npj Precision Oncology
- 中文标题:整合分析揭示铜死亡及铜稳态相关基因在非小细胞肺癌免疫治疗中的预后价值
- 英文标题:Integrative analysis reveals prognostic value of cuproptosis and copper hemostasis related genes in immunotherapy for non-small cell lung cancer
- 影响因子:8.0
- 发表日期:2025年11月20日
二、研究概述
非小细胞肺癌(NSCLC)是全球癌症死亡的主要原因,免疫治疗响应预测仍具挑战。本研究整合5个NSCLC免疫治疗队列的RNA测序数据,通过非负矩阵分解(NMF)聚类识别出三种分子亚型,其中铜依赖性增殖亚型预后较差且肿瘤微环境呈免疫抑制状态。借助101种算法模型组合的机器学习流程,构建了可将患者分为高低风险组的预后模型,低风险组免疫浸润水平更高、无进展生存期更长,且免疫相关通路激活。通过单细胞测序数据分析,鉴定出CEACAM5⁺上皮细胞为高风险亚群,与较差的生存和免疫治疗响应相关。临床样本的Western blot和免疫组化验证显示,非主要病理缓解(non-MPR)组上皮细胞中CEACAM5⁺上皮细胞相关标志物表达显著高于MPR组。研究证实铜死亡及铜稳态相关基因可作为NSCLC免疫治疗预测和预后分层的生物标志物,为精准诊疗提供参考。
三、论文详细解读
3.1 研究目标与解决的实际问题
-
核心研究目标:探索铜死亡关键基因(CKGs)及铜稳态相关基因与NSCLC预后、肿瘤免疫微环境(TIME)的关联,构建基于机器学习的预后基因特征模型,深入解析铜死亡与NSCLC的关系。
-
解决的实际问题:
-
现有NSCLC免疫治疗中,缺乏有效的生物标志物预测患者治疗响应和预后,导致部分患者无法获益。
-
铜死亡相关基因与NSCLC免疫微环境的潜在关联尚不明确,限制了其在精准治疗中的应用。
-
需明确NSCLC中与铜死亡相关的特异性细胞亚型,为靶向治疗提供新靶点。
3.2 研究方法与目的(表格形式呈现)
表1 数据获取与预处理方法
| 方法 | 具体内容 | 目的 |
|---|---|---|
| 数据收集 | 整合OAK、POPLAR、GSE126044、GSE135222及南方医院队列数据 | 获取足够样本量,确保模型稳定性和泛化性 |
| 批次效应去除 | 采用COMBAT算法整合多队列数据 | 消除不同数据集间的技术差异,保证分析准确性 |
| 数据类型转换 | 提取转录本每千碱基百万分率(TPM)数据 | 标准化基因表达量,便于后续差异分析和模型构建 |
表2 生信分析方法
| 方法 | 具体内容 | 目的 |
|---|---|---|
| 亚型识别 | NMF聚类分析(基于CKGs、铜稳态及免疫通路基因集) | 划分NSCLC分子亚型,分析各亚型特征差异 |
| 核心基因筛选 | 加权基因共表达网络分析(WGCNA)+ 单变量Cox回归 | 筛选与铜依赖性增殖亚型相关的核心枢纽基因 |
| 模型构建 | 10种算法(Lasso、Ridge等)的101种组合,十折交叉验证 | 构建高准确性的预后风险模型 |
| 免疫微环境分析 | CIBERSORT、ssGSEA、ESTIMATE算法 | 评估高低风险组免疫细胞浸润水平和微环境特征 |
| 单细胞数据分析 | SCISSOR算法映射 bulk RNA-seq 表型到 scRNA-seq 数据 | 鉴定与预后相关的特异性细胞亚型 |
| 功能富集分析 | GO、KEGG、GSEA分析 | 解析差异基因的生物学功能和富集通路 |
表3 实验验证方法
| 方法 | 具体内容 | 目的 |
|---|---|---|
| Western blot | 检测3对免疫治疗不同响应样本中8种标志物蛋白表达 | 验证CEACAM5⁺上皮细胞相关标志物的差异表达 |
| 免疫组化(IHC) | 检测CEACAM5、FAM83A等4种蛋白的组织定位和表达 | 明确标志物的空间分布及在MPR/non-MPR组的表达差异 |
3.3 实验/分析设计与结果逻辑解读
(1)研究设计总览(Figure 1)
-
设计逻辑:先通过公共队列数据筛选核心基因,再构建机器学习预后模型,最后结合单细胞测序和临床样本实验验证模型有效性及关键标志物。
-
具体流程:
-
数据输入:OAK和POPLAR队列作为训练集,GSE126044、GSE135222及南方医院队列作为外部验证集;scRNA-seq数据(GSE207422、GSE229353)用于细胞亚型分析。
-
核心基因筛选:通过NMF聚类划分亚型,WGCNA分析筛选与铜死亡相关的核心模块基因,结合单变量Cox回归获得枢纽基因。
-
模型构建与验证:基于101种算法组合构建预后模型,在训练集、内部验证集和外部验证集评估性能。
-
功能与机制探索:分析高低风险组免疫微环境和通路富集特征,通过单细胞测序鉴定关键细胞亚型。
-
实验验证:Western blot和免疫组化验证关键标志物的差异表达。

(2)NSCLC铜死亡相关亚型鉴定(Figure 2)
-
设计目的:基于铜死亡及铜稳态相关基因表达,划分NSCLC分子亚型,分析各亚型的预后和生物学特征差异。
-
分析逻辑:通过NMF聚类将OAK+POPLAR队列患者分为3个亚型,对比各亚型的免疫通路活性、铜死亡/铜稳态评分及生存结局。
-
结果:
-
亚型特征:Cluster 1(铜依赖性肿瘤增殖亚型)高表达肿瘤增殖相关基因,同时富集铜死亡和铜稳态相关基因;Cluster 2(免疫浸润亚型)免疫细胞浸润显著(T细胞、巨噬细胞、NK细胞),免疫响应通路激活;Cluster 3(基质富集免疫荒漠亚型)基质成分富集,免疫细胞浸润低,高表达基质重塑和免疫抑制相关基因。
-
预后差异:Kaplan-Meier分析显示,Cluster 1无进展生存期(PFS)最差,Cluster 2最佳(Cluster 1 vs Cluster 2,p<0.001;Cluster 3 vs Cluster 2,p=0.001)。
-
差异基因与功能:Cluster 1与其他两簇相比有2277个差异表达基因(DEGs),GO分析显示其富集皮肤发育、上皮细胞分化相关术语,KEGG分析显示免疫相关通路(细胞因子-细胞因子受体相互作用、T细胞调控)下调;GSEA证实Cluster 1富集细胞增殖和不良生存相关通路。

(3)核心基因集筛选(Figure 3)
-
设计目的:从差异基因中筛选与铜死亡及预后相关的核心基因,为后续模型构建提供靶点。
-
分析逻辑:通过WGCNA构建基因共表达网络,筛选与铜死亡特征强相关的模块,结合单变量Cox回归筛选预后相关基因,取交集获得枢纽基因。
-
结果:
-
网络构建:选择软阈值功率为6,确保网络符合无标度拓扑特征,共识别出多个基因共表达模块(不同颜色标注)。
-
模块-特征关联:蓝色模块与铜死亡相关基因呈最强正相关(cor=0.37,p=1.9e-30),提示该模块基因与铜依赖性肿瘤增殖表型密切相关。
-
枢纽基因筛选:WGCNA模块基因(896个)与单变量Cox回归筛选的预后基因(4260个)交集获得85个枢纽基因,作为潜在生物标志物或治疗靶点。

(4)机器学习预后模型构建与验证(Figure 4)
-
设计目的:基于枢纽基因构建高准确性的预后模型,实现NSCLC患者免疫治疗预后分层。
-
分析逻辑:整合多队列数据,采用10种算法的101种组合构建模型,通过C指数评估性能,筛选最优模型并验证其在不同队列和时间点的预测效果。
-
结果:
-
最优模型筛选:StepCox[both]+Lasso模型在训练集、内部验证集和外部验证集均表现最佳,平均C指数最高。
-
预后分层效果:Kaplan-Meier分析显示,模型划分的高风险组PFS显著低于低风险组(Dataset1:HR=2.23,p<0.001;Dataset2:HR=1.82,p<0.001;Dataset3:HR=2.11,p=0.007)。
-
长期预测有效性:1年、2年、3年PFS预测的AUC值分别为0.74、0.73、0.68(Dataset1),提示模型具有可靠的长期预后预测能力。
-
Meta分析验证:单变量Cox回归Meta分析显示,模型风险评分的合并HR=2.25(95%CI:1.68-2.73,p<0.001),证实模型预后价值的稳健性。

(5)基于风险评分的免疫与功能富集分析(Figure 5)
-
设计目的:解析高低风险组的免疫微环境差异和功能通路特征,阐明模型预后价值的生物学机制。
-
分析逻辑:采用多种算法评估免疫细胞浸润水平,结合GO、KEGG、GSEA分析差异富集通路,关联通路活性与患者生存。
-
结果:
-
免疫微环境差异:低风险组免疫评分和微环境评分显著更高,B细胞和CD4⁺记忆T细胞浸润更丰富,提示抗瘤免疫响应更活跃。
-
功能通路富集:低风险组富集免疫相关生物学过程(T细胞介导的细胞毒性、白细胞介导的细胞毒性正调控);KEGG通路显示抗原加工呈递通路富集;MSigDB C7数据库分析显示低风险组富集IL-6/JAK-STAT3信号、干扰素-γ响应、IL2-STAT5信号等免疫激活通路。
-
通路与生存关联:高IL-2/STAT5信号、干扰素-γ响应等通路评分的患者PFS显著更长(p<0.001),进一步证实低风险组的免疫活跃特征。

(6)单细胞RNA测序整合分析(Figure 6)
-
设计目的:将bulk RNA-seq的预后表型映射到单细胞水平,鉴定与模型风险评分、生存和治疗响应相关的特异性细胞亚型。
-
分析逻辑:整合GSE207422和GSE229353 scRNA-seq数据,采用SCISSOR算法关联bulk数据的风险评分、生存结局、治疗响应及基因突变信息与单细胞亚群。
-
结果:
-
细胞分型:鉴定出B细胞、上皮细胞、巨噬细胞、中性粒细胞、T细胞等多种细胞类型,明确各细胞类型的特异性标志物表达。
-
表型映射:SCISSOR分析显示,模型风险评分、不良生存和免疫治疗无响应与上皮细胞和中性粒细胞亚群显著相关。
-
基因突变分布:EGFR、KRAS、TP53等关键基因突变在不同细胞类型中表达水平存在差异,为后续机制研究提供方向。

(7)细胞间相互作用与关键细胞亚群鉴定(Figure 7)
-
设计目的:解析高风险细胞亚群的细胞间通讯机制,筛选调控免疫响应的关键基因和通路。
-
分析逻辑:通过CellChat分析细胞间相互作用网络,聚焦高风险亚群(上皮细胞、中性粒细胞)的富集信号通路,验证关键基因的差异表达及预后价值。
-
结果:
-
细胞通讯特征:高风险上皮细胞和中性粒细胞与巨噬细胞、T细胞等免疫细胞存在强烈的通讯交互,ADGRE、CEACAM、TWEAK信号通路为核心富集通路。
-
关键基因鉴定:CEACAM通路中的CEACAM5在non-MPR组显著高表达,且富集于上皮细胞亚群,提示其可作为免疫治疗响应预测标志物。
-
预后价值验证:CEACAM5⁺上皮细胞特征高表达的患者PFS显著更差(OAK+POPLAR队列:p=0.010;GEO+南方医院队列:p=0.044),证实其预后分层价值。

(8)CEACAM5⁺上皮标志物的实验验证(Figures 8、9)
-
设计目的:通过临床样本实验验证CEACAM5⁺上皮细胞相关标志物在免疫治疗不同响应组的差异表达,确认其临床相关性。
-
实验逻辑:收集3对MPR和non-MPR NSCLC样本,采用Western blot检测标志物蛋白表达,免疫组化明确蛋白组织定位和表达水平。
-
结果:
-
Western blot验证:AKAP12、CEACAM5、CEACAM6等8种标志物在non-MPR组蛋白表达显著高于MPR组(p<0.05或p<0.0001)。
-
免疫组化验证:CEACAM5、FAM83A、S100P、TRIM31在non-MPR组染色强度更高,其中CEACAM5和S100P存在共定位模式,进一步证实这些标志物可代表CEACAM5⁺上皮细胞,且与免疫治疗响应相关。


四、研究总结
本研究围绕铜死亡及铜稳态相关基因,通过多队列整合分析、机器学习建模、单细胞测序解析及临床样本验证,系统探索了其在NSCLC免疫治疗中的预后价值和生物学机制。研究成功鉴定出三种NSCLC分子亚型,其中铜依赖性增殖亚型预后最差;构建的StepCox[both]+Lasso预后模型可有效分层患者风险,低风险组具有更优的免疫浸润和生存结局;首次明确CEACAM5⁺上皮细胞为高风险亚群,其相关标志物在non-MPR组高表达,可作为免疫治疗响应和预后预测的潜在生物标志物。研究不仅揭示了铜死亡与NSCLC免疫微环境的密切关联,为理解NSCLC免疫治疗耐药机制提供了新视角,还为NSCLC精准免疫治疗的患者筛选和靶点开发提供了重要的临床参考。未来需通过前瞻性临床试验进一步验证模型和标志物的临床转化价值,同时深入探索CEACAM5⁺上皮细胞调控免疫微环境的具体分子机制。

共有 0 条评论