【转】子刊WGCNA
Nature 子刊的 WGCNA 都是咋整的?
原创
于 2025-01-05 12:24:29 发布
·
1.9k 阅读
·
21
·
29
·
CC 4.0 BY-SA版权
文章标签:
数据分析
网络
算法
大数据
数据库
Nature Communications 又称NC,于2010年上线,是Nature 系列首个开放获取(OA)期刊。
作为一本综合领域杂志,NC 出版稿件的研究范围涉及物理、化学、生物、医学、地球科学等多个学科领域,2023 最新影响因子 16.6,中科院一区 top。
WGCNA (Weighted Gene Co-expression Network Analysis) 是一种在生物信息学领域中广泛应用的统计方法,尤其适用于基因表达数据的分析。它的核心思想是构建基因的共表达网络,并从中识别与特定生物过程或临床特征高度相关的基因模块。这些模块,由一组相互之间高度相关的基因组成,可能在生物学上有相似的功能或参与相同的生物过程。WGCNA 的方法首先从一个基因表达数据矩阵开始,然后计算所有基因对之间的表达相似性,再使用幂函数转换相似性矩阵,以此构建邻接矩阵。接下来,使用层次聚类方法将高度共表达的基因组合成模块。最后,将这些模块与外部临床特征(如疾病状态)相关联,以识别与特定生物过程或疾病相关的模块。
关于WGCNA常见图表的介绍小编这里就不作描述了,不是很了解的同学可以点击查看下面这篇推文:《通俗易懂 WGCNA》。
今天,小编主要还是带各位铁子们看看近期发表在 NC 的 WGCNA 都是咋整的。
一、人类眶额皮质阿片类药物使用障碍的神经元甲基化组和羟甲基化组分析
发表时间:2023-07-28
DOI:10.1038/s41467-023-40285-y
摘要:阿片类物质使用障碍(OUD)受基因和环境因素的影响。尽管最近的研究表明OUD存在表观遗传学异常,但这主要限于DNA甲基化(5mC)。DNA羟甲基化(5hmC)的研究相对较少。我们在男性队列中进行了OUD的多组学分析,整合了特定于神经元的5mC和5hmC以及来自人类尸体前额叶皮质的基因表达(OUD=12;非-OUD=26)。单个位点的甲基组分析和共甲基化分析显示,与5mC相比,5hmC具有更多与OUD相关的基因和基因网络;这些网络富集了GPCR、Wnt、神经发生和阿片类信号传导。5hmC标记还与基因表达模式呈更高的相关性,并富集了与精神疾病遗传关联研究(GWAS)相关的位点。药物相互作用分析揭示了与阿片类药物相关的相互作用,其中一些被用于治疗OUD。我们的多组学研究结果表明5hmC在OUD个体的前额叶皮质神经元中扮演重要角色,并揭示了在这些个体中表观遗传上出现了异常的位点。
图表 title:5mC 和 5hmC 位点的共甲基化
a 与 OUD 相关的5mC显著模块(相关性≥|0.4|,p值<0.05),还加入了其它的常见临床性状。
b 与 OUD 相关的5hmC显著模块(相关性≥|0.4|,p值<0.05)。
c 5mC显著模块的GO富集分析(前10个术语)。
d 5hmC显著模块的GO富集分析(前10个术语)。
亮点:除感兴趣的性状以外,还添加了其它的常见临床性状。此外,针对的是 5mC 和 5hmC 的共甲基化分析,而不是常规基因的共表达分析。
二、对 13,512 名个体进行的前瞻性分析中与死亡率和寿命相关的血浆代谢组图谱
发表时间:2023-09-16
DOI:10.1038/s41467-023-41515-z
摘要:实验研究报道了支持衰老过程和死亡的生化作用,但人类中与之相关的代谢变化尚不明确。在这里,我们考察了11,634名美国参与者(中位随访时间为22.6年,有4288例死亡)和1878名西班牙参与者(中位随访时间为14.5年,有525例死亡)的243种血浆代谢物与死亡和长寿(达到85岁以上)的关联。我们发现,N2,N2-二甲基鸟苷、伪尿嘧啶、N4-乙酰胞苷、4-乙酰氨基丁酸、N1-乙酰精胺和双键较少的脂质与全因死亡风险增加和长寿机会减少相关;而L-丝氨酸和双键较多的脂质与较低的死亡风险和更高的长寿机会相关。我们进一步开发了一个多代谢物配置得分,与较高的死亡风险相关。我们的研究结果表明,核苷、氨基酸和几个脂质亚类的水平差异可以预测死亡风险,其潜在机制有待确定。
图表 title:代谢物组和模块与全因死亡率和寿命的关联
a 基于先验知识的代谢物组与全因死亡之间的关联。采用代谢物集富集分析方法,基于多变量Cox模型估计结果,计算富集分数。
b 基于WGCNA衍生的模块进行全因死亡的代谢组关联分析,以及每个模块的关联分析,采用多变量Cox模型估计结果。
c 基于WGCNA衍生的模块进行寿命的代谢组关联分析,以及每个模块的关联分析,采用多变量 logistic 回归模型估计结果。注意, log(OR)为逻辑回归的 β 系数。
亮点:对于WGCNA得出的模块,分别使用多因素COX模型、逻辑回归模型计算了相应的HR或者log(OR),加强了临床意义。此外,针对的是代谢组水平的共表达网络,而非转录组水平的基因共表达网络。
三、跨组织转录组的多方面分析揭示了特应性皮炎的表型-内型关联
发表时间:2023-10-02
DOI:10.1038/s41467-023-41857-8
摘要:特应性皮炎(AD)是一种在临床表现和分子特征方面异质性的皮肤疾病。越来越多的人认识到AD是一种全身性疾病,而不是局部性疾病,应该在全身病理生理学背景下进行评估。在这里,我们通过对115名AD患者和14名配对健康对照的皮肤组织和外周血单核细胞(PBMC)样本进行综合RNA测序,结合临床数据,展示了特定临床表现与相应差异分子特征的关联。我们建立了一个基于加权基因共表达网络分析中识别的转录组模块的回归模型,以提取与AD详细临床表型相关的分子特征。AD的两种主要皮肤表现,即红斑和丘疹,通过不同的免疫学特征得以区分。我们还将回归模型应用于30名AD患者的纵向数据集,以进行个体化监测,突显了疾病轨迹的患者异质性。我们的方法为有效的临床研究提供了框架,以全面了解复杂人类疾病的病理生理学。
图表 title:皮肤/PBMC RNA-seq 数据中转录模块的识别和表征
(a) 通过WGCNA实施生成的转录本的聚类树状图。通过参考公共数据库,分析皮肤组织(b)和外周血单个核细胞(d)中的细胞类型表达模式和GO富集。在皮肤(c)和外周血单个核细胞(e)的每个转录组模块中,可视化了前30个基因的基因-基因网络。sModu代表皮肤转录组模块,pModu代表外周血单个核细胞转录组模块,vSMC代表血管平滑肌细胞,IRS/seba代表内根鞘/皮脂腺,VEC代表血管内皮细胞。
亮点:图5b和d不仅展示了每个模块的GO富集结果,还展示了通过在每个基因模块的细胞类型的基因表达数据上应用主成分分析(PCA)获得的每个细胞类型的第一主成分(PC1)值的大小(即包含m列基因和n行细胞类型的矩阵,其中m是分配给特定模块的基因数量)。不仅如此,作者们还可视化了不同样本中的基因共表达网络。
四、环境梯度揭示压力中心早于植物陆地化
发表时间:2023-08-28
DOI:10.1038/s41477-023-01491-0
摘要:植物陆地化带来了陆地植物(胚珠植物)。胚珠植物占据了陆地上大部分的生物量,并在一次独特的事件中从链藻类藻类进化而来。最近的进展揭示了陆地植物最接近的藻类亲属的首批完整基因组;其中的一个物种是Mesotaenium endlicherianum。在这里,我们利用RNA测序以及对受到连续范围的温度和光线信号刺激的Mesotaenium的光生理评估,建立了一个包含42种不同条件的实验对象,产生了128个转录组和约1.5 TBp(约99亿个reads)的数据,用于研究梯度分析的应激响应的组合效应。Mesotaenium与支持应激响应和适应性的基因网络中的主要中心枢纽与陆地植物共享。我们的数据表明,脂滴形成以及叶绿体和细胞壁来源的信号已经在超过6亿年的链藻演化中占据了分子程序的主导地位——在植物第一次迈出陆地之前。
图表 title:无监督基因表达簇恢复由环境线索分隔的遗传程序
a 包含17,095个基因的层次聚类树。在树状图下方的热图和模块颜色分配显示了四种不同条件或生理参数的基因重要性度量(从红色,正相关,到白色,无相关,到蓝色,负相关)。
b 基于特征基因的模块-特征相关性的热图(从红色,正相关,到白色,无相关,到蓝色,负相关)。
c 我们使用WGCNA软件包和Pearson方法计算了每个基因的基因重要性。根据光强度、温度和Fv/Fm参数绘制的模块平均基因重要性的箱线图(以相应的模块颜色表示)。箱线图显示了数据的四分位距(IQR),简洁地展示了连续变量的分布。每个数据点(n)代表一个基因,总基因数n与b中显示的相同。
亮点:同样是多性状的WGCNA分析,不过还可视化了WGCNA结果表格中模块每个基因的基因重要性。
————————————————
版权声明:本文为CSDN博主「生信碱移」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_49214410/article/details/144943920

共有 0 条评论