GSEA富集结果
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是通过对全基因组排序数据,评估预定义的 KEGG 通路(如 Ribosome、Spliceosome 等)是否在高或低表达基因中显著富集。
方法介绍:
首先,根据基因表达水平对基因进行排序,形成一个基因列表。
然后,根据预定义的基因集(如某个通路中的基因集合),在排序后的基因列表中寻找基因集的分布情况。
通过计算富集分数(Enrichment Score, ES)来衡量基因集在基因列表中的分布趋势。ES值反映了基因集在基因列表中的聚集程度。
最后,通过置换检验(Permutation Test)计算P值,判断基因集的富集是否具有统计学意义
输出结果:通常以富集曲线图(Enrichment Plot)的形式展示,显示基因集在基因列表中的分布情况。结果中会包含富集分数(ES)、P值、校正后的P值(如FDR)等信息。
优点:考虑了基因表达水平的变化趋势,能够更全面地反映基因集在样本中的生物学意义,适用于分析复杂的基因表达模式。
1 富集分数:富集曲线(Running Enrichment Score)
显示该通路中基因在整体排序列表中的分布情况。每个位置对应的ES值的分布曲线。
曲线向上凸起(ES > 0):表示该通路在高表达端富集(可能上调)。
曲线向下凹陷(ES < 0):表示该通路在低表达端富集(可能下调)。
2 基因排序和位置:通路基因在排名中的位置条
该通路中的基因位于排序列表中的位置,每个黑线代表该通路中的一个基因。
每一条小竖线代表该通路中的一个基因在全排序基因中的位置。
如果集中在排序靠前部分,说明通路富集在高表达基因中。
3 指标排名得分:Ranked List Metric
展示排序指标值的分布,帮助判断整体排序方向。所有基因排序后的分布情况,其中红色对应基因在处理中高表达,蓝色对应基因在处理组中低表达。
举例解读:

补充:
富集曲线怎么画出来的?
先对全基因进行排序(比如根据 log2 fold change 从高到低)。
然后,从左到右扫描整个排序列表:
如果当前位置的基因属于你定义的目标基因集合:富集得分增加(向上“走”)
如果不是:富集得分减少(向下“走”)
每一步的变化是“一个基因一跳”,所以每次变化都是一段小的、固定斜率的直线。
共有 0 条评论