RPKM、FPKM、TPM的区别
测序read数会受到基因长度和测序深度影响,解决方案如下:
1、基因长度影响--将测序Read数除以基因长度;2、测序深度影响--将Read数除以总Read数进行标准化
简写
RPM/CPM: Reads/Counts of exon model per Million mapped reads (每百万映射读取的reads)
--本次某个基因read数/本次测序总read数(先对测序深度归一化)
RPKM: Reads Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的reads)
--(某样本特定基因read数 /某样本测序总read数)*10^3 *10^6/ 基因长度 (先对测序深度归一化得到RPM,再对基因长度归一化RPKM)
FPKM: Fragments Per Kilobase of exon model per Million mapped fragments(每千个碱基的转录每百万映射读取的fragments)
--(某样本特定基因read数 /某样本测序总read数)*10^3 10^62(双端)/ 基因长度(先对测序深度归一化得到FPM,再对基因长度归一化得到FPKM)
TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)
--(某样本特定基因read数/基因长度)*10^3 *10^6 /某样本测序总read数(先进行基因长度标准化得到RPK,后进行测序深度标准化得到TPM )
RPKM
RPKM--代表每百万reads中来自于某基因每千个碱基转录得到的reads数。是将map到基因的read数除以map到基因组上的所有read数(以million为单位)与RNA的长度(以KB为单位)之积。

total exon reads:样本中某个基因mapping到外显子上的所有的reads数
mapped reads (Millions) :样本总reads数
exon length(KB):某个基因的长度(外显子长度的总和,以KB为单位)

FPKM
FPKM与RPKM计算方法基本一致。FPKM 计算的是DNA片段(fragments),也就是一对reads。与RPKM 的差别主要体现在,FPKM在一对reads map上的情况下只计数1,而RPKM 会计为2。适用于双端测序。

在单端测序中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;
在双端测序中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。
总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间??
FPKM(RPKM)适用于:同一个样本中基因A和基因B的相对表达量
TPM
TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)

Ni:比对到第i个exon的reads数
Li:第i个exon的长度
sum(N1/L1+N2/L2 + ... + Nn/Ln):所有 (n个)exon按长度进行标准化之后数值的和
TPM其实跟RPKM,FPKM也很相似。TPM唯一不同的地方就是计算次序不一样。所以,当计算TPM的时候,先对基因长度进行归一化,其次是测序深度的归一化。然而,归一化次序不一样,对结果影响差别就很大。当使用TPM时候,每个样本的TPM总和是一样的(=10^6)。这使得比较同一个基因的reads数在不同样本间的比例变得容易。FPKM和RPKM与此相反,每个样本的FPKM或RPKM的累加和可以不一样,造成样本间不能直接比较FPKM或RPKM值。
共有 0 条评论