小鼠视网膜转录组异构体全解析:单细胞三代全长测序技术放异彩
研究背景
视网膜作为视觉信息处理的关键部位,其复杂性远超我们的想象。小鼠视网膜是一个高度复杂的神经组织,包含超过130种独特的神经细胞类型,这些细胞被分为7个主要类别,而每个主要类别又可进一步细分为多个亚类和细胞类型。它们在形态、功能、位置和转录组特征上存在显著差异,共同构成了视网膜的复杂结构和功能基础。
在视网膜的复杂性背后,选择性剪接这一机制起着至关重要的作用。选择性剪接是生物体内一种重要的基因调控方式,通过不同的剪接方式,一个基因可以产生多种不同的mRNA异构体,从而显著增加转录组和蛋白质组的多样性。这种机制在细胞分化、组织发育以及生物体的适应性等方面发挥着关键作用。在视网膜中,选择性剪接不仅参与了神经细胞的发育和功能调控,还与多种视网膜疾病的发生发展密切相关。例如,在视网膜退行性疾病中,选择性剪接的异常可能导致特定细胞类型的损伤或功能障碍,进而影响视觉功能。
然而,尽管选择性剪接在视网膜生物学中具有重要意义,但目前对于视网膜细胞类型特异性的剪接事件以及单细胞水平上转录异构体的表达模式的理解仍然十分有限。以往的研究主要依赖于短读测序技术,虽然能够提供一定的转录组信息,但在鉴定转录异构体方面存在局限性,尤其是对于长转录本的完整结构和复杂剪接事件的解析能力不足。这使得我们对视网膜转录组的复杂性和细胞类型特异性剪接事件的认识还不够全面。
随着单细胞RNA测序技术的不断发展,长读测序技术逐渐崭露头角,为解决这一问题带来了新的希望。长读测序技术能够提供更长的读长,从而更准确地解析转录本的完整结构和复杂的剪接事件,有助于我们全面了解视网膜细胞类型特异性的转录组特征和剪接调控机制。因此,本研究利用单细胞三代全长转录组测序技术,对小鼠视网膜的转录组进行了全面分析,旨在揭示视网膜细胞类型特异性的剪接事件和转录异构体的表达模式,为深入理解视网膜的基因调控机制和相关疾病的发生发展提供新的视角和理论依据。
研究结果
1. 单细胞短读与长读测序技术的综合应用
在本研究中,科研团队采用了单细胞短读和长读测序技术相结合的方法,对小鼠视网膜的转录组进行了全面分析。这种技术整合不仅充分发挥了两种测序技术的优势,还为深入解析视网膜细胞类型特异性的转录组特征提供了强大的支持。
实验设计与样本处理
研究团队从四只小鼠视网膜中分离出细胞,包括两个野生型视网膜的生物学重复样本,以及两个富集了无长突细胞(AC)和双极细胞(BC)的样本。这种设计确保了对稀有细胞类型的全面覆盖,从而能够更准确地反映视网膜的细胞异质性。通过10x Genomics Chromium平台,团队利用短读测序技术生成了15.4亿条Illumina短读序列,同时利用Oxford Nanopore平台生成了14亿条长读序列。长读测序的中位读长约为1000个碱基对,平均质量得分约为12.5,对应约5.6%的错误率(见图1A)。
短读测序结果
短读测序数据经过Cell Ranger处理后,团队对29,191个通过质量过滤的细胞进行了聚类和注释,形成了六个主要的细胞群体,包括杆状细胞(rod cells)、双极细胞、无长突细胞、锥状细胞(cone cells)、Müller胶质细胞(MG)和视网膜神经节细胞(RGC)。野生型视网膜的两个生物学重复样本显示出相似的细胞类型比例,其中杆状细胞最为丰富。而富集了AC和BC的样本中,相应细胞类别的比例显著增加(见图1B和1C)。
长读测序结果
长读数据经过质量过滤后,基于短读测序识别的细胞条码(cell barcodes)进行解复用(demultiplexing),共得到约5.18亿条长读。使用长读数据进行细胞聚类和注释后,六个主要细胞类别被成功识别,且细胞比例与短读方法相似。在细胞类别注释方面,短读和长读数据之间的一致性非常高,超过98.0%的细胞类别分配结果一致,双极细胞(BCs)的一致性甚至达到99.8%(见图1D)。
技术比较与优势
尽管短读测序在基因表达和细胞类型注释方面表现出色,但长读测序在精确鉴定转录异构体方面表现更优。长读测序能够跨越整个转录本进行测序,从而更有效地识别选择性剪接事件和转录本的异质性。例如,长读测序不仅能够识别已知的转录异构体,还能发现大量新的异构体,这些异构体在短读测序中可能因读长限制而被遗漏。
基因表达相关性
研究团队还比较了两种测序技术在所有细胞类别中的基因表达相关性,发现两者之间存在强正相关(Pearson's r值为0.87,p值<2.2e-16)。这一结果表明,在相似深度的测序下,短读和长读数据集在细胞识别、聚类和注释方面具有可比的灵敏度和高一致性(见图1E)。
A

B

C

D

E

图1
2. 小鼠视网膜中的异构体目录及不同细胞类别的独特剪接特征
在小鼠视网膜的转录组研究中,科研团队通过单细胞长读测序技术,成功构建了一个全面的转录异构体(isoform)库,并揭示了不同细胞类别之间独特的剪接特征。这一成果不仅显著扩展了已知的转录异构体库,还为理解视网膜细胞类型特异性的基因调控机制提供了新的视角。
异构体鉴定与分类
研究团队利用长读测序技术,共鉴定出44,325个转录异构体,其中86.2%属于蛋白编码基因。通过对这些异构体进行分类,发现60%与已知异构体匹配,而40%是新发现的异构体。具体分类如下:
• Full Splice Match (FSM):19,821个异构体与参考转录本在所有剪接位点上完全匹配。
• Incomplete Splice Match (ISM):7,517个异构体部分匹配参考转录本的连续剪接位点。
• Novel in Catalog (NIC):15,894个异构体包含已知剪接位点的新组合。
• Novel not in Catalog (NNC):38个异构体包含新的供体和受体位点。
• Fusion:1,055个异构体是由两个或多个基因的片段连接而成的融合转录本(见图2A)。
这些新发现的异构体通常表达水平较低,这可能是它们之前未被发现的原因之一(见图2B)。
细胞类别特异性的异构体
研究发现,不同细胞类别中异构体的数量和类型存在显著差异。例如,杆状细胞(rod cells)中发现了超过13,000个新异构体,双极细胞(BC)和无长突细胞(AC)中也发现了大量新异构体。尽管不同细胞类别中异构体的总数存在差异,但已知异构体的比例在所有细胞类别中大致相同,约为65%(见图2C)。此外,约16.7%的异构体仅在一个细胞类别中表达,显示出明显的细胞类型特异性(见图2D)。
剪接特征的比较
研究团队进一步比较了已知和新异构体的剪接特征。结果显示,已知和新异构体在外显子数量和开放阅读框(ORF)长度的分布上表现出相似的模式,但在基因内的使用水平上存在显著差异。大多数已知异构体占总基因表达的90%以上,而新异构体的表达水平较低(见图2E)。此外,细胞类别特异性的异构体也表现出类似的表达模式(见图2F)。
A

B

C

D

E

F

图2
3. 不同细胞类别/亚类/类型中的异构体使用差异
在小鼠视网膜的转录组研究中,科研团队进一步深入探讨了基因在不同细胞类别、亚类中的异构体使用模式。他们发现,尽管许多基因在多种细胞类型中都有表达,但这些基因的异构体使用模式在不同细胞类型之间存在显著差异。这一发现揭示了视网膜细胞类型特异性的转录组复杂性,为理解基因调控机制提供了新的视角。
异构体使用模式的多样性
研究团队分析了小鼠视网膜中基因的异构体使用模式,发现大多数基因在不同细胞类别中表达多种异构体,但这些异构体的使用比例在不同细胞类别之间存在显著差异。例如,Pcbp4基因在所有细胞类别中都有表达,但其异构体的使用比例在不同细胞类别之间存在显著差异。具体来说,一个在无长突细胞(ACs)中高表达的异构体在杆状细胞(rods)中表达水平较低(p-value = 1.06E-88),而另一个在杆状细胞中高表达的异构体在双极细胞(BCs)中表达水平较低(p-value = 3.86E-98)(见图3A和3B)。
细胞亚类和类型中的异构体使用差异
研究团队还进一步分析了无长突细胞和双极细胞的亚类之间的异构体使用模式。例如,Snap25基因的一个异构体主要在GABA能和甘氨酸能亚类中表达,而另一个异构体在非GABA能非甘氨酸能(nGnG)无长突细胞中占总表达的50%以上(见图3C)。此外,他们还分析了每个双极细胞类型的异构体使用模式,并发现某些异构体主要在特定的双极细胞类型中表达(见图3D和3E)。
疾病相关基因的异构体分析
研究团队特别关注了与视网膜疾病相关的基因,例如Impdh1基因。他们发现Impdh1的多个新异构体,包括一个包含17bp外显子的异构体,该外显子在参考序列(RefSeq)中未被报道。这个外显子的包含导致了阅读框移位和ORF延长(37个氨基酸),并引入了一个替代的终止密码子。这个异构体在双极细胞、锥状细胞、Müller胶质细胞和杆状细胞中显著表达(见图3F)。此外,这个17bp外显子在人类中高度保守,并且在研究团队的视网膜色素变性患者队列中,发现了一些位于该外显子上下游10个碱基内的单核苷酸变异,这些变异在一般人群中并未被发现(根据gnomAD数据库)。这表明这些变异可能与人类疾病相关,值得进一步研究。
A

B

C

D

E

F

图3
4. 小鼠视网膜中的基因融合转录本
在小鼠视网膜的转录组研究中,科研团队发现了大量基因融合转录本(gene fusion transcripts),这一发现为理解视网膜的转录组复杂性提供了新的视角。这些融合转录本不仅揭示了视网膜细胞类型特异性的转录组特征,还可能与视网膜的生物学功能和疾病机制相关。
基因融合转录本的鉴定
研究团队在小鼠视网膜中鉴定出1,055个潜在的基因融合转录本。这些融合事件不太可能是实验操作中的假象,因为它们得到了至少5个独特分子标识符(UMIs)的支持,表明这些融合事件是独立发生的。
融合转录本的特征
• 融合基因的数量:大多数融合转录本是由两个基因融合而成,但也观察到了由三个基因融合的事件(见图4A)。
• 基因间的距离:融合基因之间的距离有近有远。有些融合发生在相邻基因之间,而有些则跳过了中间的基因,与更远的基因发生融合。相邻融合的转录本通常包含更多的外显子(p-value = 1.8E-07),并且它们的表达水平也存在差异(p-value = 0.0073)(见图4B)。
• 融合转录本的表达比例:研究团队比较了融合转录本的丰度与融合基因中所有异构体的总表达量。融合转录本的使用比例与融合基因的总表达量之间的比例分布较广,表明融合转录本在总基因表达中所占的比例存在很大差异(见图4C)。
功能富集分析
通过基因本体(Gene Ontology, GO)功能富集分析,研究团队发现参与融合的基因主要与免疫相关功能有关,例如T细胞受体结合(GO:0042608)。这表明这些融合转录本可能在免疫反应中具有适应性功能(见图4D)。此外,某些基因能够与多个其他基因发生融合,形成不同的融合转录本(见图4E)。
细胞类别特异性的融合转录本
研究团队还分析了不同细胞类别之间融合转录本的重叠情况,发现某些融合转录本是特定细胞类别独有的。例如,杆状细胞中有164个独特的融合转录本,无长突细胞中有107个,双极细胞中有27个(见图4F)。这一发现表明,基因融合事件可能在特定细胞类型中具有独特的生物学意义。
A

B

C

D

E

F

图4
5. 下采样分析与测序饱和度评估
为了全面评估单细胞三代全长转录组测序技术在小鼠视网膜研究中的应用效果,科研团队进一步进行了下采样分析和测序饱和度评估。这一分析旨在确定当前的测序深度是否足以全面揭示视网膜细胞类型特异性的转录组特征,以及是否还有未被发现的转录异构体。
下采样分析
科研团队通过随机抽取不同比例(1%、10%、50%)的长读测序数据,重新运行分析流程,以评估测序深度对异构体检测的影响。结果显示,随着测序深度的增加,检测到的异构体数量也显著增加。例如,从10%的数据增加到50%时,完全剪接匹配(FSM)异构体的数量增加了41.3%,而从50%的数据增加到完整数据时,仅增加了10.2%。这表明FSM异构体的检测已接近饱和,适度的测序深度即可检测到大多数已知异构体(见图5A)。
然而,对于新型异构体(如NIC和NNC),其检测数量随着测序深度的增加而持续上升。从10%的数据增加到50%时,NIC异构体的数量增加了111.3%,从50%增加到完整数据时,又增加了26.4%。这表明新型异构体的检测尚未达到饱和,低表达水平的异构体可能需要更高的测序深度才能被全面检测到(见图5A)。
测序饱和度评估
为了进一步评估测序饱和度,科研团队分析了不同比例数据中检测到的异构体的重叠情况。结果显示,不同比例数据中检测到的异构体存在一定的重叠,但也有一些异构体仅在某些比例的数据中被检测到。例如,1%、10%、50%和完整数据集中检测到的异构体之间存在交集,但也有一些低丰度的异构体可能因随机性而在低比例数据中被检测到,而在高比例数据中因过滤条件(如2%的使用阈值)而被排除(见图5B和5C)。
此外,科研团队还分析了每个主要细胞类别中异构体的检测情况。结果显示,从10%的数据增加到50%时,各个细胞类别中检测到的异构体数量增加了30%到60%,而从50%增加到完整数据时,又增加了11%到18%。这表明细胞类别特异性的异构体检测也尚未达到饱和,需要更高的测序深度来全面揭示这些异构体(见图5D)。
A

B

C

D

图5
结语
该研究通过单细胞短读与长读测序技术的结合,对小鼠视网膜的转录组进行了全面而深入的分析,揭示了视网膜细胞类型特异性的转录组特征和剪接调控机制。研究不仅显著扩展了已知的转录异构体库,还发现了大量新的基因融合转录本,为理解视网膜的生物学功能和疾病机制提供了新的视角。
通过对不同细胞类别、亚类和类型中的异构体使用模式的分析,研究揭示了视网膜细胞类型特异性的剪接特征,强调了在研究基因功能时考虑细胞类型特异性的必要性。此外,下采样分析和测序饱和度评估表明,尽管当前的测序深度已经能够检测到大多数已知的异构体,但对于新型异构体和细胞类别特异性的异构体,仍需要更高的测序深度来全面揭示其多样性。
研究成功展示了单细胞三代全长转录组测序技术在解析复杂组织转录组中的强大潜力。这一技术不仅能够提供更全面的转录组信息,还能揭示传统短读测序技术所无法发现的复杂剪接事件。随着测序技术的不断发展和成本的降低,单细胞三代全长转录组测序有望在更多领域得到广泛应用,为生命科学研究和疾病诊断治疗提供更有力的支持。
参考文献
Wang M, Li Y, Wang J, Oh SH, Cao Y, Chen R. Integrating short-read and long-read single-cell RNA sequencing for comprehensive transcriptome profiling in mouse retina. Genome Res. 2025 Apr 14;35(4):740-754. doi: 10.1101/gr.279167.124.
共有 0 条评论