- 首頁 > 全長轉(zhuǎn)錄組
全長轉(zhuǎn)錄組
產(chǎn)品介紹
全長轉(zhuǎn)錄組產(chǎn)品,通過長讀長測序,無需打斷和拼接,直接獲取包含 5’UTR,3’UTR 及PolyA 尾的完整轉(zhuǎn)錄本,能夠全面快速地獲得某一物種特定組織或器官在某一狀態(tài)下的轉(zhuǎn)錄本序列及結(jié)構(gòu)信息。可用于補充已注釋基因組的基因注釋結(jié)果、發(fā)現(xiàn)新的基因和轉(zhuǎn)錄本、鑒定可變剪接、基因融合現(xiàn)象、選擇性多聚腺苷化位點等,同時改善基因/轉(zhuǎn)錄本表達定量結(jié)果,全面解析轉(zhuǎn)錄本的復雜性和多樣性。
華大科技開發(fā)了獨特的多倍通量全長轉(zhuǎn)錄組產(chǎn)品以及Poly(A)全長轉(zhuǎn)錄組產(chǎn)品,提供基因轉(zhuǎn)錄本結(jié)構(gòu)、定量,從結(jié)果到調(diào)控機制的全方位轉(zhuǎn)錄調(diào)控研究方案。
產(chǎn)品應用
全長轉(zhuǎn)錄組基于 PacBio 單分子實時測序技術(shù),可以直接得到全長轉(zhuǎn)錄本信息,無需組裝,更大限度保證轉(zhuǎn)錄組測序結(jié)果的準確性。
對于無參考序列的物種,全長轉(zhuǎn)錄組測序可以構(gòu)建高質(zhì)量的基因集,輔助基因注釋,為后續(xù)物種的功能研究奠定基礎。
對于有參考序列的物種,可發(fā)現(xiàn)新的轉(zhuǎn)錄本,完善參考基因集;并鑒定可變剪接、基因融合等結(jié)構(gòu)變異。

產(chǎn)品優(yōu)勢
- 多倍通量專利技術(shù)
利用華大多倍通量全長轉(zhuǎn)錄組專利優(yōu)勢技術(shù),將多條序列隨機首尾相連,充分利用長讀長測序平臺優(yōu)勢。
- 充分利用讀長,超高性價比
相同數(shù)據(jù)量可以獲得 3-6 倍的有效 reads,檢測轉(zhuǎn)錄本數(shù)量翻倍。
- Poly(A)+全長轉(zhuǎn)錄組,測一得二
同時得到全長 mRNA 序列以及全長 Poly(A) 序列,一舉兩得。
- Poly(A)長度和堿基檢測結(jié)果準確度高
基于 PacBio 平臺 CCS 測序,可直接測序得到全長的 Poly(A) 長度和堿基信息,準確度高。
- 技術(shù)穩(wěn)定,項目經(jīng)驗豐富
累計執(zhí)行 1500+ 例樣本,涵蓋了包括植物、昆蟲、哺乳動物、禽類、軟體動物和水產(chǎn)生物在內(nèi)的 240+ 個物種。
- 直接獲取全長轉(zhuǎn)錄本
直接獲得 5’-3’ 的全長 lsoform,無需拼接,所測即所得,Q32-Q36,準確性高。
- UMI 技術(shù)實現(xiàn)精準定量
利用 UMI 技術(shù)和多倍通量完美結(jié)合,基因定量結(jié)果更準確。
- 高準確結(jié)構(gòu)分析
提供高精度的 ORF 預測,可變剪接、融合基因分析。
案例一:HIT-ISOseq揭示生菜組織特異性轉(zhuǎn)錄組圖譜[1]
發(fā)表雜志:Communications Biology(IF=5.2)
發(fā)表時間: 2024-7-31
方案設計:
- 研究背景:生菜是全球種植和消費最廣泛的雙子葉蔬菜之一。盡管已有生菜的參考基因組序列,但其基因注釋仍不完整,阻礙了基因組資源的全面研究和廣泛應用。
- 研究材料及方法:研究隨機選取 6 株成熟生菜植株,分為 2 個生物學重復組,每組 3 株。用超純水清洗 3 次后,分別切成根、莖、葉 3 部分,進行 DNBSEQ 轉(zhuǎn)錄組測序以及多倍通量全長轉(zhuǎn)錄組測序(HIT-ISOseq)。
主要發(fā)現(xiàn):
1) HIT-ISOseq 改進生菜的參考轉(zhuǎn)錄本注釋和功能注釋
利用 PacBio Sequel II SMRT Cell 8 M 測序芯片共獲得 15.79 M reads,平均每個 CCS reads 有 3.46 個全長非嵌合序列(FLNC)。每個樣本平均獲得 2.55 M 到 2.74 M FLNC reads,平均讀長范圍從 736.31 bp到 779.97 bp。HIT-ISOseq 測序結(jié)果共鑒定出 31,297 個基因和 69,973 個轉(zhuǎn)錄本,每個樣本的基因數(shù)量為 23,550 至 27,629 個,轉(zhuǎn)錄本數(shù)量為 54,711 至 58,998 個。
2) 定量一致性結(jié)果
從 HIT-ISOseq 測序數(shù)據(jù)得出的基因和轉(zhuǎn)錄本表達與 DNBSEQ (PE150) 測序獲得的結(jié)果具有高度相關性,從而驗證了基因表達定量的一致性。

圖1 HIT-ISOseq 更新生菜參考注釋
3) HIT-ISOseq 揭示生菜中組織特異性表達基因及轉(zhuǎn)錄本
通過 HIT-ISOseq 測序數(shù)據(jù)鑒定到生菜中組織特異性表達的 2,611 個基因以及 4,842 個轉(zhuǎn)錄本。此外,研究者鑒定到 18 種表現(xiàn)出與相應基因表達模式不同的轉(zhuǎn)錄本,并對這些轉(zhuǎn)錄本進行了 qPCR 驗證。

圖2 HIT-ISOseq 揭示生菜中組織特異性表達基因
案例二:Poly(A)長度控制對精子發(fā)生過程中轉(zhuǎn)錄與翻譯的調(diào)控作用[2]
發(fā)表雜志:Development(IF=6.862)
發(fā)表時間: 2022-6-15
研究方法:poly(A) 全長轉(zhuǎn)錄組測序、Ribo-seq
主要結(jié)論:
為探究精子細胞分化過程中 Poly(A) 長度動態(tài)變化與 mRNA 穩(wěn)定性和翻譯延遲的關系,作者通過構(gòu)建 PAPA-seq 文庫,使用 Poly(U) 聚合酶將 G、I 核苷酸加入到 mRNA 的 3′ 端,并進行反轉(zhuǎn)錄生成含有全長 Poly(A) 尾的 cDNA,使用 PacBio 平臺測序檢測精子發(fā)生過程中粗線期精母細胞(pachytene spermatocytes)、圓形(round)和長形精子細胞(elongating spermatids)以及精子的 Poly(A) 長度及 3’ UTR 長度變化(如圖3);
PAPA-seq 結(jié)果顯示,當粗線期精母細胞發(fā)育成圓形和長形精子細胞時,轉(zhuǎn)錄本全長呈縮短趨勢,且 mRNAs 的 3’ UTRs 及 5’ UTRs 逐漸縮短。但 Poly(A) 長度則呈雙相方式動態(tài)變化,從粗線期精母細胞到圓形精子細胞,Poly(A) 尾長度逐漸增加,這可能有助于延長 mRNA 半衰期,并在精子發(fā)生后期保護 mRNAs 以延遲翻譯。相反,從圓形精子到長形精子過程中,Poly(A) 的長度逐漸變短,表明轉(zhuǎn)錄本 Poly(A) 長度變化與精子發(fā)生過程中的翻譯延遲同步。

圖3 Poly(A) 全長轉(zhuǎn)錄組深度測序顯示精子發(fā)生過程中的 Poly(A) 長度動態(tài)變化
為了進一步探討 Poly(A) 長度對 mRNA 翻譯抑制和激活的影響,研究團隊通過 PAPA-seq,發(fā)現(xiàn)定位在 RNP 的 mRNAs 的平均 Poly(A) 長度僅為定位在含多核糖體中(polysome)mRNA 的 1/40,這表明 mRNA 的去腺苷酸化與其在 RNPs 的定位之間存在強烈的關聯(lián)。通過分析 RNP和 polysome 中的 miRNA-mRNA 靶向關系發(fā)現(xiàn),在粗線期精母細胞中,與 polysome 轉(zhuǎn)錄本相比,RNP 富集型轉(zhuǎn)錄本中的 miRNA 靶點更集中在 3'端,精子發(fā)生進展到圓形和長形精子細胞階段時,目標轉(zhuǎn)錄本 3' UTRs 上的 miRNA 靶點逐漸減少并最終消失,這與長形精子細胞中 RNP 的 mRNAs 釋放相一致,表明 miRNAs 驅(qū)動 mRNAs 進入 RNPs 進行去腺苷酸化。具有較長的 Poly(A) 尾(>50 nt)的轉(zhuǎn)錄本從 RNP 組分轉(zhuǎn)移到 polysome 組分,而具有較短的 Poly(A) 尾(<5 nt)的轉(zhuǎn)錄本往往被隔離在核糖核蛋白(RNP)顆粒中,以進行翻譯抑制并保持穩(wěn)定。
并且,通過 Drosha 條件敲除(cKO)小鼠模型及 miR-506 基因敲除(KO)小鼠系實驗以消除 miRNA 的產(chǎn)生,驗證 miRNA 通過去腺苷酸化縮短其靶 mRNA 的 Poly(A)長度,從而將它們隔離在 RNP 顆粒中以延遲翻譯。

圖4 miRNA 缺失對 RNP 顆粒和多核糖體組分中 Poly(A) 長度分布的影響
參考文獻:
[1] Shi, ZX., Xiang, L., Zhao, HM. et al. High-throughput single-molecule long-read RNA sequencing analysis of tissue-specific genes and isoforms in lettuce (Lactuca sativa L.). Commun Biol 7, 920 (2024). https://doi.org/10.1038/s42003-024-06598-4.
[2] Guo, Mei et al. “Uncoupling transcription and translation through miRNA-dependent poly(A) length control in haploid male germ cells.” Development (Cambridge, England) vol. 149,12 (2022): dev199573. doi:10.1242/dev.199573.
多倍通量全長轉(zhuǎn)錄組
為了充分利用 PacBio 測序長讀長優(yōu)勢,華大科技研發(fā)了多倍通量全長轉(zhuǎn)錄組專利技術(shù),在建庫過程中將多個轉(zhuǎn)錄本首尾相連構(gòu)建多倍通量文庫;通過 CCS 測序,一條 CCS read 可拆分得到多條轉(zhuǎn)錄本,大幅提升 RacBio 測序全長 reads 的獲得率。

圖1 多倍通量全長轉(zhuǎn)錄組建庫示意圖
技術(shù)優(yōu)勢
多倍通量全長轉(zhuǎn)錄組將單個 cell 的有效 reads 數(shù)提升至 3-6 倍以上;在成本不變的情況下,可得到更多的轉(zhuǎn)錄本檢測數(shù)目;并結(jié)合 UMI 實現(xiàn)準確的基因/轉(zhuǎn)錄本定量。
1) 有效 reads 數(shù)提升 3-6 倍
同樣的測序數(shù)據(jù)量,多倍通量全長轉(zhuǎn)錄組檢測到的 reads 數(shù)是常規(guī)全長轉(zhuǎn)錄組的 3-6 倍。
2) 測序準確度高——基因結(jié)構(gòu)分析
多倍通量全長轉(zhuǎn)錄組測序,使用 PacBio 測序平臺 CCS 測序模式,測序準確性較高。同一序列 CCS 測序得到的 full-pass 數(shù)會減少,但 Isoform 校正過程中可用的 reads 數(shù)會增加,最終得到的序列準確度并不會降低,適用于轉(zhuǎn)錄本結(jié)構(gòu)分析。
各物種的轉(zhuǎn)錄本多樣且復雜,絕大多數(shù)真核生物基因都存在多種剪切形式,全長轉(zhuǎn)錄組無需打斷直接讀取從 5' 端到 3' 端的序列,可有效識別可變剪接(AS)、可選擇性多聚腺苷酸化(APA)、基因家族、融合基因等,是基因結(jié)構(gòu)分析的有效方式。
3) UMI 和多倍通量完美結(jié)合,基因定量結(jié)果更準確
UMI(Unique molecular identifier,特異性分子標識符)和多倍通量完美結(jié)合,基因定量結(jié)果和短讀長平臺一致性好,測序結(jié)果也可以做基因定量。

圖2 基因定量一致性(spearman)
產(chǎn)品策略
建庫:構(gòu)建多倍通量全長轉(zhuǎn)錄組文庫;
測序:利用 Revio 平臺進行 CCS 測序,推薦測序 5M s-reads 數(shù)據(jù)量以上;
分析:根據(jù)有無參考基因組分為 Ref(有參)和 de novo(無參)分析。
表1. 測序數(shù)據(jù)量推薦
|
研究目標 |
稀有轉(zhuǎn)錄本異構(gòu)體 發(fā)現(xiàn)、定量 |
中、高表達轉(zhuǎn)錄本異構(gòu)體 發(fā)現(xiàn)、定量 |
鑒定高表達基因、 完善轉(zhuǎn)錄本注釋 |
|
飽和度曲線數(shù)據(jù)表現(xiàn) |
飽和度曲線整體趨于平臺期 |
發(fā)現(xiàn)更多低/中/高表達基因和復雜轉(zhuǎn)錄本 |
基因及轉(zhuǎn)錄本檢出率約80% |
|
推薦測序數(shù)據(jù)量 |
10M -20M |
5M |
~5M |
|
推薦樣本類型 |
復雜轉(zhuǎn)錄本結(jié)構(gòu)樣本 |
腫瘤、疾病樣本 |
動植物樣本 |
Poly(A) 全長轉(zhuǎn)錄組
華大科技 poly(A)+ 全長轉(zhuǎn)錄組測序,基于 PacBio 長讀長測序平臺,可同時得到高準確度的全長轉(zhuǎn)錄本序列和 poly(A) 長度及堿基情況。測序數(shù)據(jù)除可用于分析可變剪接、融合基因、鑒定新異構(gòu)體,精確定量轉(zhuǎn)錄本表達水平之外,更能全面檢測 Poly(A) 長度和堿基類型。
助您深入研究 Poly(A) 在轉(zhuǎn)錄本表達中的調(diào)控作用,從 RNA 整體水平上研究 poly(A) 長度與轉(zhuǎn)錄本及非編碼區(qū)的關系,實現(xiàn)從結(jié)果(基因表達量,結(jié)構(gòu)變異)到原因(poly(A)調(diào)控機制)的全方位研究!

圖3 poly(A) 全長轉(zhuǎn)錄組建庫方法示意圖
Poly(A)+ 全長轉(zhuǎn)錄組特色分析

圖4 所有樣品的 poly(A) 長度分布圖

圖5 各樣本 poly(A) 長度分布圖

圖6 poly(A) 非 A 堿基含量圖

圖7 poly(A) 長度與轉(zhuǎn)錄本表達量的關系圖
RNA樣本送樣建議
PacBio全長轉(zhuǎn)錄組
|
樣本類型 |
總量 |
濃度 |
RIN |
28S/18S |
基線和5S |
OD |
|
Total RNA |
1.5 μg |
285 ng/μL |
RIN≥7.5 |
28S/18S≥1.2 |
基線平整, 5S峰正常 |
OD260/280≥1.8 OD260/230≥1.6 |
組織樣本送樣建議
|
組織類型 |
送樣量(提取RNA) |
注意事項 |
|
新鮮動物組織干重 |
≥100 mg |
|
|
新鮮植物組織干重 |
≥200 mg |
|
|
新鮮培養(yǎng)細胞 |
≥1×106 個 |
|
|
全血(哺乳動物) |
≥2.5 mL 淋巴細胞 ≥2.5 mL Paxgene Blood RNA
tube收集的全血 |
禁止使用肝素抗凝管采血 |
|
全血(非哺乳動物) |
≥0.2 mL RNAprotect? Animal
Blood Tubes收集的全血 |
禁止使用肝素抗凝管采血 |
|
菌體 |
≥2×107--2×108
個 |
若具有傳染性需進行滅活處理 |
Q1:多倍通量全長轉(zhuǎn)錄組測序會不會影響轉(zhuǎn)錄本長度分布?
A1:不會。
多倍通量全長轉(zhuǎn)錄組技術(shù)將不同長度的轉(zhuǎn)錄本隨機連接,無長度偏向性,可無差異檢測到各個長度范圍的轉(zhuǎn)錄本。如下圖所示,和常規(guī)文庫相比,多倍通量全長轉(zhuǎn)錄組文庫的檢測結(jié)果并無明顯偏向性。

圖1 全長轉(zhuǎn)錄本長度分布圖
Q2:多倍通量全長轉(zhuǎn)錄組技術(shù)得到的reads準確度是否會降低?
A2: 不會。
測序長度越長,CCS 后單條序列準確度越高。PacBio 測序中構(gòu)建啞鈴型文庫,在插入片段比酶讀長短的情況下,通過環(huán)形比對測序(Circular Consensus Sequencing, CCS),同一個片段可以被循環(huán)測到很多次,這在很大程度增加最終得到的序列準確性。

圖2 CCS 測序示意圖。
分析過程中,通過 reads 聚類和 Isoform 校正進一步提升 Isoform 準確度。在 PacBio 數(shù)據(jù)分析中,為了提高最終得到的轉(zhuǎn)錄本序列的準確度,得到 CCS 序列之后會進行 reads 聚類和 Isoform 校正,進一步提高 Isoform 準確度,同一 Isoform 測到的條數(shù)越多,校正后的準確度越高。這一步可以通過閾值設定,篩選準確度達到要求的用于后續(xù)分析,目前一般將 Isoform 校正后準確度在 0.99 以上判定為高質(zhì)量 Isoform。

圖3 Isoform校正過程示意圖。
多倍通量全長轉(zhuǎn)錄組產(chǎn)品,同一序列 CCS 測序得到的 full-pass 數(shù)會減少,但 Isoform 校正過程中可用的 reads 數(shù)會相應增加,最終得到的序列準確度并不會降低。
Q3:多倍通量全長轉(zhuǎn)錄組產(chǎn)品能不能用來做基因/轉(zhuǎn)錄本定量?
A3:可以
多倍通量全長轉(zhuǎn)錄組產(chǎn)品結(jié)合了多倍通量和另外一項華大特有技術(shù)(UMI),在提高有效數(shù)據(jù)量的同時通過 UMI 對每一條轉(zhuǎn)錄本分子進行標記,可以排除建庫過程的 PCR 偏向性,定量結(jié)果可達到和短讀長平臺基因定量相當?shù)乃健?/font>
Q4:多倍通量全長轉(zhuǎn)錄組產(chǎn)品需要構(gòu)建多個文庫嗎?
A4:不需要。
多倍通量全長轉(zhuǎn)錄組技術(shù)在構(gòu)建啞鈴型文庫之前,將不同長度的轉(zhuǎn)錄本進行隨機連接,并通過篩選得到有效連接產(chǎn)物,測序 loading 偏差小。
Q5:全長轉(zhuǎn)錄組目前能接原核轉(zhuǎn)錄組嗎?
A5: 不能。目前全長轉(zhuǎn)錄組主要針對真核轉(zhuǎn)錄組,如果需要做原核轉(zhuǎn)錄組或 LncRNA,需個性化溝通。

