- 首頁 > RNA-Seq
RNA-Seq
RNA-Seq,對某一物種或特定細胞在某一功能狀態下產生的mRNA進行高通量測序,可以提供定量分析,檢測基因表達水平差異。
技術優勢
數字化信號:測序直接獲得序列,無背景噪音,無交叉雜交;可鑒別序列間單個堿基的差異;
高通量:一次測序得到千萬條以上的序列;
檢測閾值寬:跨越6個數量級的寬檢測閾值,從幾個到數十萬個拷貝精確計數;
良好的重復性:深度測序保證了抽樣隨機性,重復性非常好,無需重復實驗;
高靈活性 :依據客戶需求,提供不同測序平臺服務。
產品應用
醫學上的應用方向——

農學上的應用方向 ——

研究內容
標準信息分析:
1. 基本數據統計:① 去除接頭序列、低質量序列得到reads信息,② 樣品相關性,③ 表達量分布,④ RNA分類;
2. 參考基因組比對;
3. mRNA鑒定;
4. mRNA定量分析;
5. mRNA差異表達分析(樣本間、組間);
6. mRNA表達/差異基因聚類;
7. mRNA差異基因GO分類、富集;
8. mRNA差異基因KEGG分類、富集。
Dr.Tom信息分析:
一)數據庫注釋
1. 轉錄因子注釋(AnimalTFDB/PlantTFDB);
2. GSEA分析;
3. Rfam、Pfam、Reactome、COG、EggNOG和InterPro數據庫注釋;
二)互作網絡分析
1. 靶基因分析① miRNA-mRNA靶向關系分析,② lncRNA-mRNA靶向關系分析;
2. ceRNA互作網絡分析;
3. 蛋白互作網絡分析;
4. 共表達互作網絡分析;
三)特色分析
1. 自定義標簽和自有數據上傳;
2. 外部數據庫信息(TCGA、ARCHS4);
3. 關鍵驅動基因網絡圖分析;
4. 時間序列分析。
(*以上分析內容為部分物種可做。)
定制化信息分析:
1. 可結合客戶的需求,協商確定定制化信息分析內容。
醫學案例:BGISEQ RNA-Seq揭示癌癥CAR-T免疫細胞療法中T細胞耗竭主因
案例描述:
? ? ? ?CAR-T療法是通過基因工程對患者自身的免疫T細胞進行改造,插入識別癌細胞抗原的嵌合抗原受體(CAR),使其具備攻擊癌細胞的能力,然后輸注回患者體內產生免疫應答,消滅癌癥。
? ? ? ? ? CAR-T細胞療法近年來成為癌癥免疫治療最熱門的領域之一,但T細胞耗竭使療效不持久。為了解決這一新興治療方式的主要障礙,本文開展研究,揭示了耗竭的關鍵是轉錄因子c-Jun功能缺陷,通過對CAR-T細胞進行改造可以有效增強其抗衰竭能力。DNBSEQ平臺提供RNA-Seq。
研究結果:
? ? ? ? 在本研究中,研究人員通過可調節性信號CAR模型,找到T細胞耗竭的顯著特征。T細胞耗竭與IL-2產生過程出現缺陷有關,伴有AP-1轉錄因子motif染色質開放性增加以及bZIP和IRF轉錄因子過表達。從圖5可以看出,跟對照相比,耗竭T細胞表現出不同的基因表達模式(e, f)。ATAC-Seq的結果表明,耗竭T細胞中鑒定得到染色質開放區域遠高于對照(g, i, j)。從圖6可以看出,AP-1轉錄因子的表觀遺傳和轉錄失調。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖1?HA-28z CAR T細胞表現出T細胞衰竭的表型、功能、轉錄和表觀遺傳特征

圖2 耗竭的CAR-T細胞中的AP-1家族標志
參考文獻
Lynn R C, Weber E W, Sotillo E, et al. c-Jun overexpression in CAR T cells induces exhaustion resistance[J]. Nature, 2019: 1-8.
?
農學案例:BGISEQ?RNA-Seq作物高效利用氮肥調控機制研究
案例描述:通過選育半矮化作物,極大地提高了綠色革命品種谷物的產量,但因使用過多無機氮肥而導致環境惡化日益加劇。為加強全球糧食安全及可持續發展,提高作物氮利用效率的需求日益迫切。因此,亟需深入了解作物生長,氮同化、碳固定的共同調節機制。
研究方法:以NJ6 (SD1)為對照,對36個含有sd1的秈稻品種分析NH4+的利用率。再以NJ6為輪回親本與一個高NH4+吸收率品系NM73雜交創建BC1F2群體,通過QTL定位、圖位克隆等技術獲得氮肥高效利用的關鍵基因。分析關鍵基因啟動子的三種SNP分型,篩選不同型別影響作物產量的潛在聯系。
研究結果:
1、GRF4-DELLA相互平衡作用調節植物的生長和代謝。GRF4是生長調節因子,調節促進植物氮代謝和穩態,也協調促進植物碳代謝和生長,而DELLA生長阻遏物抑制這些過程。
2、半矮化作物中,在適度的氮素水平下增加GRF4的表達,GRF4-DELLA平衡機制偏向于GRF4的促進作用,從而利于氮、碳的吸收,增加葉、莖的寬度,但對高度影響很小。因此,GRF4表達增加改善氮素吸收效率的同時,不影響半矮化性狀,能進一步提高作物產量。
結果展示:
通過基于BGISEQ平臺的RNA-Seq和ChIP-seq兩項技術,解析GRF4作用的分子機制,證明GRF4是激活下游參與氮素吸收和氮素同化的相關基因。ChIP-Seq揭示了潛在的GRF4靶識別位點,其中主要是多個氮代謝基因啟動子共有的GGCGGC-motif。
GRF4與GIF1(GRF-interacting factor 1)復合體結合包含GCGG-motif的啟動子,促進氮素同化吸收。SLR1(屬于DELLA家族)在該途徑中可抑制GRF4與GIF1的相互作用,導致氮素利用率降低。同時,GRF4還可以促進碳同化吸收相關基因的表達。
?

圖3 GRF4調控多種氮代謝基因的表達
參考文獻
Li S, Tian Y, Wu K, et al. Modulating plant growth-metabolism coordination for sustainable agriculture. Nature. 2018 Aug;560(7720):595-600.
? ? ? ? ? ? ? ? ? ? ? ?部分內容展示:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
圖1? 差異聚類熱圖


圖2? 功能富集或分類圖
? ? ? ? ? ?
圖3??蛋白互作網絡
表1 RNA-Seq核酸樣品判定標準
|
RNA-Seq (Quantification)(默認鏈特異性, 非鏈特異和鏈特異性送樣建議相同) |
||||||
|
樣本類型 |
總量 |
濃度 |
RIN |
28S/18S (23S/16S) or DV200 |
基線和 5S |
純度 |
|
Total RNA(真菌) |
≥1μg |
20-1000 ng/μL |
RIN≥6.5 |
28S/18S≥1.0 |
基線平整, 5S 峰正常 |
無 DNA,蛋白/鹽 離子等污染,樣本 無色透明不粘稠
|
|
Total RNA (植物) |
≥400ng |
10-1000 ng/μL |
RIN≥6 |
28S/18S≥ 1.0 |
||
|
Total RNA(動物) |
≥400ng |
10-1000 ng/μL |
RIN≥7.0 |
28S/18S≥1.0 |
||
|
Total RNA (非全血人鼠)
|
≥200ng |
10-1000 ng/μL |
RIN≥7.0 |
28S/18S≥1.0 |
||
|
Total RNA(昆蟲) |
≥400ng |
10-1000 ng/μL |
N/A |
|||
表2 RNA-Seq 組織樣品判定標準
|
組織類型 |
RNA-Seq文庫 |
|
新鮮培養細胞 (細胞數) |
≥2×105cell
|
|
新鮮動物組織干重 |
≥30mg
|
|
新鮮植物組織干重 |
≥100mg
|
|
全血 |
≥1
mL 全血收集的淋巴細胞或 ≥1 mL Paxgene Blood RNA tube / RNAprotect ? Animal Blood Tubes收集的全血 |
|
菌體(細胞數或干重) |
≥2×105cell
或 ≥30mg |
|
FFPE |
≥5片,未染色,100mm2,5~10μm 厚度 |
Q1:RNA-Seq是否需要做生物學重復?如果需要,一般要多少個重復樣本?
答:是的,2011 年 7 月 Hansen[1]發表的文章表明生物學差異是基因自身表達的特性,與檢測技術的選擇以及數據處理的方式無關。生物學重復實驗,可以在很大程度上消除樣本的個體差異、系統平臺差異,能更準確地檢測差異基因。如果不設生物學重復,高影響因子的雜志可能會遭編輯質疑。不建議2個生物學重復是因為,如果兩者結果不一致,無法確定以哪個數據為參考。3個生物學重復,如果出現1個結果不一致的,可以取另外2個的結果。
Q2:RNA-Seq必須要有參考基因組序列嗎?
答:不是必須要有參考基因組序列,但一定要有參考序列,如unigene序列、mRNA序列、CDS序列等可以作為參考序列。也可通過參考有基因組序列的近緣物種的基因注釋信息來完成相應的標準信息分析,不過此種方法并不推薦。
Q3:RNA-Seq如果沒有參考序列怎么解決?
答:推薦做轉錄組de novo組裝獲得unigene作為RNA-Seq參考序列。需要注意的是,要把所有做RNA-Seq的樣品,都混合成一個樣品,做轉錄組。
Q4:RNA-Seq推薦測序數據量與基因組大小有關嗎?
答:RNA-Seq推薦的測序數據量,主要與基因數量有關,不同物種基因組大小相差比較大,但是編碼基因的數量相差并不大,一般物種在3萬左右。所以對于一般物種的RNA-Seq數據量,10M clean reads是足夠的。一般HiSeq平臺推薦10M clean reads數據量,BGISEQ-500平臺,為了給研究者更準確全面的數據結果,提供20M clean reads,而價格比HiSeq平臺10M clean reads數據量還低。
Q5:有些觀點認為RNA-Seq測序策略是SE100,有必要測這么長嗎? PE測序是不是會比SE測序更好?
答:沒有必要,SE50足夠。做RNA-Seq,只要將得到的reads比對到參考基因集,得到基因ID就可以了,不需要那么長,因為不需要做組裝,也不需要做定性分析。文獻支持:康奈爾大學維爾醫學院的研究人員在Genome Biology雜志上發表文章[2],認為對于差異表達分析而言,讀長并非越長越好。研究人員認為,在RNA-seq研究中使用什么樣的讀長,這要取決于研究的最終目的。如果只需要差異表達基因,那么50 bp的單端讀取就夠了。與100 bp的雙端讀取相比,使用50 bp的單端讀取能夠節省成本、時間。
Q6:測序后有何驗證方法?
答:實驗驗證的方法最常見的是通過實時熒光定量 PCR(qRT-PCR)技術來驗證測序結果。還有FISH(原位熒光雜交)、微陣列芯片技術、Northern blot等。 功能驗證一般是基因敲除、敲低或過表達,轉基因等。
Q7:BGISEQ-500 RNA-Seq有沒有發布demo數據?
答:已發布一個UHRR人標準品下機數據并共享了數據結果和分析方法,下載請點擊這里>>
參考文獻
1. Kasper D Hansen, Zhijin Wu, et al. Sequencing technology does not eliminate biological variability. Nature Biotechnology. 2011. 29(7): 572–573.
2. Chhangawala S, Rudy G, Mason CE, et al. The impact of read length on quantification of differentially expressed genes and splice junction detection. Genome Biology. 2015 Jun 23;16:131.

