- 首頁 > 全外顯子組測序
全外顯子組測序
全外顯子組測序(Whole-exome sequencing, WES)是一種廣泛應用的基因組測序技術。與全基因組測序(Whole-genome sequencing, WGS)不同,WES 主要關注基因組中的外顯子區域,即負責編碼蛋白質的部分。外顯子組約占整個基因組的 1.5%[1],包含了大約 2.2 萬個基因,鑒于超過 85% 的孟德爾遺傳病與這部分基因組相關[2],WES 因此成為了臨床實踐中一種更為高效且經濟的選擇。
產品優勢
1、高效精準、省力好用:直接對蛋白編碼序列測序有效降低測序費用、儲存空間和工作量,更適合高深度測序,可發現變異頻率低于1%的罕見變異;
2、質控完整、質量卓越:DNBSEQTM對 InDel 檢測有更好的靈敏度,配合嚴格規范的項目流程和質量體系,為項目質量保駕護航;
3、應用更新:聯合國內首家腫瘤新抗原藥物研發公司,提供優質的新抗原預測服務;
4、經驗豐富、研究廣泛:累計項目經驗超十萬例樣品,發表相關文章上百篇;涉及二十多種腫瘤類型與復雜疾病;罕見病研究性文章過百篇。
產品應用
相比于全基因組測序,外顯子區域占比小(約1%),因此更容易做到更高深度測序,檢測到更多低頻和罕見變異,同時也能降低測序費用和存儲空間。外顯子測序,50M的捕獲區域,測序數據量10-12Gb就可以得到100X的有效測序深度。這個特性決定了外顯子測序在遺傳性疾病和腫瘤研究中的重要作用,特別是做腫瘤異質性研究。由于腫瘤異質性,腫瘤內部有很多亞克隆,有些亞克隆的占比很低,應用外顯子高深度測序可以更快、更經濟地檢測出普通測序深度難以發現的體細胞突變。

圖1 外顯子測序產品應用
1.孟德爾遺傳病研究:
WES可以應用于家系樣本和散發樣本的遺傳病研究。經WES及分析后,過濾掉對功能無影響的變異及公共數據庫中的常見變異,最終確定候選變異信息。
2.腫瘤基因組研究:
WES可用于研究遺傳易感性、致病機理(驅動基因)、腫瘤異質性、轉移和復發/耐藥機制、新抗原與療效等。
3.復雜疾病研究:
對于新生突變家系,通常以核心家系為單位進行研究,尋找在患者中存在而父母中沒有的突變。對于散發樣本,建議使用大樣本量進行 Case/Control 研究。
4.藥物基因組學研究:
外顯子組數據可以提供比常用的芯片更有價值的藥物基因組學信息。研究通常會選擇藥物暴露的患者個體、正常個體以及未接受藥物治療的正常個體,以探究個體遺傳變異與藥物反應之間的機制。
5.人群隊列研究:
從全面性和準確性角度考慮,以及考慮到對低頻(0.5% < MAF < 5%)和罕見突變(MAF < 0.5%)的研究趨勢,推薦采用高通量測序技術,其中全外顯子組測序是一個優選方案。
6.醫學臨床診斷:
臨床全外顯子組測序是疑似罕見孟德爾疾病的最佳診斷方法之一。當患者已經排除了常見的單基因缺陷,同時又考慮到多基因缺陷的檢測方法較為昂貴時,臨床 WES 成為了最優選。
在一些臨床異質性強(同一基因可引起不同的臨床表型)和基因異質性強(同一臨床表型可由不同的基因突變引起)的疾病中,如癲癇、智力障礙等,臨床 WES 檢測相對于傳統的 panel 檢測具有明顯的優勢
技術概況
全外顯子組測序使用探針捕獲技術對外顯子區域的 DNA 進行捕獲,然后基于 DNBSEQ 自主測序平臺進行全外顯子組測序。獲取的數據經過質控后進行生信分析,可用于識別遺傳變異,包括孟德爾疾病和常見疾病,如米勒綜合征和阿爾茨海默病,也能夠快速、高效、高深度地檢測出個體或群體的變異情況,獲得如單核苷酸多態性(SNP)、插入缺失變異(InDel)、結構變異(SV)以及拷貝數變異(CNV)等的變異信息。
獲得高質量數據是確保生物信息分析結果正確、全面、可信的前提。當樣品送達華大后,華大對樣品檢測、建庫、測序的每一個生產步驟都進行了嚴格的把控,從根本上確保了高質量數據的產出,從源頭上保證測序數據的準確性、可靠性。

圖2 DNBSEQTM平臺外顯子建庫流程
信息分析
信息分析從測序的下機數據(raw data)開始,原始下機數據過濾掉接頭、低質量堿基、未測出的堿基后比對到參考基因組上,進行SNP檢測和InDel或者CNV分析,然后通過數據庫注釋,對變異檢測的結果通過基于變異有害性、樣本情況和基因功能表型三種分析策略,篩選出于疾病相關的有害性位點或基因。另外, 為了保證高質量的測序數據,在整個分析流程中設置了嚴格的數據質控體系。

外顯子測序主要適用于腫瘤易感性、致病機理、癌癥異質性、轉移和復發以及藥物療效研究。其中癌癥異質性需要高深度測序,建議200X以上有效深度,FFPE樣品建議200-300X對應的數據量,需要盡量全面、準確地檢測腫瘤組織發生的所有突變信息,所以測序深度需要盡可能高,以檢測低豐度突變位點。ctDNA建議500X及以上有效測序深度,用于檢測Somatic 突變以及頻率來判斷ctDNA的存在和水平,從而反應腫瘤負荷等信息。

圖6 腫瘤信息分析內容
*此外華大也可結合客戶的需求,協商定制化信息分析內容。
參考文獻
[1] Ng SB1, Turner EH., et al. Targeted capture and massively parallel sequencing of 12 human exomes. Nature.461(7261):272-6.
[2] Choi M1,Scholl UI., et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing.Proc Natl Acad Sci USA. 106(45):19096-101.
案例一 全外顯子組聯合轉錄組和蛋白組,實現多組學分析,揭示子宮內膜樣腺癌分子特征
Proteogenomic insights into early-onset endometrioid endometrial carcinoma: predictors for fertility-sparing therapy response
發表期刊:Nature Genetics
影響因子:31.7
發表時間:2024年4月
本文是一篇深入研究早期發病的子宮內膜樣腺癌(Early-onset endometrioid endometrial carcinoma, EEEC)的多組學研究,旨在揭示這類癌癥的分子特征,并探索其與生育保留治療反應的預測因子。研究團隊通過大規模的多組學分析,對215位患者進行了研究,其中包括81位早期發病的子宮內膜樣腺癌患者。子宮內膜癌是女性中第六大常見癌癥,特別是在年輕女性中的發病率不斷上升。對于40歲以下希望保留生育能力的患者,早期發病的子宮內膜樣腺癌(EEEC)的治療尤為關鍵。本研究旨在闡明EEEC的分子特征,并確定可能影響生育保留治療效果的生物標志物。
全外顯子組測序(WES)在本研究中扮演了關鍵角色,它不僅揭示了早期發病子宮內膜樣腺癌(EEEC)的深層分子機制,還識別了與疾病發生發展緊密相關的特定基因變異。WES的應用有助于理解環境因素如何通過基因組上的特定突變特征影響腫瘤的產生,同時為發現潛在的治療靶點和生物標志物提供了重要信息,進而推動個性化醫療的發展。研究團隊采用了WES技術對215位子宮內膜癌患者的腫瘤樣本進行了深入分析,其中包括81位早期發病的患者。通過嚴格的數據質量控制和高通量的測序手段,研究者們識別并定量分析了體細胞突變,包括點突變和插入/缺失,同時開發了3D-Sig-Explorer算法來量化特定突變特征對個體突變的貢獻,為研究提供了強有力的技術支持。WES的分析結果揭示了與環境暴露相關的突變特征在EEEC中的顯著性,尤其是CTNNB1和SIGLEC10基因的熱點突變。這些發現不僅加深了對EEEC分子特性的理解,還有助于構建中國人群遺傳變異的數據庫,為未來的遺傳流行病學研究奠定了基礎。此外,WES結果還為臨床治療提供了新的視角,尤其是在生育保留治療的個體化方案設計上,有助于指導未來的治療策略。

圖1 研究流程圖

圖2 與暴露組相關的突變特征對EECs的早期發病有很大影響
參考文獻:Hu Z, Wu Z, Liu W, Ning Y, Liu J, Ding W, Fan J, Cai S, Li Q, Li W, Yang X, Dou Y, Wang W, Peng W, Lu F, Zhuang X, Qin T, Kang X, Feng C, Xu Z, Lv Q, Wang Q, Wang C, Wang X, Wang Z, Wang J, Jiang J, Wang B, Mills GB, Ma D, Gao Q, Li K, Chen G, Chen X, Sun C. Proteogenomic insights into early-onset endometrioid endometrial carcinoma: predictors for fertility-sparing therapy response. Nat Genet 2024; 56: 637–651. [DOI: 10.1038/s41588-024-01703-z]
案例二 全外顯子組測序助力基于靶向基因面板的腫瘤突變負擔(TMB)評估的質量提升方法
Enhancing the quality of panel-based tumor mutation burden assessment: a comprehensive study of real-world and in-silico outcomes
發表期刊:npj Precision Oncology
影響因子:6.8
發表時間:2024年1月
本研究針對腫瘤突變負擔(TMB)的評估質量進行了深入分析。TMB作為預測實體瘤患者對免疫療法反應的關鍵生物標志物,其評估的準確性對臨床治療決策至關重要。本研究旨在通過綜合實際樣本與計算機模擬(in-silico)的結果,提出提高基于面板的TMB評估質量的方法。
全外顯子組測序因其高深度、高成本效益的優勢,在腫瘤研究中體現出極高的應用價值。WES的應用使得研究者能夠識別關鍵的突變,包括那些對免疫療法反應預測至關重要的突變,從而為TMB的準確計算奠定了基礎。研究中,WES揭示了超過1.04 Mb的外顯子區域和至少389個基因是實現基本離散準確性所必需的。此外,WES數據支持了對體細胞突變檢測的精度要求,即召回率與精確度的倒數差距需小于0.179,以確保TMB評估的可靠性。WES還強調了在TMB計算中包括同義、無義和熱點突變的重要性,以及確定了5%變異等位基因頻率(VAF)作為至少20%腫瘤純度樣本的適宜截止值。通過WES,本研究不僅提高了對TMB評估技術因素的理解,而且為臨床實驗室優化TMB檢測方法提供了科學依據。WES的深度覆蓋和高分辨率為腫瘤基因組學研究和精準醫療實踐提供了寶貴的資源,展現了其在腫瘤研究中不可替代的作用。

圖3 研究流程

圖4 基于panel的TMB檢測工作流程
參考文獻:Zhang Y, Wang D, Zhao Z, Peng R, Han Y, Li J, Zhang R. Enhancing the quality of panel-based tumor mutation burden assessment: a comprehensive study of real-world and in-silico outcomes. npj Precis Onc 2024; 8: 1–13. [DOI: 10.1038/s41698-024-00504-1]
案例三 隊列分析:外顯子和基因分型聯合,結合功能研究,找到先天性巨結腸的新致病基因
Molecular Genetic Anatomy and Risk Profile of Hirschsprung’s Disease
發表期刊:New England Journal of Medicine
影響因子:96.2
發表時間:2019年4月
先天性巨結腸是一種腸神經系統發育障礙疾病,是新生兒和嬰兒腸梗阻最常見的原因。這類疾病具有80%以上的遺傳性,包括一些與腸道神經系統相關的罕見和常見的基因序列變異或者是一些腸神經發育受累及的單基因遺傳病或染色體綜合征。作者通過對 190 名患者進行了全外顯子組測序以及基因分型,從單核苷酸變異、拷貝數變異到核型變異,來尋找先天性巨結腸的分子學機理,通過 WES 的檢測,在入組患者中一共發現了7個疾病相關的新致病基因。文章研究策略:較大的患者群+重點通路富集分析+完善的功能研究+統計學分析,得出患者受益的相關患病風險和遺傳咨詢依據,環環相扣。

圖5 文章研究思路
參考文獻:Tilghman JM, Ling AY, Turner TN, Sosa MX, Krumm N, Chatterjee S, Kapoor A, Coe BP, Nguyen K-DH, Gupta N, Gabriel S, Eichler EE, Berrios C, Chakravarti A. Molecular Genetic Anatomy and Risk Profile of Hirschsprung’s Disease. N Engl J Med 2019; 380: 1421–1432. [PMID: 30970187 DOI: 10.1056/NEJMoa1706594]
以下是DNBSEQ外顯子測序數據的結果展示。
其中標準品為 “瓶中基因組(Genome in a Bottle)” 的人類樣本 NA12878,這是目前被世界上認為研究較為透徹的二倍體人類基因組,并發布了高置信變異集,可作為一個重要工具來了解測序儀和檢測結果的表現。
下機數據質量高
下圖為堿基分布平衡情況。從圖中我們可以看到堿基分布平衡性好,N序列也很少。

圖1 DNSBEQ 外顯子堿基分布
Q 值反映平臺的測序準確性。下圖是部分商業樣品的測試數據,其中 Q20 平均 98.8%,Q30平均 95.6%。數據質量非常高。

圖 2 DNBSEQ外顯子下機數據質量
對比率高,覆蓋度均一
在 100X 左右時,DNBSEQ 平臺在 DUP、覆蓋度(99.7%)上都有卓越的表現。DNBSEQ平臺表現出較好的捕獲效率使其數據量平均在 12 G 即可滿足深度要求。
表格 1 不同外顯子探針在DNBSEQ測序平臺上的數據表現
| Alignment | Agilent V6_1 | Agilent V6_2 | Agilent V6_3 | Agilent V8_1 | Agilent V8_1 | Agilent V8_1 |
| Raw data / Gb | 12.36 | 12.36 | 24.15 | 8.86 | 9.22 | 9.26 |
| Capture efficiency (%) | 54.57 | 58.34 | 51.35 | 53.73 | 55.40 | 57.44 |
| Mapping rate (%) | 99.77 | 99.82 | 99.94 | 99.92 | 99.91 | 99.92 |
| Duplication (%) | 14.34 | 12.09 | 15.91 | 9.23 | 6.52 | 6.49 |
| Mismatch rate (%) | 0.45 | 0.45 | 0.30 | 0.31 | 0.31 | 0.31 |
| Average depth (X) | 111.55 | 119.25 | 307.82 | 118.08 | 126.81 | 131.95 |
| Coverage_1x (%) | 99.73 | 99.72 | 99.20 | 99.68 | 99.69 | 99.69 |
| Coverage_4x (%) | 99.63 | 99.62 | 98.78 | 99.48 | 99.54 | 99.55 |
| Coverage_10x (%) | 99.31 | 99.30 | 98.53 | 99.01 | 99.25 | 99.30 |
| Coverage_20x (%) | 98.15 | 97.98 | 98.18 | 97.8 | 98.66 | 98.82 |
測序重復性高
150X有效深度時,測序平臺的SNP的一致性>98%,InDel的一致性>81%。BGISEQ-500平臺外顯子測序結果的重復性表現非常好,表明該平臺測序結果穩定、可靠。

圖3 DNBSEQ 外顯子重復性分析
突變變異檢測優異
DNBSEQ 平臺通過其獨特的技術優勢,在WES中實現了對SNP和InDel變異的高度敏感檢測,并且保持了良好的特異性,為后續的生物信息學分析提供了可靠的基礎數據。

圖4 DNBSEQ外顯子SNP檢測的精確度和靈敏度表現
組織樣品送樣建議
|
組織類型 |
需求量及寄送方式 |
|
新鮮培養細胞 (細胞數) |
≥ 5×106 cells,離心后液氮速凍,-80°保存,干冰寄送。 |
|
新鮮動物組織干重 |
≥ 50 mg 1. 液氮速凍法:分割成 50 mg 小塊后,液氮速凍,放入干凈的帶螺紋旋蓋的保存管中。-80°保存,干冰寄送。 2. 商業核酸保護液保護法:嚴格按照說明書操作,組織厚度保持在 5 mm 左右,活體組織離體后建議 3 分鐘內液氮速凍。 |
|
全血(哺乳動物) |
≥ 1 mL,EDTA 抗凝管采集。新鮮采集的用移液器轉移至 2 mL 的離螺紋旋蓋管,足量冰袋或者干冰寄送;冷凍血液,干冰寄送。 |
|
FFPE |
10 張以上未經染色,組織面積大于 100 mm2,厚度為 5-10 μm 的切片,其中有核細胞數含量占 80%以上,腫瘤細胞組織區域占 70%以上,常溫保存寄送。 |
注:詳細送樣建議請參考華大官方發布的核酸和組織送樣建議,或登錄MyBGI點擊“送檢單填寫”查看相關送樣建議。
注意事項:
1、2 mL 螺紋旋蓋保存管。
2、組織樣品保存方法選擇:首選液氮速凍;沒有液氮條件的,可直接放入-80°C冰箱凍存; 環境條件限制的,可使用商業核酸保護液保存,并嚴格按相應試劑說明操作。
3、長年保存的組織:保存時間超過一年的組織不建議送樣。
DNA 樣品送樣建議
|
樣品總量 |
樣品體積 |
樣品濃度 |
完整性(膠圖) |
純度 |
|
≥ 0.5 μg |
≥ 15 μL |
≥ 12.5 ng/μL |
主峰 > 20 Kb |
無蛋白,RNA/鹽離子等污染,樣本無色透明不粘稠 |
注:詳細送樣建議請參考華大官方發布的核酸和組織送樣建議,或登錄 MyBGI 點擊“送檢單填寫”查看相關送樣建議。
注意事項:
1、務必附上凝膠電泳、NanoDropTM、Qubit?、Agilent Bioanalyzer 等其中至少一種的檢測結果,電泳圖需標明所用marker的條帶大小。
2、樣品質量以 BGI 的質檢結論為準,望合作伙伴理解,檢測結果可能會由于檢測地點,儀器設備和操作者等不同造成固有差異。因質檢有一定的消耗量,合作伙伴寄送的樣本量必須高于各產品樣品標準至少 50 ng 以上。強烈建議根據2倍以上標準制備樣品,否則很可能會導致大量樣本質檢未能達標,延誤項目進展。
3、BGI原則上只接收 1.5 mL/2.0 mL EP 管,要求每管樣品體積在 15-100 μL之間(推薦30 μL),根據實驗要求,如果樣品體積小于15 μL,BGI 可能會在檢測之前稀釋原始樣品。
Q1:腫瘤研究推薦測序深度?腫瘤樣品如何選對照樣品?
癌組織推薦 200X 以上,癌旁推薦 100X 以上,具體根據客戶研究目的及經費情況可以調整。對于全外顯子組測序,實體瘤一般選擇癌旁或者血液作為對照,血液腫瘤可以選口腔細胞或者皮膚作對照組。
Q2:癌癥分析時為什么需要成對樣本?
Germline Mutation(胚系突變)和 Somatic Mutation(體細胞突變),前者側重于可遺傳的、個體背景中所有細胞攜帶的突變,主要用于遺傳易感性及藥物基因組學的相關研究;后者側重于腫瘤細胞特有、正常細胞沒有的一類突變,通過尋找腫瘤與正常細胞間突變信息的差異,進一步研究癌癥發生發展的機制。
Q3:外顯子捕獲效率是什么?
全外顯子組測序過程中要用到雜交過程。在人的染色體上有許多與外顯子有同源性的部分,這些有同源性的部分很可能在雜交過程中也被捕獲下來。所以,測到的序列中,有一部分不是外顯子序列。我們把測序得是外顯子的部分占全部測序序列的比例稱為捕獲效率。
Q4:外顯子捕獲測序的效率如何?
平均測序深度大于 30X 時, 外顯子組覆蓋度達到雜交芯片可捕獲的不低于 90% 的目標區域,可發現雜交芯片可捕獲區域中 99% 的 SNPs (單核苷酸多態性)。 建議外顯子組測序的測序深度為大于 100X 以上。對于腫瘤或者應用于臨床上的研究,我們建議高深度測序。
Q5:全外顯子組測序一般推薦的測序深度是多少?
深度根據客戶/合作伙伴的研究目的和樣品數量而定。一般建議有效測序深度至少大于 100X 以上。因為有文獻報道,全外顯子組測序的深度影響變異檢測率,隨著測序深度的升高,變異檢出率增大,且達到一定深度時,變異檢測達到平穩狀態。內部的測試數據顯示,在 100X 有效測序深度下的全外顯子組測序中,SNP 在各深度梯度下的檢出率、20X 的覆蓋比例均達到一個很平穩的狀態,可得到最顯著有效的變異檢出。
Q6:全外顯子組測序在研究性染色體上的基因和常染色體上有沒有區別,性染色體在捕獲上有什么難度?
全外顯子組測序技術是通過芯片雜交來富集外顯子區域,再通過新一代測序技術對捕獲的外顯子進行測序。相對于常染色體,性染色體 X 和 Y 之間同源性比較高,測序后組裝過程中,同源序列定位就比較困難,因此如何區分兩種性染色體上的基因則成為研究的難點。
Q7:在全外顯子組測序結果中出現是內含子或非編碼區的結果,而且要比外顯子的數據還多,這是為什么?
WES 的實際捕獲區間是大于外顯子區域的,會捕獲到內含子或非編碼區的序列而檢測變異的過程是檢測全部數據的變異,所以會檢測到內含子或非編碼區。從項目經驗來看,確實會有內含子或者非編碼區的變異數目比外顯子區的變異數目多的情況。結果的可信度是看這個位點的覆蓋深度、質量等信息,而不是看結果在哪個區域。在測序深度、質量和位點覆蓋深度都達標的情況下,建議重點關注外顯子區的結果。
Q8:在全外顯子組測序中,如何判斷 CNV 缺失的可信度?
WES 檢測的 CNV 假陽性較高,可信度不如 WGS 的檢測結果。若關注的基因出現了CNV 的注釋,可以去 bam 文件中確認該位置的 reads 覆蓋情況,以 bam 文件中的結果為主,后期可根據結果再進行驗證分析,若無顯著缺失,不建議關注此 CNV。
Q9:Duplication 是什么,又是如何產生的呢?
在基因組測序中,我們說的 duplication 是特指的 PCR-duplication。也就是,在 PCR 過程中產生的基因重復片段。因為在測序過程中,為了確保測序效果一般將加好接頭的 DNA 片段過量擴增,確保每一個孔中都能覆蓋到足夠多的片段。因此,同樣一個 DNA 片段會擴增出多份拷貝,而這些拷貝有可能也會進入到孔中被測出來。這就會導致這個 DNA 位置的覆蓋度升高,故需執行去重步驟。

