泛基因組(Pan-genome)即某一物種全部基因的總稱,這里這個全部基因是有別于個體基因組的基因的。一個個體的基因組是這個物種基因組的代表。因此,以一個基因組為模板的分析不能全面的反應物種基因水平的全部遺傳信息,尤其是在研究同一物種中差異巨大的不同亞種或者變種,此類特有片段的差異往往要比共有片段中的差異更為重要。分析核心基因和非核心基因的基本情況,并從特有基因序列的角度來研究物種內的差異。
泛基因組主要有3種構建方法:Map to pan,Iterative assembly和De novo assembly。從頭組裝(De novo assembly):是構建泛基因組或者參考基因組最經典的方法,分別對多個個體分別進行從頭組裝并且注釋,然后將所得的每個個體的組裝好的序列與參考序列基因組進行互相比對,找出比對不上的區域或者基因,這些個體獨特的基因就是非核心基因。
Pan-genome研究 | 研究內容 | |
基因組組裝 | Pan-genome構建、多軟件組裝、組裝結果評估 | |
基因預測與注釋 | 編碼基因預測;重復序列注釋和轉座元件分類;非編碼RNA注釋;假基因注釋等 | |
Hi-C輔助基因組組裝 | 有效數據評估;Contig聚類、排序及定向分析;掛載結果評估 | |
生物學問題解析 |
常規分析 |
核心基因與非核心基因分析; |
非核心基因區結構變異分析(SV,PAV,CNV); | ||
基因家族聚類分析; | ||
系統進化分析; | ||
高級分析 | 群體功能基因定位研究:GWAS,QTLs定位等 | |
數據庫部署 |
樣品寄送
公司成立于2009年,深耕基因組測序領域十多年,長久以來致力于成為精準的基因組組裝專家;
擁有世界在最主流的三代測序平臺(PacBio測序全平臺和Nanopore測序全平臺),具有豐厚的雙平臺組裝及上萬種物種基因組組裝經驗。在Pan-genome的構建上,具有優勢。
Hi-C染色質構象捕獲技術文庫有效數據比例高,掛載效率高達99%,多倍體物種研究經驗豐富,在泛基因組結構變異研究中可與Hi-C做整合,進一步精準鑒定基因組結構變異。
除Pan-genome的構建外,公司致力于成為最具專業的功能基因定位專家,在泛基因組高級分析內容群體功能基因定位中具有和大的優勢。
擁有自主研發的基因組測序和分析技術,目前已經獲得23項發明專利,超過150多項核心軟件著作權。
期刊:Nature Genetics
影響因子:27.125
發表單位:華中農業大學、北京百邁客生物科技有限公司等
發表年份:2018年12月
研究背景:
棉花是世界上最大的天然紡織纖維來源,它起源于大約1-2百萬年前的異源多樣化事件,隨后是數千年的不對稱亞基因組選擇。陸地棉(G. hirsutum)由于其高產而在全世界種植。G. barbadense以其卓越的纖維質量而受贊譽。為了培育產生纖維更長,更細和更強韌的陸地棉(G. hirsutum)品種,一種方法是將海島棉(G. barbadense)的優良纖維性狀引入陸地棉。基因組學啟動的育種策略需要對基因組組織進行詳細而有力的理解。
研究結果:
1、陸地棉和海島棉基因組組裝:
利用三代測序(PacBio RSII)+光學圖譜(BioNano Genomics Irys)+Hi-C相結合的方法進行異源四倍體陸地棉和海島棉基因組組裝。組裝獲得陸地棉Contig L50 = 1.89 Mb,海島棉Contig L50 = 2.15 Mb,Hi-C染色體掛載效率分別為 98.94%和97.68%(圖1)。
2、陸地棉和海島棉全基因組變異分析:
對異源四倍體陸地棉和海島棉進行全基因組變異分析,包括SNPs和Indels變異分析,染色體結構變異及PAVs分析(圖2)。預測的SNPs和InDels對陸地棉和海島棉的基因具有很大的功能影響,進一步利鑒定了受到了正向選擇(Ka/Ks >1)的基因;利用Hi-C進行染色體結構變異分析,發現有170.2 Mb的基因組序列被鑒定為G. hirsutum和G. barbadense之間的倒位。
3、Gossypium hirsutum漸滲系構建及QTLs定位:
研究中構建了漸滲系群體,旨在引入有利的變異,控制從G.barbadense到G. hirsutum等重要農藝性狀的形成,如纖維質量。通過分子標記對168份漸滲系材料進行測序,并鑒定了涵蓋所有26條染色體的466個基因滲入片段(圖3)。進一步研究結果表明,陸地棉中無絨毛突變體的遺傳變異與海島棉中的數量性狀基因座(QTL)共定位。該漸滲片段與天然纖維突變體的特征將有助于比較分析海島棉和陸地棉之間的絨毛纖維起始機制。
研究結論:
研究中通過陸地棉(Gossypium hirsutum)和海島棉(Gossypium barbadense)兩種栽培棉種質基因組的重新組裝,鑒定了大量的變異,這些變異應與其它種質的基因組分析相結合,以充分挖掘兩種種質基因組間的差異。進一步通過構建滲入系,在兩種代表性種質間探索研究了具有潛在優質纖維質量性狀的基因組序列信息,而這在棉花育種中,可用于理想性狀的培育;這些資源將極大的促進棉花功能基因組學與進化基因組學的研究,并將為棉花纖維質量的改良提供信息。