測(cè)序組裝染色體技術(shù)
你有沒(méi)有試過(guò)在不知道zui終圖案的情況下玩拼圖游戲?這正是一些基因組研究人員在嘗試通過(guò)新一代DNA測(cè)序數(shù)據(jù),拼接成染色體時(shí)所面臨的同樣問(wèn)題。這些染色體能提供基因組組織和結(jié)構(gòu)變異方面的信息,有助于解析進(jìn)化歷史。為了能拼湊出這些染色體來(lái),科學(xué)家們可以通過(guò)物理或者遺傳圖譜完成,但是對(duì)于許多物種而言,這種指導(dǎo)性的圖譜并不存在。
不過(guò)現(xiàn)在,一組來(lái)自美國(guó)伊利諾伊大學(xué)的研究人員開(kāi)發(fā)出了一種新方法,能在沒(méi)有任何已有物理或遺傳圖譜的情況下,預(yù)測(cè)出物種染色體的相應(yīng)組裝。這種方法被稱(chēng)為輔助染色體組裝(reference-assisted chromosome assembly,RACA),其工作原理就是比較基因組信息和雙末端序列信息。
“我們?cè)O(shè)計(jì)的這種方法靶向基因組,或者說(shuō)是基因組保守性,嘗試將其進(jìn)一步融入到進(jìn)化背景中去,”文章的通訊作者,伊利諾斯大學(xué)生物工程系助理教授馬?。↗ian Ma,音譯)解釋道,“這樣就能分析出其構(gòu)架,以及密切相關(guān)的其它基因組信息。”
通過(guò)BGI研究院科學(xué)家們的驗(yàn)證分析,這一研究組預(yù)測(cè)出了藏羚羊可能的染色體片段組裝方法,為了完成這一目標(biāo),研究組成員利用BGI的SOAPdenovo組裝程序構(gòu)建出了1434個(gè)序列支架,然后重建出了60個(gè)羚羊的染色體片段,其中16個(gè)片段與牛的染色體片段相似。
“在進(jìn)行程序處理后,基因組質(zhì)量得到了明顯的提高,”馬博士解釋道,“染色體片段大量減少,連續(xù)性延長(zhǎng),并且可以與其他物種進(jìn)行比較分析了。而且我們之后也能糾正在這一過(guò)程中可能出現(xiàn)的組裝誤差。”
測(cè)序組裝染色體技術(shù)
這一研究組面臨的主要挑戰(zhàn)之一還在于要找到一種能*評(píng)估分析結(jié)果,以及檢測(cè)其工具的方法,為此研究人員將RACA分析結(jié)果,與模擬基因組組裝,以及真實(shí)基因組組裝進(jìn)行了比較,其中真實(shí)基因組組裝數(shù)據(jù)來(lái)自約翰霍普金斯大學(xué)完成的2012基因組組裝金標(biāo)準(zhǔn)評(píng)價(jià)(GAGE)。
“我們的數(shù)據(jù)基本上都來(lái)自(GAGE)研究,因?yàn)檫@些數(shù)據(jù)真實(shí),反映了真正的情況,所以可以檢測(cè)分析工具,”馬博士說(shuō),“我們分析了他們研究中采用的各種組裝結(jié)果,結(jié)果我們發(fā)現(xiàn),我們可以改善這些結(jié)果。”
馬博士表示,現(xiàn)在這項(xiàng)技術(shù)可以立即被用于類(lèi)似Genome 10K之類(lèi)的項(xiàng)目中,這是2009年發(fā)起的一項(xiàng)測(cè)定萬(wàn)種脊椎動(dòng)物基因組圖譜的項(xiàng)目,其目的在于研究生物多樣性和動(dòng)物進(jìn)化的機(jī)制。、
“大多數(shù)(基因組研究)都在使用NGS技術(shù),因此我們認(rèn)為這種方法可以用來(lái)系統(tǒng)地改善這些新物種基因組質(zhì)量”,馬博士說(shuō)。