每日經(jīng)濟(jì)新聞 2022-04-06 18:19:48
◎國際科學(xué)團(tuán)隊(duì)T2T聯(lián)盟發(fā)起人之一凱倫?米加表示,完整的人類基因組序列將有助加深對人類基因組中最難測序、且高度重復(fù)的那部分基因片段的理解,也將為科學(xué)家研究人類基因組變異、疾病和進(jìn)化提供一個(gè)全面的框架。
◎約翰斯?霍普金斯大學(xué)教授邁克爾?沙茨:新序列糾正了當(dāng)前參考序列中的數(shù)千個(gè)結(jié)構(gòu)錯(cuò)誤,我們由此發(fā)現(xiàn)了數(shù)百個(gè)臨床相關(guān)基因,這包括與肌肉麻痹、心律失常、脊髓性肌萎縮、免疫力、癌癥等疾病相關(guān)的基因。
◎華盛頓大學(xué)基因組科學(xué)系博士后研究員格倫尼斯?洛格斯登:人類基因組的完整序列將有助檢測導(dǎo)致不孕不育和流產(chǎn)的變異基因,我們有望研究出降低不孕不育和流產(chǎn)等的風(fēng)險(xiǎn)、提高生育率的醫(yī)療策略。
每經(jīng)記者 張凌霄 每經(jīng)編輯 高涵
人類基因組計(jì)劃被譽(yù)為生命科學(xué)的 “登月計(jì)劃”。1990年,人類基因組計(jì)劃由美國能源部和美國國家衛(wèi)生研究院投資,預(yù)期在15年內(nèi)完成。2001年2月12日,由6國科學(xué)家共同參與的國際人類基因組計(jì)劃首次公布人類基因組圖譜及初步分析結(jié)果。2003年,研究人員公布了當(dāng)時(shí)被稱為完整的人類基因組序列,但其中有大約8%尚未完全破譯,主要是因?yàn)樗母叨戎貜?fù)的DNA片段難以與其他部分嚙合。
近日,《科學(xué)》雜志連續(xù)發(fā)6篇論文報(bào)告,公布了由國際科學(xué)團(tuán)隊(duì)“端粒到端粒(T2T)”聯(lián)盟研究出的首個(gè)完整無間隙人類基因組序列,填補(bǔ)了近20年來缺失的“拼圖”碎片。
繼2001年人類基因組序列的工作草圖問世后,時(shí)隔二十多年,人類基因組測序終于迎來了歷史性的突破。這一科學(xué)界的里程碑對于我們普通人來說意味著什么?這份人類基因“拼圖”有何應(yīng)用?
《每日經(jīng)濟(jì)新聞》記者(以下簡稱NBD)專訪了T2T聯(lián)盟發(fā)起人之一、美國加利福尼亞大學(xué)圣克魯茲分?;蚬こ虒W(xué)助理教授凱倫·米加(Karen Miga),以及研究論文的主要作者——約翰斯·霍普金斯大學(xué)計(jì)算機(jī)科學(xué)和生物學(xué)系教授邁克爾·沙茨(Michael Schatz)以及華盛頓大學(xué)基因組科學(xué)系博士后研究員格倫尼斯·洛格斯登(Glennis Logsdon),揭秘首個(gè)人類基因組完整序列的創(chuàng)新突破和應(yīng)用前景。
在人類基因組序列中,這部分被遺漏近20年的序列結(jié)構(gòu)極為復(fù)雜,主要是DNA序列高度重復(fù)的染色體中間部分的著絲粒、末端的端粒。
(編者注:每條染色體都有一個(gè)叫做著絲粒的收縮點(diǎn)。在分裂前期和中期,著絲粒把兩個(gè)姐妹染色單體連在一起。)
聯(lián)盟此次發(fā)表的新研究成果則是填補(bǔ)了這部分的空白。“有約90%的新序列實(shí)際上來自染色體的著絲粒。”T2T聯(lián)盟研究論文的主要作者之一、加利福尼亞大學(xué)伯克利分校的博士后Nicolas Altemose介紹。T2T聯(lián)盟匯集了全球100多名頂尖科學(xué)家。
這些拼圖“碎片”有何作用?這項(xiàng)成果的創(chuàng)新性和突破性在哪兒?
NBD:這份人類基因組完整“拼圖”意味著什么?
邁克爾·沙茨:基因組對生命的多個(gè)方面都有重大意義,它影響著一個(gè)人的主要特征,如身體特征,也決定著一個(gè)人患上不同遺傳疾病的概率。
以前的人類參考基因組GRCh38缺失了約8%的序列,因此幾乎所有以前的遺傳學(xué)和基因組學(xué)研究都無法探索這些序列如何影響人類特征。盡管8%似乎是一個(gè)小數(shù)字,但它仍然可以做出重大貢獻(xiàn)。
另外,新序列糾正了當(dāng)前參考序列中的數(shù)千個(gè)結(jié)構(gòu)錯(cuò)誤,我們由此發(fā)現(xiàn)了數(shù)百個(gè)臨床相關(guān)基因,這包括與肌肉麻痹、心律失常、脊髓性肌萎縮、免疫力、癌癥等疾病相關(guān)的基因。
凱倫·米加:完整的人類基因組序列將幫助我們加深對人類基因組中最難測序、且高度重復(fù)的那部分基因片段的理解。此外,它也將為科學(xué)家研究人類基因組變異、疾病和進(jìn)化提供一個(gè)全面的框架。
格倫尼斯·洛格斯登:人類基因組的完整序列為我們提供了一個(gè)新的視角,隨著最后8%基因組的破譯,我們能夠更全面地檢測這些片段中的致病性基因變體,并開發(fā)出有效的治療方法。
NBD:新解鎖的8%基因片段具有什么樣的功能?
格倫尼斯·洛格斯登:新的基因片段有許多不同的功能。首先,著絲粒是我們每一條染色體上的一大重要區(qū)域,它能夠確保每一條染色體在細(xì)胞分裂過程中被準(zhǔn)確地分割到子細(xì)胞中。功能失調(diào)的著絲??赡軙?dǎo)致癌癥、不孕不育和先天缺陷。通過確定每個(gè)著絲粒的完整序列,我們現(xiàn)在可以開始識別導(dǎo)致染色體分離并導(dǎo)致這些疾病的基因變體,這將幫助我們開發(fā)新的治療方法。
其次,我們從多個(gè)高度重復(fù)的基因片段中發(fā)現(xiàn)了許多新的基因,其中就包括182個(gè)對疾病有重要影響的新基因。例如,存在一個(gè)被稱為LPA的基因,它反映了冠心病、心血管疾病、動脈粥樣硬化、血栓和中風(fēng)的遺傳風(fēng)險(xiǎn)。LPA的完整序列能夠幫助我們了解該基因中的變體如何促成上述疾病的形成和發(fā)展。
邁克爾·沙茨:新的基因序列解析了許多以前沒有被表現(xiàn)出來的片段。細(xì)胞需要著絲粒來保證其在分裂時(shí)能夠精確地復(fù)制DNA(通常是復(fù)制兩份,一份來自母親,一份來自父親),這個(gè)過程如果出現(xiàn)錯(cuò)誤,就可能會導(dǎo)致癌癥等重大疾病或是其他嚴(yán)重的發(fā)育障礙。
圖片來源:視覺中國-VCG111309808561
此前,這最后的8%基因組之所以很難被測序,主要是因?yàn)樗筛叨戎貜?fù)的DNA“磚塊”構(gòu)成,“就像是拿著好幾塊相同的拼圖碎片一樣,很難把它和其他的碎片拼在一起。”
T2T聯(lián)盟的研究人員通過新的納米機(jī)器設(shè)備與核心技術(shù),讓小拼圖變成了大拼圖,得到了被稱為“T2T-CHM13”的無間隙版本參考序列,基因組由30.55億個(gè)堿基對和19969個(gè)蛋白質(zhì)編碼基因組成。
完整“拼圖”是如何解鎖的?背后有什么技術(shù)創(chuàng)新?后續(xù)有何研究計(jì)劃?
NBD:此次基因組測序取得重大突破的主要原因是什么?
邁克爾·沙茨:新的技術(shù)確實(shí)非常重要。在T2T聯(lián)盟的研究中,我們使用了太平洋生物科學(xué)公司(Pacific Biosciences)和牛津納米孔技術(shù)公司(Oxford Nanopore Technology)發(fā)明的,被稱為“長讀長測序技術(shù)”的新實(shí)驗(yàn)方法對基因組的不同部分進(jìn)行了測序,再運(yùn)用新的算法來分析已經(jīng)得到的數(shù)據(jù),最終首次準(zhǔn)確地組裝了基因組。
這個(gè)過程類似于組裝拼圖,然而許多“拼圖塊”因?yàn)橛兄叨认嗨频闹z粒,就像天空中的云或者撞碎的波浪,非常難以區(qū)分。
凱倫·米加:我認(rèn)為,正確的技術(shù)、正確的科學(xué)家團(tuán)隊(duì)和正確的時(shí)間都非常重要。我們的每個(gè)細(xì)胞中都有數(shù)十億個(gè)DNA堿基,而我們目前的技術(shù)是無法從頭到尾讀取基因組的。
構(gòu)建基因組的過程經(jīng)常被比作拼圖,在過去,研究人員只能對小部分DNA進(jìn)行測序,得到的拼圖塊也就比較小,可能需要處理10000塊小拼圖塊。而我們使用“長讀長測序技術(shù)”,則讓這些小拼圖塊變成了100塊大拼圖塊。
格倫尼斯·洛格斯登:這次研究取得成功源于兩個(gè)方面的重大突破,兩者都同等重要。首先是測序技術(shù)的發(fā)展,“長讀長測序技術(shù)”所能提供的短讀數(shù)據(jù)長100-1000倍,使我們得以首次連貫地讀取一些片段。另一個(gè)重大突破是新的統(tǒng)計(jì)算法,通過這個(gè)算法,我們可以把讀取到的DNA組裝成一個(gè)高度精確的序列。
NBD:未來可能的研究方向是什么?
凱倫·米加:我們的單一完整基因組并不能了解人類遺傳變異的全部多樣性。因此,T2T聯(lián)盟正在與人類泛基因組參考聯(lián)盟合作,致力于集合不同種族或血統(tǒng)的人的基因序列,建立一個(gè)能夠代表全人類的高質(zhì)量參考基因組,這將是T2T聯(lián)盟未來幾年的一個(gè)重點(diǎn)工作。
邁克爾·沙茨:新的完整人類基因組為下一步的研究提供了許多新機(jī)會。首先,我們可以使用這個(gè)新的參考基因組來重新分析現(xiàn)有的數(shù)據(jù),包括研究和識別新的遺傳變異,進(jìn)而認(rèn)識新的疾病風(fēng)險(xiǎn)因素。第二,我們的研究證明了現(xiàn)在已經(jīng)存在對人類基因組進(jìn)行完全測序的技術(shù),基于這一結(jié)果,未來可能使用相關(guān)技術(shù)對其他基因組也進(jìn)行測序。
圖片來源:攝圖網(wǎng)-500327248
過去幾十年中,伴隨著人類基因組測序進(jìn)程的推進(jìn),基因測序的商業(yè)化落地也開始不斷拓展,基因測序在疾病早篩、微生物、遺傳學(xué)檢測等領(lǐng)域都是其應(yīng)用方向。
但值得注意的是,目前基因測序技術(shù)的商業(yè)化應(yīng)用比例并不高。Grand View Research的數(shù)據(jù)顯示,2020年全球基因測序行業(yè)下游應(yīng)用中,54%的應(yīng)用被學(xué)術(shù)研究占據(jù),用于臨床研究和醫(yī)院診斷的比例僅為18%和14%。
在測序技術(shù)逐漸成熟以及測序成本不斷降低的背景下,基因測序市場有其廣闊的前景。根據(jù)數(shù)據(jù)情報(bào)公司Precedence Research預(yù)測,全球DNA測序市場規(guī)模預(yù)計(jì)將從2020年的84.1億美元增長到2030年的約406.4億美元,2021年至2030年間的復(fù)合年增長率(CGRR)為17.5%。
一邊是商業(yè)化程度不足,一邊是廣闊的市場。基因測序在哪些領(lǐng)域商業(yè)化應(yīng)用前景向好?現(xiàn)階段發(fā)展又面臨什么樣的難點(diǎn)?
NBD:基因組測序的研究成果有哪些應(yīng)用?
邁克爾·沙茨:新的基因組可以有助于識別疾病的新風(fēng)險(xiǎn)等位基因或新的藥物靶點(diǎn),也可以用于研究許多其他生物系統(tǒng),尤其是研究作為人類的藥物或食品的動植物。
另外,在農(nóng)業(yè)領(lǐng)域,基因測序可以幫助育種,讓牛和作物更有生產(chǎn)力,對害蟲和不同的環(huán)境條件更有抵抗力。參考我們剛剛組裝的人類基因組,我們的測序技術(shù)也可以用于組裝主要農(nóng)業(yè)物種的高質(zhì)量參考基因組,這將有助于更好地揭示這些物種的基因組和表觀基因組變異。
格倫尼斯·洛格斯登:人類基因組的完整序列將幫助我們檢測導(dǎo)致不孕不育和流產(chǎn)的變異基因,尤其是著絲粒區(qū)域內(nèi)的變異。通過識別這些變異并確定它們?nèi)绾斡绊懠?xì)胞分裂過程中的染色體分離,我們有望研究出降低不孕不育和流產(chǎn)等的風(fēng)險(xiǎn)、提高生育率的醫(yī)療策略。
NBD:這份完整的基因“拼圖”可以怎么用?
格倫尼斯·洛格斯登:目前,許多針對基因疾病的檢測都是使用基因芯片對致病性變體進(jìn)行檢測,這些檢測都是基于之前的人類參考基因組來進(jìn)行的。但是之前的參考基因組缺少數(shù)億個(gè)堿基,部分變異無法被基因芯片檢測到。有了人類基因組的完整序列,我們可以開始檢測新的致病性變異,但這需要開發(fā)新的基因芯片和軟件實(shí)現(xiàn),這可能需要數(shù)年才能達(dá)成。
NBD:基因測序市場在未來幾年將如何發(fā)展?
格倫尼斯·洛格斯登:我預(yù)計(jì)在未來5-10年內(nèi),基于基因測序的個(gè)性化醫(yī)療市場可以有機(jī)會迅速擴(kuò)張。個(gè)性化醫(yī)療領(lǐng)域有許多可以商業(yè)化的技術(shù),比如智能手機(jī)的app,允許個(gè)人訪問自己的基因組序列,確定疾病風(fēng)險(xiǎn),并制定預(yù)防措施或開始進(jìn)行治療。此外,未來幾年基因組測序數(shù)據(jù)量必然將快速增長,因此用于存儲、處理和臨床解釋基因組數(shù)據(jù)的云平臺也有發(fā)展空間。
封面圖片來源:視覺中國-VCG111309808561
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP