人類基因組計劃

人類基因組計劃

科學探索工程
人類基因組計劃(Human Genome Project, HGP)由美國科學家于1985年率先提出,于1990年正式啟動的。美國、英國、法國、德國、日本和中國科學家共同參與了這一預算達30億美元的人類基因組計劃。按照這個計劃的設想,在2005年,要把人體内約2.5萬個基因的密碼全部解開,同時繪制出人類基因的圖譜。換句話說,就是要揭開組成人體2.5萬個基因的30億個堿基對的秘密。[1]
    中文名:人類基因組計劃 外文名:human genome project 别名: 提出時間:1985年

簡介

人類基因組計劃(Human Genome Project,HGP)的目标旨在闡明人類基因組DNA長達3 X 109堿基對的序列,發現所有人類基因并闡明其在染色體上的位置,從而在整體上破譯人類遺傳信息。

研究内容

HGP的主要任務是人類的DNA測序,包括下圖所示的四張譜圖,此外還有測序技術、人類基因組序列變異、功能基因組技術、比較基因組學、社會、法律、倫理研究、生物信息學和計算生物學、教育培訓等目的。

遺傳圖譜

又稱連鎖圖譜(linkagemap),它是以具有遺傳多态性(在一個遺傳位點上具有一個以上的等位基因,在群體中的出現頻率皆高于1%)的遺傳标記為“路标”,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、重組的百分率,1%的重組率稱為1cM)為圖距的基因組圖。遺傳圖譜的建立為基因識别和完成基因定位創造了條件。

意義:6000多個遺傳标記已經能夠把人的基因組分成6000多個區域,使得連鎖分析法可以找到某一緻病的或表現型的基因與某一标記鄰近(緊密連鎖)的證據,這樣可把這一基因定位于這一已知區域,再對基因進行分離和研究。對于疾病而言,找基因和分析基因是個關鍵。

物理圖譜

物理圖譜是指有關構成基因組的全部基因的排列和間距的信息,它是通過對構成基因組的DNA分子進行測定而繪制的。繪制物理圖譜的目的是把有關基因的遺傳信息及其在每條染色體上的相對位置線性而系統地排列出來。DNA物理圖譜是指DNA鍊的限制性酶切片段的排列順序,即酶切片段在DNA鍊上的定位。因限制性内切酶在DNA鍊上的切口是以特異序列為基礎的,核苷酸序列不同的DNA,經酶切後就會産生不同長度的DNA片段,由此而構成獨特的酶切圖譜。

因此,DNA物理圖譜是DNA分子結構的特征之一。DNA是很大的分子,由限制酶産生的用于測序反應的DNA片段隻是其中的極小部分,這些片段在DNA鍊中所處的位置關系是應該首先解決的問題,故DNA物理圖譜是順序測定的基礎,也可理解為指導DNA測序的藍圖。廣義地說,DNA測序從物理圖譜制作開始,它是測序工作的第一步。制作DNA物理圖譜的方法有多種,這裡選擇一種常用的簡便方法──标記片段的部分酶解法,來說明圖譜制作原理。

序列圖譜

随着遺傳圖譜和物理圖譜的完成,測序就成為重中之重的工作。DNA序列分析技術是一個包括制備DNA片段化及堿基分析、DNA信息翻譯的多階段的過程。通過測序得到基因組的序列圖譜。

大規模測序基本策略:逐個克隆法:對連續克隆系中排定的BAC克隆逐個進行亞克隆測序并進行組裝(公共領域測序計劃)。

全基因組鳥槍法:在一定作圖信息基礎上,繞過大片段連續克隆系的構建而直接将基因組分解成小片段随機測序,利用超級計算機進行組裝(美國Celera公司)。

基因圖譜

基因圖譜是在識别基因組所包含的蛋白質編碼序列的基礎上繪制的結合有關基因序列、位置及表達模式等信息的圖譜。在人類基因組中鑒别出占具2%~5%長度的全部基因的位置、結構與功能,最主要的方法是通過基因的表達産物mRNA反追到染色體的位置。

其原理是:所有生物性狀和疾病都是由結構或功能蛋白質決定的,而已知的所有蛋白質都是由mRNA編碼的,這樣可以把mRNA通過反轉錄酶合成cDNA或稱作EST的部分的cDNA片段,也可根據mRNA的信息人工合成cDNA或cDNA片段,然後,再用這種穩定的cDNA或EST作為“探針”進行分子雜交,鑒别出與轉錄有關的基因。用PolyA互補的寡聚T或克隆載體的相關序列作為引物對mRNA雙端尾側的幾百個bp進行測序得到EST(表達序列标簽)。2000年6月,EMBL中EST數量已有4,229,786。

對人類的重要意義

1、HGP對人類疾病基因研究的貢獻

人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的信息。對于單基因病,采用“定位克隆”和“定位候選克隆”的全新思路,導緻了亨廷頓舞蹈病、遺傳性結腸癌和乳腺癌等一大批單基因遺傳病緻病基因的發現,為這些疾病的基因診斷和基因治療奠定了基礎。

對于心血管疾病、腫瘤、糖尿病、神經精神類疾病(老年性癡呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重點。健康相關研究是HGP的重要組成部分,1997年相繼提出:“腫瘤基因組解剖計劃”“環境基因組學計劃”。

2、HGP對醫學的貢獻

基因診斷、基因治療和基于基因組知識的治療、基于基因組信息的疾病預防、疾病易感基因的識别、風險人群生活方式、環境因子的幹預。

3、HGP對生物技術的貢獻

(1)基因工程藥物:分泌蛋白(多肽激素,生長因子,趨化因子,凝血和抗凝血因子等)及其受體。

(2)診斷和研究試劑産業:基因和抗體試劑盒、診斷和研究用生物芯片、疾病和篩藥模型。

(3)對細胞、胚胎、組織工程的推動:胚胎和成年期幹細胞、克隆技術、器官再造。

4、HGP對制藥工業的貢獻

篩選藥物的靶點:與組合化學和天然化合物分離技術結合,建立高通量的受體、酶結合試驗以知識為基礎的藥物設計:基因蛋白産物的高級結構分析、預測、模拟—藥物作用“口袋”。

個體化的藥物治療:藥物基因組學

5、HGP對社會經濟的重要影響

生物産業與信息産業是一個國家的兩大經濟支柱;發現新功能基因的社會和經濟效益;轉基因食品;轉基因藥物(如減肥藥,增高藥)

6、HGP對生物進化研究的影響

生物的進化史,都刻寫在各基因組的“天書”上;草履蟲是人的親戚——13億年;人是由300~400萬年前的一種猴子進化來的;人類第一次“走出非洲”——200萬年的古猿;人類的“夏娃”來自于非洲,距今20萬年——第二次“走出非洲”?

7、HGP帶來的負面作用

侏羅紀公園不隻是科幻故事;種族選擇性滅絕性生物武器;基因專利戰;基因資源的掠奪戰;基因與個人隐私。

成果

1860至1870年:奧地利學者孟德爾根據豌豆雜交實驗提出遺傳因子概念,并總結出孟德爾遺傳定律。

1909年:丹麥植物學家和遺傳學家約翰遜首次提出“基因”這一名詞,用以表達孟德爾的遺傳因子概念。

1944年:3位美國科學家分離出細菌的DNA(脫氧核糖核酸),并發現DNA是攜帶生命遺傳物質的分子。

1953年:美國人沃森和英國人克裡克通過實驗提出了DNA分子的雙螺旋模型。

1969年:科學家成功分離出第一個基因。

1990年:10月被譽為生命科學“阿波羅登月計劃”的國際人類基因組計劃啟動。

1998年:一批科學家在美國羅克威爾組建塞萊拉遺傳公司,與國際人類基因組計劃展開競争。12月一種小線蟲完整基因組序列的測定工作宣告完成,這是科學家第一次繪出多細胞動物的基因組圖譜。

1999年:9月中國獲準加入人類基因組計劃,負責測定人類基因組全部序列的1%。中國是繼美、英、日、德、法之後第6個國際人類基因組計劃參與國,也是參與這一計劃的唯一發展中國家。12月1日國際人類基因組計劃聯合研究小組宣布,完整破譯出人體第22對染色體的遺傳密碼,這是人類首次成功地完成人體染色體完整基因序列的測定。

2000年:4月6日美國塞萊拉公司宣布破譯出一名實驗者的完整遺傳密碼,但遭到不少科學家的質疑。4月底中國科學家按照國際人類基因組計劃的部署,完成了1%人類基因組的工作框架圖。5月8日德、日等國科學家宣布,已基本完成了人體第21對染色體的測序工作。6月26日科學家公布人類基因組工作草圖,标志着人類在解讀自身“生命之書”的路上邁出了重要一步。12月14日美英等國科學家宣布繪出拟南芥基因組的完整圖譜,這是人類首次全部破譯出一種植物的基因序列。

2001年2月12日中、美、日、德、法、英等6國科學家和美國塞萊拉公司聯合公布人類基因組圖譜及初步分析結果。

2001年8月26日,北京,人類基因組計劃中國測序部分通過國家驗收,“中國卷”繪制完成。

進展與未來

2000年6月26日,參加人類基因組工程項目的美國、英國、法蘭西共和國、德意志聯邦共和國、日本和中國的6國科學家共同宣布,人類基因組草圖的繪制工作已經完成。最終完成圖要求測序所用的克隆能忠實地代表常染色體的基因組結構,序列錯誤率低于萬分之一。95%常染色質區域被測序,每個Gap小于150kb。完成圖将于2003年完成,比預計提前2年。

完成人類基因組序列完成圖:

(1)從當前物理圖譜生成的克隆産生完成的序列,覆蓋基因組的常染色質區域大于96%。大約1Gb的完成序列已經實現。剩下的也已經形成草圖,所有的克隆期望達到8~10倍的覆蓋率,大約2001年中期(99.99%的正确率),使用已經建立的和日益自動化的協議。

(2)檢測另外的庫來關閉gaps。使用FISH技術或其他方法來分析沒有閉合的Gaps大小。22,21條染色體用這種方式。2003年經完成。

(3)開發新的技術來關閉難度較大的gaps,大約幾百個。

基因組序列工作框架圖(Workingdraft):通過對染色體位置明确的BAC連續克隆系4-5倍覆蓋率的測序(在BAC克隆水平的覆蓋率不應低于3倍),獲得基因組90%以上的序列,其錯誤率應低于1%。工作框架圖可用于基因組結構的認識、基因的識别和解析、疾病基因的定位克隆,SNP的發現等。

草圖的作用:

1、草圖,許多疾病相關的基因被識别。

2、SNP(人與人之間的區别),草圖提供了一個理解遺傳基礎和人類特征進化的框架。

3、草圖後,研究人員有了新的工具來研究調節區和基因網絡。

4、比較其它基因組可以揭示共同的調控元件,和其他物種共享的基因的環境也許提供在個體水平之上的關于功能和調節的信息。

5、草圖同樣是研究基因組三維壓縮到細胞核中的一個起點。這樣的壓縮可能影響到基因調控。

6、在應用上,草圖信息可以開發新的技術,如DNA芯片、蛋白質芯片,作為傳統方法的補充,目前,這樣的芯片可以包含蛋白質家族中所有的成員,從而在特定的疾病組織中可以找到那些是活躍的。

2001年2月12日,美國Celera公司與人類基因組計劃分别在《科學》和《自然》雜志上公布了人類基因組精細圖譜及其初步分析結果。其中,政府資助的人類基因組計劃采取基因圖策略,而Celera公司采取了“鳥槍策略”。至此,兩個不同的組織使用不同的方法都實現了他們共同的目标:完成對整個人類基因組的測序的工作;并且,兩者的結果驚人的相似。

整個人類基因組測序工作的基本完成,為人類生命科學開辟了一個新紀元,它對生命本質、人類進化、生物遺傳、個體差異、發病機制、疾病防治、新藥開發、健康長壽等領域,以及對整個生物學都具有深遠的影響和重大意義,标志着人類生命科學一個新時代的的來臨。

展望

1、生命科學工業的形成

由于基因組研究與制藥、生物技術、農業、食品、化學、化妝品、環境、能源和計算機等工業部門密切相關,更重要的是基因組的研究可以轉化為巨大的生産力,國際上一批大型制藥公司和化學工業公司大規模紛紛投巨資進軍基因組研究領域,形成了一個新的産業部門,即生命科學工業。

世界上一些大的制藥集團紛紛投資建立基因組研究所。Ciba-Geigy和Ssandoz合資組建了Novartis公司,并斥資2.5億美元建立研究所,開展基因組研究工作。SmithKline公司花1.25億美元加快測序的進度,将藥物開發項目的25%建立在基因組學之上。Glaxo-Wellcome在基因組研究領域投入4,700萬美元,将研究人員增加了一倍。

大型化學工業公司向生命科學工業轉軌。孟山都公司早在1985年就開始轉向生命科學工業。至1997年,該公司向生物技術和基因組研究的投入已高達66億美元。1998年4月,杜邦公司宣布改組成三個實業單位,由生命科學領頭。1998年5月,該公司又宣布放棄能源公司Conaco,将其改造成一家生命科學公司。Dow化學公司用9億美元購入EliLilly公司40%的股票,從事谷物和食品研究,後又成立了生命科學公司。Hoechst公司則賣了它的基本化學品部門,轉項投資生物技術和制藥。

傳統的農業和食品部門也出現了向生物技術和制藥合并的趨勢。GenzymeTransgenics公司培養出的基因工程羊能以較高的産量生産抗凝血酶III,一群羊的酶産量相當于投資1.15億美元工廠的産量。據估計,轉基因動物生産的藥物成本是大規模細胞培養法的十分之一。一些公司還在研究生産能抗骨質疏松的谷物,以及大規模生産和加工基因工程食品。

能源、采礦和環境工業也已在分子水平上向基因組研究彙合。例如,用産甲烷菌Methanobacterium作為一種新能源。用抗輻射的細菌Deinococcusradiodurans清除放射性物質的污染,并在轉入tod基因後,在高輻射環境下清除多種有害化學物質的污染。

2、功能基因組學

人類基因組計劃當前的整體發展趨勢是什麼?一方面,在順利實現遺傳圖和物理圖的制作後,結構基因組學正在向完成染色體的完整核酸序列圖的目标奮進。另一方面,功能基因組學已提上議事日程。人類基因組計劃已開始進入由結構基因組學向功能基因組學過渡、轉化的過程。在功能基因組學研究中,可能的核心問題有:基因組的表達及其調控、基因組的多樣性、模式生物體基因組研究等。

(1)基因組的表達及其調控

1)基因轉錄表達譜及其調控的研究

一個細胞的基因轉錄表達水平能夠精确而特異地反映其類型、發育階段以及反應狀态,是功能基因組學的主要内容之一。為了能夠全面地評價全部基因的表達,需要建立全新的工具系統,其定量敏感性水平應達到小于1個拷貝/細胞,定性敏感性應能夠區分剪接方式,還須達到檢測單細胞的能力。近年來發展的DNA微陣列技術,如DNA芯片,已有可能達到這一目标。

2)蛋白質組學研究

蛋白質組學研究是要從整體水平上研究蛋白質的水平和修飾狀态。目前正在發展标準化和自動化的二維蛋白質凝膠電泳的工作體系。首先用一個自動系統來提取人類細胞的蛋白質,繼而用色譜儀進行部分分離,将每區段中的蛋白質裂解,再用質譜儀分析,并在蛋白質數據庫中通過特征分析來認識産生的多肽。蛋白質組研究的另一個重要内容是建立蛋白質相互關系的目錄。

3)生物信息學的應用

目前,生物信息學已大量應用于基因的發現和預測。然而,利用生物信息學去發現基因的蛋白質産物的功能更為重要。模式生物體中越來越多的蛋白質構建編碼單位被識别,無疑為基因和蛋白質同源關系的搜尋和家族的分類提供了極其寶貴的信息。

同時,生物信息學的算法、程序也在不斷改善,使得不僅能夠從一級結構,也能從估計結構上發現同源關系。但是,利用計算機模拟所獲得的理論數據,還需要經過實驗經過的驗證和修正。

(2)基因組多樣性的研究

人類是一個具有多态性的群體。不同群體和個體在生物學性狀以及在對疾病的易感性與抗性上的差别,反映了進化過程中基因組與内、外部環境相互作用的結果。開展人類基因組多樣性的系統研究,無論對于了解人類的起源和進化,還是對于生物醫學均會産生重大的影響。

認識不同生物中基因序列的保守性,将能夠使我們有效地認識約束基因及其産物的功能性的因素。對序列差異性的研究則有助于認識産生大自然多樣性的基礎。在不同生物體之間建立序列變異與基因表達的時空差異之間的相關性,将有助于揭示基因的網絡結構。

(3)開展對模式生物體的研究

随着線蟲和果蠅基因組測序的完成,将來也可能開展對這兩種生物的類似性研究。一些突變株系和技術體系建立後,不僅能夠成為研究單基因功能的有效手段,而且為研究基因冗餘性和基因間的相互作用等深層次問題奠定了基礎。小鼠作為哺乳動物中的代表性模式生物,在功能基因組學的研究中展有特殊的地位。

同源重組技術可以破壞小鼠的任何一個基因,這種方法的缺點是費用高。利用點突變、缺失突變和插入突變造成的随機突變是另一中可能的途徑。對于人體細胞而言,建立反義寡核苷酸和核酶瞬間阻斷基因表達的體系可能更加合适。蛋白質水平的剔除術也許是說明基因功能最有力的手段。利用組合化學方法有望生産出化學剔除試劑,用于激活或失活各種蛋白質。

相關詞條

相關搜索

其它詞條