蛋白質組學

蛋白質組學

基因組所表達的全套蛋白質
蛋白質組學(proteome)一詞,源于蛋白質(protein)與基因組(genome)兩個詞的雜合,意指“一種基因組所表達的全套蛋白質”,即包括一種細胞乃至一種生物所表達的全部蛋白質。蛋白質組本質上指的是在大規模水平上研究蛋白質的特征,包括蛋白質的表達水平,翻譯後的修飾,蛋白與蛋白相互作用等,由此獲得蛋白質水平上的關于疾病發生,細胞代謝等過程的整體而全面的認識,這個概念最早是在1995年提出的。蛋白質組的研究不僅能為生命活動規律提供物質基礎,也能為衆多種疾病機理的闡明及攻克提供理論根據和解決途徑。[1]
    中文名:蛋白質組學 外文名:proteome 别名:

發展回顧

核酸與蛋白質是構成生物體的主要大分子。随着人類基因組等大量生物體全基因組序列的破譯和功能基因組研究的展開,生命科學家越來越關注如何用基因組研究的模式開展蛋白質組學的研究。正因如此,《Nature》、《Science》在2001年2月公布人類基因組草圖的同時,分别發表了“And now for the proteome”和“Proteomics in genomeland”的述評與展望,将蛋白質組學的地位提到前所未有的高度,認為蛋白質組學将成為新世紀最大戰略資源---人類基因争奪戰的戰略制高點之一。 蛋白質組學雖然問世時間很短,但已經在研究細胞的增殖、分化、異常轉化、腫瘤形成等方面進行了有力的探索,涉及到白血病、乳腺癌、結腸癌、膀胱癌、前列腺癌、肺癌、腎癌和神經母細胞瘤等,鑒定了一批腫瘤相關蛋白,為腫瘤的早期診斷、藥靶的發現、療效判斷和預後提供了重要依據。

鑒于蛋白質組學發展前景的重要性和技術的先進性,西方各主要發達國家紛紛投巨資全面啟動蛋白質組的研究。如美國國立衛生研究院,美國能源部、歐共體等均啟動了不同生物蛋白質組的研究并取得明顯進展,一批高質量的研究論文相繼在國際著名學術刊物發表。由于蛋白質組學研究比基因組學研究更接近實用,有着巨大的市場前景,企業與制藥公司也紛紛斥巨資開展蛋白質組研究。獨立完成人類基因組測序的Celera公司已宣布投資上億美元于此領域;日内瓦蛋白質組公司與布魯克質譜儀制造公司聯合成立了國際上最大的蛋白質組研究中心。為了促進國家與地區性的蛋白質組的發展、合作與交流,成立了國際人類蛋白質組組織 (HUPO),在法國召開了首屆國際蛋白質組大會,并迅即在北美、歐洲、韓國、日本成立了相應的分支機構。蛋白質組學已成為西方各主要發達國家、各跨國制藥集團競相投入的“熱點”。

研究意義

2001年的Science雜志已把蛋白質組學列為六大研究熱點之一,其“熱度”僅次于幹細胞研究,名列第二。蛋白質組學的受關注程度如今已令人刮目相看。

随着人類基因組計劃的實施和推進,生命科學研究已進入了後基因組時代。在這個時代,生命科學的主要研究對象是功能基因組學,包括結構基因組研究和蛋白質組研究等。盡管現在已有多個物種的基因組被測序,但在這些基因組中通常有一半以上基因的功能是未知的。目前功能基因組中所采用的策略,如基因芯片、基因表達序列分析(Serial  analysis  of  gene  expression,  SAGE)等,都是從細胞中mRNA的角度來考慮的,其前提是細胞中mRNA的水平反映了蛋白質表達的水平。但事實并不完全如此,從DNA  mRNA  蛋白質,存在三個層次的調控,即轉錄水平調控(Transcriptional  control  ),翻譯水平調控(Translational control),翻譯後水平調控(Post-translational  control  )。從mRNA角度考慮,實際上僅包括了轉錄水平調控,并不能全面代表蛋白質表達水平。實驗也證明,組織中mRNA豐度與蛋白質豐度的相關性并不好,尤其對于低豐度蛋白質來說,相關性更差。更重要的是,蛋白質複雜的翻譯後修飾、蛋白質的亞細胞定位或遷移、蛋白質-蛋白質相互作用等則幾乎無法從mRNA水平來判斷。毋庸置疑,蛋白質是生理功能的執行者,是生命現象的直接體現者,對蛋白質結構和功能的研究将直接闡明生命在生理或病理條件下的變化機制。蛋白質本身的存在形式和活動規律,如翻譯後修飾、蛋白質間相互作用以及蛋白質構象等問題,仍依賴于直接對蛋白質的研究來解決。雖然蛋白質的可變性和多樣性等特殊性質導緻了蛋白質研究技術遠遠比核酸技術要複雜和困難得多,但正是這些特性參與和影響着整個生命過程。

傳統的對單個蛋白質進行研究的方式已無法滿足後基因組時代的要求。這是因為:(1)  生命現象的發生往往是多因素影響的,必然涉及到多個蛋白質。(2)  多個蛋白質的參與是交織成網絡的,或平行發生,或呈級聯因果。(3)  在執行生理功能時蛋白質的表現是多樣的、動态的,并不像基因組那樣基本固定不變。因此要對生命的複雜活動有全面和深入的認識,必然要在整體、動态、網絡的水平上對蛋白質進行研究。因此在上世紀90年代中期,國際上産生了一門新興學科-蛋白質組學(Proteomics),它是以細胞内全部蛋白質的存在及其活動方式為研究對象。可以說蛋白質組研究的開展不僅是生命科學研究進入後基因組時代的裡程碑,也是後基因組時代生命科學研究的核心内容之一。

雖然第一次提出蛋白質組概念是在1994年,但相關研究可以追溯到上世紀90年代中期甚至更早,尤其是80年代初,在基因組計劃提出之前,就有人提出過類似的蛋白質組計劃,當時稱為Human  Protein  Index計劃,旨在分析細胞内的所有蛋白質。但由于種種原因,這一計劃被擱淺。90年代初期,各種技術已比較成熟,在這樣的背景下,經過各國科學家的讨論,才提出蛋白質組這一概念。

國際上蛋白質組研究進展十分迅速,不論基礎理論還是技術方法,都在不斷進步和完善。相當多種細胞的蛋白質組數據庫已經建立,相應的國際互聯網站也層出不窮。1996年,澳大利亞建立了世界上第一個蛋白質組研究中心:Australia  Proteome  Analysis  Facility  (  APAF  )。丹麥、加拿大、日本也先後成立了蛋白質組研究中心。在美國,各大藥廠和公司在巨大财力的支持下,也紛紛加入蛋白質組的研究陣容。去年在瑞士成立的GeneProt公司,是由以蛋白質組數據庫“SwissProt”  著稱的蛋白質組研究人員成立的,以應用蛋白質組技術開發新藥物靶标為目的,建立了配備有上百台質譜儀的高通量技術平台。而當年提出Human  Protein  Index  的美國科學家Normsn  G.  Anderson也成立了類似的蛋白質組學公司,繼續其多年未實現的夢想。2001年4月,在美國成立了國際人類蛋白質組研究組織(Human  Proteome  Organization,  HUPO),随後歐洲、亞太地區都成立了區域性蛋白質組研究組織,試圖通過合作的方式,融合各方面的力量,完成人類蛋白質組計劃(Human  Proteome  Project)。

研究策略

蛋白質組學一經出現,就有兩種研究策略。一種可稱為“竭澤法”,即采用高通量的蛋白質組研究技術分析生物體内盡可能多乃至接近所有的蛋白質,這種觀點從大規模、系統性的角度來看待蛋白質組學,也更符合蛋白質組學的本質。但是,由于蛋白質表達随空間和時間不斷變化,要分析生物體内所有的蛋白質是一個難以實現的目标。另一種策略可稱為“功能法”,即研究不同時期細胞蛋白質組成的變化,如蛋白質在不同環境下的差異表達,以發現有差異的蛋白質種類為主要目标。這種觀點更傾向于把蛋白質組學作為研究生命現象的手段和方法。

研究内容

早期蛋白質組學的研究範圍主要是指蛋白質的表達模式(Expression  profile),随着學科的發展,蛋白質組學的研究範圍也在不斷完善和擴充。蛋白質翻譯後修飾研究已成為蛋白質組研究中的重要部分和巨大挑戰。蛋白質-蛋白質相互作用的研究也已被納入蛋白質組學的研究範疇。而蛋白質高級結構的解析即傳統的結構生物學,雖也有人試圖将其納入蛋白質組學研究範圍,但目前仍獨樹一幟。

1.蛋白質鑒定:可以利用一維電泳和二維電泳并結合Western等技術,利用蛋白質芯片和抗體芯片及免疫共沉澱等技術對蛋白質進行鑒定研究。

2.翻譯後修飾:很多mRNA表達産生的蛋白質要經曆翻譯後修飾如磷酸化,糖基化,酶原激活等。翻譯後修飾是蛋白質調節功能的重要方式,因此對蛋白質翻譯後修飾的研究對闡明蛋白質的功能具有重要作用。

3.蛋白質功能确定:如分析酶活性和确定酶底物,細胞因子的生物分析/配基-受體結合分析。可以利用基因敲除和反義技術分析基因表達産物-蛋白質的功能。另外對蛋白質表達出來後在細胞内的定位研究也在一定程度上有助于蛋白質功能的了解。Clontech的熒光蛋白表達系統就是研究蛋白質在細胞内定位的一個很好的工具。

4.對人類而言,蛋白質組學的研究最終要服務于人類的健康,主要指促進分子醫學的發展。如尋找藥物的靶分子。很多藥物本身就是蛋白質,而很多藥物的靶分子也是蛋白質。藥物也可以幹預蛋白質-蛋白質相互作用。

在基礎醫學和疾病機理研究中,了解人不同發育、生長期和不同生理、病理條件下及不同細胞類型的基因表達的特點具有特别重要的意義。這些研究可能找到直接與特定生理或病理狀态相關的分子,進一步為設計作用于特定靶分子的藥物奠定基礎。

不同發育、生長期和不同生理、病理條件下不同的細胞類型的基因表達是不一緻的,因此對蛋白質表達的研究應該精确到細胞甚至亞細胞水平。可以利用免疫組織化學技術達到這個目的,但該技術的緻命缺點是通量低。LCM技術可以精确地從組織切片中取出研究者感興趣的細胞類型,因此LCM技術實際上是一種原位技術。取出的細胞用于蛋白質樣品的制備,結合抗體芯片或二維電泳-質譜的技術路線,可以對蛋白質的表達進行原位的高通量的研究。很多研究采用勻漿組織制備蛋白質樣品的技術路線,其研究結論值得懷疑,因為組織勻漿後不同細胞類型的蛋白質混雜在一起,最後得到的研究數據根本無法解釋蛋白質在每類細胞中的表達情況。雖然培養細胞可以得到單一類型細胞,但體外培養的細胞很難模拟體内細胞的環境,因此這樣研究得出的結論也很難用于解釋在體實際情況。因此在研究中首先應該将不同細胞類型分離,分離出來的不同類型細胞可以用于基因表達研究,包括mRNA和蛋白質的表達。

LCM技術獲得的細胞可以用于蛋白質樣品的制備。可以根據需要制備總蛋白,或膜蛋白,或核蛋白等,也可以富集糖蛋白,或通過去除白蛋白來減少蛋白質類型的複雜程度。相關試劑盒均有廠商提供。

蛋白質樣品中的不同類型的蛋白質可以通過二維電泳進行分離。二維電泳可以将不同種類的蛋白質按照等電點和分子量差異進行高分辨率的分離。成功的二維電泳可以将2000到3000種蛋白質進行分離。電泳後對膠進行高靈敏度的染色如銀染和熒光染色。如果是比較兩種樣品之間蛋白質表達的異同,可以在同樣條件下分别制備二者的蛋白質樣品,然後在同樣條件下進行二維電泳,染色後比較兩塊膠。也可以将二者的蛋白質樣品分别用不同的熒光染料标記,然後兩種蛋白質樣品在一塊膠上進行二維電泳的分離,最後通過熒光掃描技術分析結果。

膠染色後可以利用凝膠圖像分析系統成像,然後通過分析軟件對蛋白質點進行定量分析,并且對感興趣的蛋白質點進行定位。通過專門的蛋白質點切割系統,可以将蛋白質點所在的膠區域進行精确切割。接着對膠中蛋白質進行酶切消化,酶切後的消化物經脫鹽/濃縮處理後就可以通過點樣系統将蛋白質點樣到特定的材料的表面(MALDI-TOF)。最後這些蛋白質就可以在質譜系統中進行分析,從而得到蛋白質的定性數據;這些數據可以用于構建數據庫或和已有的數據庫進行比較分析。

LCM-二維電泳-質譜的技術路線是典型的一條蛋白質組學研究的技術路線,除此以外,LCM-抗體芯片也是一條重要的蛋白質組學研究的技術路線。即通過LCM技術獲得感興趣的細胞類型,制備細胞蛋白質樣品,蛋白質經熒光染料标記後和抗體芯片雜交,從而可以比較兩種樣品蛋白質表達的異同。Clontech最近開發了一張抗體芯片,可以對378種膜蛋白和胞漿蛋白進行分析。該芯片同時配合了抗體芯片的全部操作過程的重要試劑,包括蛋白質制備試劑,蛋白質的熒光染料标記試劑,标記體系的純化試劑,雜交試劑等。

對于蛋白質相互作用的研究,酵母雙雜交和噬菌體展示技術無疑是很好的研究方法。Clontech開發的酵母雙雜交系統和NEB公司開發的噬菌體展示技術可供研究者選用。

關于蛋白質組的研究,也可以将蛋白質組的部分或全部種類的蛋白質制作成蛋白質芯片,這樣的蛋白質芯片可以用于蛋白質相互作用研究,蛋白表達研究和小分子蛋白結合研究。 Science,Vol. 293,Issue 5537,2101-2105,September 14,2001發表了一篇關于酵母蛋白質組芯片的論文。該文主要研究内容為:将酵母的5800個ORF表達成蛋白質并進行純化點樣制作芯片,然後用該芯片篩選鈣調素和磷脂分子的相互作用分子。

傳統的蛋白質研究注重研究單一蛋白質,而蛋白質組學注重研究參與特定生理或病理狀态的所有的蛋白質種類及其與周圍環境(分子)的關系。因此蛋白質組學的研究通常是高通量的。适應這個要求,蛋白質組學相關研究工具通常都是高度自動化的系統,通量高而速度快,配合相應分析軟件和數據庫,研究者可以在最短的時間内處理最多的數據。

研究技術

蛋白質組學的發展既是技術所推動的也是受技術限制的。蛋白質組學研究成功與否,很大程度上取決于其技術方法水平的高低。蛋白質研究技術遠比基因技術複雜和困難。不僅氨基酸殘基種類遠多于核苷酸殘基(20/4), 而且蛋白質有着複雜的翻譯後修飾,如磷酸化和糖基化等,給分離和分析蛋白質帶來很多困難。此外,通過表達載體進行蛋白質的體外擴增和純化也并非易事,從而難以制備大量的蛋白質。蛋白質組學的興起對技術有了新的需求和挑戰。蛋白質組的研究實質上是在細胞水平上對蛋白質進行大規模的平行分離和分析,往往要同時處理成千上萬種蛋白質。因此,發展高通量、高靈敏度、高準确性的研究技術平台是現在乃至相當一段時間内蛋白質組學研究中的主要任務。當前在國際蛋白質組研究技術平台的技術基礎和發展趨勢有以下幾個方面:

1. 蛋白質組研究中的樣品制備

通常可采用細胞或組織中的全蛋白質組分進行蛋白質組分析。也可以進行樣品預分級,即采用各種方法将細胞或組織中的全體蛋白質分成幾部分,分别進行蛋白質組研究。樣品預分級的主要方法包括根據蛋白質溶解性和蛋白質在細胞中不同的細胞器定位進行分級,如專門分離出細胞核、線粒體或高爾基體等細胞器的蛋白質成分。樣品預分級不僅可以提高低豐度蛋白質的上樣量和檢測,還可以針對某一細胞器的蛋白質組進行研究。

對臨床組織樣本進行研究,尋找疾病标記,是蛋白質組研究的重要方向之一。但臨床樣本都是各種細胞或組織混雜,而且狀态不一。如腫瘤組織中,發生癌變的往往是上皮類細胞,而這類細胞在腫瘤中總是與血管、基質細胞等混雜。所以,常規采用的癌和癌旁組織或腫瘤與正常組織進行差異比較,實際上是多種細胞甚至組織蛋白質組混合物的比較。而蛋白質組研究需要的通常是單一的細胞類型。最近在組織水平上的蛋白質組樣品制備方面也有新的進展,如采用激光捕獲微解剖(Laser Capture Microdissection, LCM) 方法分離癌變上皮類細胞。

2. 蛋白質組研究中的樣品分離和分析

利用蛋白質的等電點和分子量通過雙向凝膠電泳的方法将各種蛋白質區分開來是一種很有效的手段。它在蛋白質組分離技術中起到了關鍵作用。如何提高雙向凝膠電泳的分離容量、靈敏度和分辨率以及對蛋白質差異表達的準确檢測是目前雙向凝膠電泳技術發展的關鍵問題。主要趨勢有第一維電泳采用窄pH梯度膠分離以及開發與雙向凝膠電泳相結合的高靈敏度蛋白質染色技術,如新型的熒光染色技術。

質譜技術是目前蛋白質組研究中發展最快,也最具活力和潛力的技術。它通過測定蛋白質的質量來判别蛋白質的種類。當前蛋白質組研究的核心技術就是雙向凝膠電泳-質譜技術,即通過雙向凝膠電泳将蛋白質分離,然後利用質譜對蛋白質逐一進行鑒定。對于蛋白質鑒定而言,高通量、高靈敏度和高精度是三個關鍵指标。一般的質譜技術難以将三者合一,而最近發展的質譜技術可以同時達到以上三個要求,從而實現對蛋白質準确和大規模的鑒定。

3. 蛋白質組研究的新技術

做過雙向凝膠電泳的人一定會抱怨它的繁瑣、不穩定和低靈敏度等缺點。發展可替代或補充雙向凝膠電泳的新方法已成為蛋白質組研究技術最主要的目标。目前,二維色譜 (2D-LC)、二維毛細管電泳 (2D-CE)、液相色譜-毛細管電泳 (LC-CE) 等新型分離技術都有補充和取代雙向凝膠電泳之勢。另一種策略則是以質譜技術為核心,開發質譜鳥槍法(Shot-gun)、毛細管電泳-質譜聯用 (CE-MS)等新策略直接鑒定全蛋白質組混合酶解産物。随着對大規模蛋白質相互作用研究的重視,發展高通量和高精度的蛋白質相互作用檢測技術也被科學家所關注。此外,蛋白質芯片的發展也十分迅速,并已經在臨床診斷中得到應用。

4. 蛋白質組生物信息學

蛋白質組數據庫是蛋白質組研究水平的标志和基礎。瑞士的SWISS-PROT擁有目前世界上最大,種類最多的蛋白質組數據庫。丹麥、英國、美國等也都建立了各具特色的蛋白質組數據庫。生物信息學的發展已給蛋白質組研究提供了更方便有效的計算機分析軟件;特别值得注意的是蛋白質質譜鑒定軟件和算法發展迅速,如SWISS-PROT、Rockefeller大學、UCSF等都有自主的搜索軟件和數據管理系統。最近發展的質譜數據直接搜尋基因組數據庫使得質譜數據可直接進行基因注釋、判斷複雜的拼接方式。随着基因組學的迅速推進,會給蛋白質組研究提供更多更全的數據庫。另外,對肽序列标記的從頭測序軟件也十分引人注目。

發展趨勢

在基礎研究方面,近兩年來蛋白質組研究技術已被應用到各種生命科學領域,如細胞生物學、神經生物學等。在研究對象上,覆蓋了原核微生物、真核微生物、植物和動物等範圍,涉及到各種重要的生物學現象,如信号轉導、細胞分化、蛋白質折疊等等。在未來的發展中,蛋白質組學的研究領域将更加廣泛。

在應用研究方面,蛋白質組學将成為尋找疾病分子标記和藥物靶标最有效的方法之一。在對癌症、早老性癡呆等人類重大疾病的臨床診斷和治療方面蛋白質組技術也有十分誘人的前景,目前國際上許多大型藥物公司正投入大量的人力和物力進行蛋白質組學方面的應用性研究。

在技術發展方面,蛋白質組學的研究方法将出現多種技術并存,各有優勢和局限的特點,而難以象基因組研究一樣形成比較一緻的方法。除了發展新方法外,更強調各種方法間的整合和互補,以适應不同蛋白質的不同特征。另外,蛋白質組學與其它學科的交叉也将日益顯著和重要,這種交叉是新技術新方法的活水之源,特别是,蛋白質組學與其它大規模科學如基因組學,生物信息學等領域的交叉,所呈現出的系統生物學(System Biology)研究模式,将成為未來生命科學最令人激動的新前沿。

相關詞條

相關搜索

其它詞條