
2025年6月12日,美國麻省理工和博德研究所Pardis C.Sabeti團隊在Science上發表了一篇題為“Pan-viral ORFs discovery using massively parallel ribosome profiling"的論文,結合寡核苷酸合成文庫和Ribo-seq核糖體印跡分析,開展泛病毒ORF挖掘,本研究旨在建立一種高效、無偏的泛病毒ORFs發現方法。
盡管病毒基因組測序技術已有很大進展, 但病毒基因組的功能注釋長期滯后于測序進展。除了已注釋的經典開放閱讀框(ORFs)之外,尤其是不符合傳統ORF的定義的非經典ORFs(如非ATG起始、長度<100aa)在感染、免疫調控中的作用尚未系統探索。
傳統的病毒基因組注釋方法主要依賴于生物信息學預測,存在假陽性率高、無法區分功能性和非功能性ORFs等局限性。更重要的是,許多高致病性病毒(如埃博拉病毒、尼帕病毒等)難以在實驗室條件下培養,需要在生物安全三級(BSL-3)或四級(BSL-4)設施中操作,極大限制了對這些病毒基因組的深入研究。
核糖體印跡分析也稱為Ribo-seq,此項技術的發展極大提升了檢測基因組翻譯區域的能力。該技術利用對核糖體結合的RNA片段進行深度測序,確定核糖體占位情況,從而以單核苷酸分辨率揭示翻譯區域。它已經在哺乳動物細胞、酵母、細菌和病毒中發現了許多非經典ORFs,包括5′非翻譯區(5′UTRs)中的上游ORFs(uORFs)和上游重疊ORFs(uoORFs)、非編碼RNA中的短ORFs以及已注釋編碼序列中的重疊內部ORFs(iORFs)。
然而,傳統核糖體圖譜技術在病毒研究中面臨三大瓶頸:病毒培養困難、安全要求高、遺傳多樣性強。每種病毒需要特定的培養系統,部分病毒無法在實驗室培養;高致病性病毒需要高等級生物安全設施;單一病毒株分析無法覆蓋變異譜系,導致多數病毒的翻譯圖譜仍是"黑箱"。
為解決這些挑戰,博德研究所的Shira Weingarten-Gabbay和Pardis C. Sabeti團隊開發了大規模平行核糖體圖譜(MPRP)技術。該技術創新性地將高通量寡核苷酸合成與核糖體圖譜技術相結合,在一次實驗中可同時分析數百種病毒的翻譯事件,無需病毒培養或高生物安全等級設施,極大降低了實驗門檻。這一技術突破為病毒基因組研究提供了全新的方法學工具,有望改變我們對病毒蛋白質組的認知。
MPRP技術的核心原理是利用合成寡核苷酸文庫替代活病毒,通過Ribo檢測病毒基因組片段的翻譯活性。
1.文庫構建:研究團隊設計了包含20,170個合成寡核苷酸的文庫,覆蓋679種人類相關病毒基因組的3,976個基因的5'非翻譯區(5'UTR)和編碼區起始區域。每個寡核苷酸包含60個核苷酸的5'UTR和140個核苷酸的編碼區,確保能夠捕獲翻譯起始位點和上游調控序列。
2.并行檢測:將文庫轉染至HEK293T/A549細胞,在病毒感染相關應激條件(如poly(I:C)、內質網應激)下進行核糖體分析,使用抑制劑區分起始/延伸核糖體。
3.數據處理:采用PRICE(Probabilistic Ribo-seq Inference of Coding Exons)算法從核糖體足跡數據中推斷ORFs,并通過免疫肽組學驗證HLA-I呈遞。
4.跨平臺驗證:對比MPRP數據與HCMV、VSV等天然感染細胞的Ribo-seq結果,確保可靠性。
3.1 病毒ORFs的大規模發現
MPRP技術在679種病毒中實現了數量級的發現突破,共鑒定出5,381個病毒ORFs,其中4,208個為非經典ORFs,覆蓋皰疹病毒、冠狀病毒、絲狀病毒等21個病毒家族。這些新發現的ORFs極大擴展了我們對病毒蛋白質組的認知邊界,揭示了病毒基因組中存在大量此前未被注釋的翻譯區域。
ORF類型的多樣性令人矚目。研究發現了多種類型的非經典ORFs:上游ORFs(uORFs)位于5'UTR區域,如HCMV UL45 5'UTR的uORF可導致核糖體停滯,抑制主CDS翻譯;內部重疊ORFs(iORFs)如IAV M1基因+1框架的iORF,在H5N1等6種流感毒株中保守存在;非ATG起始ORFs如HCMV中以GUG、UUG起始的ORFs,編碼20個氨基酸以下的微蛋白。這些不同類型的ORFs可能在病毒生命周期中發揮多樣化的功能。

技術性能評估顯示,在3,976個注釋的病毒CDS中,PRICE算法成功捕獲了1,136個(28%)在注釋起始密碼子處起始的ORFs,錯誤發現率為0.05。雖然捕獲率看似不高,但考慮到實驗系統的復雜性和病毒基因組的多樣性,這一結果仍具有重要意義。更重要的是,PRICE檢測到的CDS在兩個生物學重復中的核糖體占用率顯示出高相關性(R=0.93),證明了檢測結果的可靠性。

3.2 非經典ORFs的免疫原性驗證
研究的一個重要發現是非經典ORFs具有顯著的免疫原性。通過分析感染細胞的免疫肽組數據集,研究團隊發現MPRP鑒定的非經典ORFs能夠產生人類白細胞抗原I類(HLA-I)相關肽段。在HCMV中發現了4個非經典ORF來源的5種肽段,如UL4 5'UTR uORF的VLSAKKLS、UL135 5'UTR uoORF的YPAPRPQAI;在VACV中發現了2種肽段,如L3L iORF的HRNKIINAEK,這些肽段均被HLAthena預測為高親和力HLA-I結合者(MSi rank ≤2)。
免疫貢獻的量化分析揭示了非經典ORFs的重要性。將MPRP鑒定的ORF納入HCMV注釋后,HLA-I呈遞肽段數量增加7.4%,且非經典ORF的單位長度產肽量顯著高于經典ORF(P<10?3)。這一發現表明,非經典ORFs不僅能夠編碼功能性肽段,還具有更高的免疫原性密度,可能在病毒免疫逃逸和宿主免疫應答中發揮重要作用。
3.3 uORF對病毒翻譯的調控機制
研究揭示了上游ORFs(uORFs)對病毒蛋白翻譯的精細調控機制。在正常條件下,2,418個病毒基因中37%的核糖體聚集在5'UTR(uORF區域),抑制主CDS翻譯;Na?AsO?誘導eIF2α磷酸化后,核糖體向CDS轉移,5'UTR聚集比例降至19%,證實uORF通過eIF2α通路調控翻譯起始。
功能保守性證據表明uORF的調控作用在不同實驗條件下具有一致性。HCMV UL4 5'UTR的uORF在MPRP和天然感染細胞中均導致核糖體停滯,其編碼的核糖體停滯肽(RAP)可抑制主蛋白翻譯。三核苷酸周期性分析顯示,在5'UTR區域檢測到的uORFs具有活躍的核糖體翻譯特征,且在LTM抑制劑存在下,這些uORFs的起始密碼子處顯示強烈的起始核糖體信號。
研究還發現,在應激條件下(如eIF2α磷酸化),核糖體更容易繞過5'UTR中的uORFs,在主CDS處起始翻譯,這與抑制性uORF的預期行為一致。這一發現為理解病毒如何在不同細胞環境中調控蛋白合成提供了重要見解,也為開發針對病毒翻譯調控的治療策略提供了潛在靶點。
MPRP技術為病毒基因組研究帶來了范式轉變,通過揭示病毒基因組中大量"隱藏"的ORFs, 不僅擴展了病毒蛋白質組的邊界,更為疫苗開發、藥物研發和疫情防控提供了重要機遇。 這一技術突破是科學技術的進步。