
在生命科學(xué)研究中,KEGG 通路圖是理解基因功能、代謝網(wǎng)絡(luò)和疾病機制的核心工具。但面對密密麻麻的節(jié)點和箭頭,很多人直呼 “像天書一樣難懂"。別擔(dān)心,這篇指南將用通俗的語言和實操案例,帶你一步步揭開 KEGG 通路圖的神秘面紗。
第一部分:KEGG概覽
KEGG(Kyoto Encyclopediaof Genesand Genomes,京都基因與基因組百科全書)是一個整合基因、代謝物、疾病等信息的數(shù)據(jù)庫((圖1是KEGG全景概覽,可以說包羅萬象,不愧是百科全書),而通路圖是它的 “靈魂"。簡單來說,它用圖形化的方式展示了生物體內(nèi)基因/蛋白、化合物之間的相互作用網(wǎng)絡(luò),比如代謝反應(yīng)、信號傳遞、疾病相關(guān)通路等。
舉個例子:當(dāng)你研究腫瘤細胞的能量代謝時,KEGG 通路圖會告訴你,葡萄糖如何通過糖酵解轉(zhuǎn)化為丙酮酸,丙酮酸又如何進入三羧酸循環(huán)產(chǎn)生能量 —— 這就是“糖酵解/糖異生通路(map00010)"的核心邏輯。通路圖就像一張“生物地圖",幫你快速定位關(guān)鍵分子和調(diào)控路徑。
更新: 知識庫和網(wǎng)站功能不定期更新,最近一次更新Release 115.1, August 1, 2025(圖2)

圖1

圖2
用途:
1. 包含16個子數(shù)據(jù)庫,有代謝通路、基因信息、化合物、酶、藥物等等(見圖3),均包含大量有用的信息,但最經(jīng)常使用的是KEGG PATHWAY查詢與分析。(見圖4)

圖3

圖4
知識點:KEGG數(shù)據(jù)庫中包括各種數(shù)據(jù)對象,這些內(nèi)容均配有標(biāo)識符(KEGG ID)標(biāo)識,標(biāo)識符由一個與數(shù)據(jù)庫相關(guān)的前綴加上五個數(shù)字構(gòu)成。(見圖5)

圖5
特別說明:1個子數(shù)據(jù)庫可能有1個或者多個前綴,如KEGG Pathway中,就有map、ko、ec、rn以及 <org>5種前綴,分別代表不同的子類(請看后面的“KEGG Pathway 的5小類")
2. KEGG Pathway數(shù)據(jù)庫將生物代謝通路劃分為7大類(1級分類)(見圖6),分別為:新陳代謝(Metabolism)、遺傳信息處理(Genetic Information Processing)、環(huán)境信息處理(Environmental Information Processing)、細胞過程(Cellular Processes)、生物體系統(tǒng)(Organismal Systems)、人類疾病(Human Diseases),藥物開發(fā)(Drug Development)[網(wǎng)頁版KEGG]。其中每大類又被系統(tǒng)分類為B、C、D 3個級別。其中B級分類目前包括有50種子功能:C級分類即為代謝通路圖:D級分類為每個代謝通路圖的具體注釋信息。

圖6
第二部分:實際操作
1. 登陸KEGG的,進入KEGG首頁。點擊“kegg pathway",將會進入kegg的通路列表,如圖7。從這個列表,我們可以知道,kegg的通路分類也是分層級的。層級一共可以分為三級。以下圖7為例,在Metabolism為1級,其下面包括了“Global and overview maps"、“Carbohydrate metabolism"、“Energy metabolism"等十幾個B級通路。而B級通路下又會包含若干C級通路。比如圖7中的“Global and overview maps"下面又包含了若干個下一級(C級)通路如“Glycolysis / Gluconeogenesis"。我們通常看生信分析KEGG的結(jié)果,看到的通路名稱其實就是C級的結(jié)果。點擊“Glycolysis / Gluconeogenesis"即進入“Glycolysis / Gluconeogenesis"代謝通路圖。

圖7
知識點:KEGG Pathway的5個小類:(具體操作如圖8)
ü map - manually drawn reference pathways linked to KO, EC, and reaction entries
? 手工繪制的通路圖
? 通路圖的框無填充色;代謝相關(guān)的通路圖中,方框鏈接對應(yīng)的基因、該基因編碼的酶以及這個酶參加的反應(yīng);非代謝相關(guān)通路中,方框鏈接對應(yīng)的基因
ü ko - reference pathway highlighting KOs (blue boxes)
? ko編號,KEGG中的基因標(biāo)識符,不同物種間相同的基因ko號一樣
? 通路圖的框填充淺紫色;通路圖中的框只鏈接對應(yīng)的基因
ü ec - reference metabolic pathway highlighting EC numbers (blue boxes)
? EC編號,例如3.1.3.10,是國際酶學(xué)委員會對葡萄糖-1-磷酸酶(glucose-1-phosphatase)設(shè)定的識別編號
? 通路圖的框填充藍色;通路中的框只鏈接相關(guān)的酶
ürn - reference metabolic pathway highlighting reactions (blue boxes)
? 通路圖的框填充藍色;通路中的框只鏈接該點參與的某個反應(yīng)、反應(yīng)物及反應(yīng)類型
ü org - organism-specific pathway maps for "org" linked to gene entries (green boxes)
? 物種特異的通路圖,前綴是物種名稱的縮寫,如人類是hsa,小鼠是mmu
? 通路圖的框填充綠色(沒有填充色的表示該物種中沒有該基因),通路中的框鏈接該物種對應(yīng)該基因的信息

圖8
2. 可與其他大型數(shù)據(jù)庫鏈接,可同時檢索相關(guān)的基因組信息數(shù)據(jù),如NCBI、ENSEMBL等。
第三部分:怎么看懂KEGG信號通路圖
1. 首先KEGG信號通路圖是由很多元素組成的,本質(zhì)是一副線框圖,即由點和線構(gòu)成的基因-代謝物關(guān)系圖,要讀懂這張圖,我們需要先了解這些元素代表什么。我們以“FoxO signaling pathway"這個通路圖為案例,介紹KEGG通路圖中各個元素的含義。

圖9
知識點:kegg中各元素的含義(不記得各元素代表什么沒關(guān)系,點擊通路圖上方的“Help"里面有詳細說明)

圖10
? 點代表通路圖中的節(jié)點,主要由基因、代謝物和上下游隔壁通路構(gòu)成。如上圖,對應(yīng)三種不同的形狀的符號(長方形、圓點和鈍角長方形)。
? 線代表通路中分子的互作關(guān)系,主要由幾類箭頭構(gòu)成,具體意義也請見上圖。
? 三類關(guān)系:就是點和線構(gòu)成的分子間的關(guān)系類型。關(guān)系類型可以分為蛋白-蛋白互作關(guān)系,基因表達關(guān)系和酶-酶關(guān)系。
? 鈍角方框暗示這個通路其實有著非常復(fù)雜的過程,是與該通路相關(guān)的另外一個通路,具體過程請點擊查閱另外一個通路。
kegg通路圖之間并非孤立的,而是常常會標(biāo)注該通路中的基因或代謝物來自或流向其他隔壁的通路。或者,該通路中的某個看起來非常簡單的步驟,其實有非常復(fù)雜的構(gòu)成,需要在另外一個通路中才能詳細展開。那么,這個相關(guān)的通路也會在圖中標(biāo)注出來。

圖11
點擊“FoxO signaling pathway"中的FOXO這個基因,就會跳轉(zhuǎn)到FOXO基因的介紹頁面。在基因介紹的部分,涉及的信息主要包括:(1)基因信息(Entry, Name, Definition)(2)Pathway,該基因參與了哪些通路(3)Disease,該基因涉及哪些疾病(4)Brite,該基因涉及的通路的分級關(guān)系(5)genes,該基因的各個物種中的同源基因。前三個字母是這個物種拉丁名的簡寫,例如,HSA代表人。(6)該基因的參考文獻的信息。kegg提供的參考文獻都是比較經(jīng)典的關(guān)于這個基因的文獻,值得翻一翻。
特別說明:
? kegg中的基因是以功能分類的,所以每個通路節(jié)點的基因代表的是一類功能基因(或者說是一個基因家族)。比如FOXO在人體內(nèi)就有FOXO6、FOXO1、FOXO3、FOXO4四個同源基因。所以,下次你看到kegg通路某個位置既有基因上調(diào)也有基因下調(diào),不要感到意外,因為這個位置不止有1個基因。
? 該基因在其他物種中的同源基因kegg也會提供列表。不過也主要集中在一些模式生物,其他非模式生物不會提供這些信息或者提供的不全。所以,非模式生物往往需要我們自己進行kegg注釋。
2. 其次生物體內(nèi)信號通路交叉調(diào)控,形成了復(fù)雜的網(wǎng)絡(luò),因此KEGG中的通路圖,大多也是幾個通路膠合在一起的,再看通路圖時,我們需要化繁為簡。

圖12
? 在通路圖中,可以目標(biāo)分子出發(fā),任一經(jīng)過該點的線,都可認(rèn)為是一條信號通路骨架,如上圖紅色箭頭所示從左到右,表示上下游關(guān)系
? 可以看到,FOXO上游還先后受Insulin和Pl3k-Akt兩個信號通路調(diào)控,下游可調(diào)控細胞周期、凋亡、自噬等多種過程
? Insulin信號通路,可點擊上方的 “Insulin signaling pathway“進入該通路的圖譜。細胞外的胰島素(INS)跟細胞膜上的胰島素受體(INSR)結(jié)合,激活底物(IRS)
? Pl3k-Akt信號通路。上游被激活的IRS促進Pl3k活性,Pl3k催化PIP2生成PIP3,從而激活磷脂酰肌醇依賴性激酶(PDK1/2),PDK1/2可以促進Akt磷酸化
? FOXO信號通路:細胞質(zhì)內(nèi)的FOXO會進入細胞核,調(diào)控DNA轉(zhuǎn)錄,影響P21、P27的表達,從而影響細胞周期;而其上游磷酸化的Akt則可通過促進FOXO磷酸化,從而抑制FOXO入核,抑制其功能
3. 最后,在通路圖中,我們只能獲得通路的上下游關(guān)系以及調(diào)控方式信息,更多細節(jié)比如,Akt如何通過磷酸化FOXO抑制其入核,具體磷酸化哪個位點,則需進一步檢索相關(guān)文獻了解。
KEGG PATHWAY數(shù)據(jù)庫是進行基因功能分析和代謝網(wǎng)絡(luò)研究的強有力工具,不管你是做轉(zhuǎn)錄組、蛋白組還是微生物組,相信通過今天的分享大家已經(jīng)能看懂KEGG通路圖了。在后續(xù)的文章中,我們將逐漸解析學(xué)習(xí)一些經(jīng)典的信號通路。你對些通路比較感興趣呢?歡迎留言,我們將陸續(xù)安排解讀。