
英文标题:Metabolites are not genes — avoiding the misuse of pathway analysis in metabolomics
中文标题:代谢物不是基因--应避免通路分析在代谢组学中的误用
发表期刊:Nature Metabolism
影响因子:18.9
近日,Nature Metabolism发布“Metabolites are not genes — avoiding the misuse of pathway analysis in metabolomics”评论性文章,作者在文中提到为基因表达数据开发的通路分析,已广泛应用于代谢组学(Metabolomics)研究,但因代谢产物与基因在特性和限制方面存在显著差异往往会产生误导性甚至不合逻辑的结果。
背景
在 21 世纪初,通路分析作为一种被开发用于分析高通量的基因表达数据的基础性技术,成为理解差异表达基因所调控的生物过程的首要方法。其核心原理在于,通过统计方法评估这些差异表达基因是否在特定通路中富集,以判断它们是否集中参与某些生物过程。此外,代谢变化确实可以作为通路失调的有力标志,这一点已在多种疾病和生理状态中得到了证实。然而,尽管代谢组基础的通路分析已被广泛采用,其结果往往并不准确。作者通过人工整理发现许多代谢组学研究中的通路分析存在错误或误导性。基于此,本文作者归纳出五大挑战,这些挑战源于代谢产物与基因在化学性质和生物特性上的根本差异。
5大挑战
1.代谢物调控的非协同性vs基因表达的共调控性
通路分析的核心原理是,根据差异表达基因是否过度富集或低度富集,推断特定通路是被激活还是被抑制。基因表达通常受关键转录因子驱动,并且多条mRNA可以在转录机制的协同作用下同时合成,从而呈现出高度相关的表达模式。这种生物学上的一致性显著提高了基于基因的通路分析的敏感性。代谢产物往往沿着线性代谢途径(Linear Biosynthetic Pathways)依次生成,代谢物的这种顺序转化使得代谢物水平之间的相关性低于基因表达水平。代谢通路的调控可能仅体现在最终产物上,而中间产物可能并无明显变化。此外,代谢通路通常在少数限速步骤受到调控(图1a)。
2.代谢物的跨组织运输与循环特性
代谢物(如氨基酸、葡萄糖)可在器官、组织和体液之间交换与循环,其浓度未必反映原位的代谢活性(如血清氨基酸可能源于饮食或组织分解,而非血液中的生物合成)。基因的产物通常定位明确,局部表达,从而使基于基因的通路分析更具可解释性(图1b)。
3.单一代谢物的变化可能源于多条代谢通路的共同作用
代谢途径彼此交叉协作,单一代谢物可能由多个不同的代谢活动共同生成。例如,丙酮酸既可以通过糖酵解途径产生,也可由丙氨酸经转氨基作用生成。随后,其参与下游途径生成乳酸或者乙酰辅酶A进而被消耗。总的来看,单一代谢物的浓度是其合成与消耗过程中多个基因与蛋白质协同作用的总和。因此,仅凭代谢物浓度推测通路是否异常仍存在巨大的挑战。相比之下,基因的通路分析往往更准确,因为基因表达产物(即RNA)不会被其他基因消耗或生成。 “一基因一功能” 原则仍旧成立,有助于基因产物对于通路分析的精准判断(图1c)。
4.代谢组学中的生信工具仍存在局限
首先是缺乏全面的参考通路数据库。除了少数模式生物,很多非模式生物仍缺乏代谢通路信息。即便是在模式生物中,对不同疾病状态下的代谢活动认识也依然有限。对代谢物生物学功能的探索和注释仍是持续性的研究工作。除此之外,代谢物还积极参与遗传调控和信号通路,但目前这些尚未整合到基于代谢组学的通路分析中。其次,一些代谢通路具有明确的组织特异性,但在基于代谢组学的通路分析中,这种组织特异性的通路信息很少被考虑在内。例如,糖异生和酮体生成主要发生在肝脏,而酮体的分解代谢仅发生在肝外组织。这种生物体内部的代谢分区在生物学中早已确立,但在代谢组分析中却往往被忽略。相比之下,基因组织特异性表达已经被广泛研究,且具有完善的数据库支撑进行相关通路分析(图1d)。
5.代谢物检测与注释过程中面临的独特分析挑战
首先,许多代谢物本身是中间产物,其存在低丰度、浓度跨度大、动态范围跨9个数量级的特点,尽管质谱技术具有极高的灵敏度和通量,仍存在极高的漏检风险。即使某些代谢物能在非靶标代谢组学中被检测到,其注释过程仍是瓶颈。自动化数据处理若缺乏人工验证,容易受到离子源碎裂、背景噪音等因素干扰,从而造成错误注释,进而影响通路显著性分析的准确性。更复杂的是,代谢物结构的微小变化可能产生完全不同的生物学功能。尤其是同分异构体,在代谢通路中可能具有截然不同的生物学作用,仅仅靠质谱往往难以将它们区分开,产生误判风险,从而影响通路分析准确性(图1e)。
图1.代谢组学中通路分析局限性的五个常见原因
4大改进
考虑到代谢物在化学与生物学层面的复杂性,以及当前技术的局限性,研究者应避免对MS数据进行“盲目套用”的通路分析。以下是若干改进建议:
1.遵循严格的代谢物注释流程
从分析化学角度出发,必须进行严谨的代谢物确认。将未经验证的代谢特征直接视为代谢物并纳入通路分析,虽然图表可能美观,但其生物学意义无异于随机猜测。
2.充分理解生物背景
分析代谢组数据时必须深刻理解其生物学语境,包括样本类型、组织来源等。同时建议与生物学专家合作,以确保研究结果的合理性。
3.需进行生物学验证
在得出结论之前,应通过实验手段验证所发现的代谢通路变化。例如,可以通过湿实验检测相关基因或蛋白的活性,从而支持代谢异常的推断。
4.使用代谢流分析(Metabolic Flux Analysis)
该方法可提供关于基因活性与代谢通路状态更直接的证据,是一种潜在的替代或补充策略。
小结
代谢组学通路分析不能直接套用基因表达分析的逻辑,需正视代谢物的化学复杂性、跨组织动态性及技术局限性。通过严格注释、生物学验证与跨学科协作,未来有望提升分析准确性,推动多组学整合,为疾病机制、代谢工程等领域提供更可靠的系统生物学见解。
百趣助力
读完上面的文章,想必您也心动了,BIOTREE建立了基于LC-MS/MS平台的非靶标代谢流检测分析方法,不局限于特定的代谢通路,可全面研究临床、动物、植物样本中代谢流量随时间变化的动态规律,定量分析流经代谢途径的代谢流量,清晰阐释代谢物在代谢途径中的变化机制,进而将代谢组学研究提升到更高水平