数据处理 | 一文教会你如何对非靶向代谢组学数据进行预处理_行业资讯_百趣生物-代谢组学-蛋白质组学-转录组测序-多组学联合分析

首页
科研服务

非靶标代谢组学

新一代代谢组学 NGM 2

新一代代谢组学 NGM Pro 2

中药NGM 2

植物NGM 2

植物NGM Pro 2

DIA中药入血

GC-MS非靶

风味组学(VOCs)

肠道菌群非靶

类器官代谢组学

土壤非靶

外泌体非靶

中药质量评价

微量NGM 2

微量NGM Pro 2

脂质组学

定量脂质 PRO

经典脂质组学

4D脂质组学

定量脂质组学

高通量靶标代谢组学

600MRM

类黄酮

血清300MRM

精准植物广泛靶标

精准植物激素

脂酰辅酶A

单双糖

肠菌300MRM

氨基酸

氨基酸 PRO

短链脂肪酸

游离脂肪酸

中心碳代谢

神经递质

多胺及其合成通路物质

胆汁酸

氧化三甲胺及相关代谢物

类胡萝卜素

氧化脂质

色氨酸代谢

MRM定制靶标

ICP-MS离子组学

功能代谢组学

空间代谢组学

深度宏基因组之“四界微生态”

Nanopore三代全长转录组

三代全长16S/18S/ITS扩增子测序

靶标代谢流

非靶标代谢流

转录组学

微生物多样性测序

宏基因组

宏病毒组

Quantitative Real-time PCR

Western blot

ELISA检测服务

蛋白质组学

血清蛋白冠-DIA蛋白质组学

iTRAQ/TMT标记蛋白质组

蛋白冠-DIA

4D-Label free非标记蛋白质组

空间蛋白质组学

微量蛋白质组

定性鉴定蛋白质组

修饰蛋白定性

多肽组学

PRM靶向蛋白质组

磷酸化修饰定量蛋白组

乙酰化修饰定量蛋白组

泛素化修饰定量蛋白组

糖基化修饰定量蛋白组

MetPro-Ⅱ代谢物与蛋白互作

Olink蛋白质组学

乳酸化修饰定量蛋白组

软件及仪器

LIMS2-实验室信息化管理云平台

SIMCA-多元变量统计分析

Qlab3-质谱法全自动样本前处理

MODDE-质量源于设计QbD
生物医药服务

一级结构

Maldi-tof分子量

高分质谱分子量

还原分子量

脱糖分子量

还原脱糖分子量

质谱法N端序列分析

Edman N端序列分析

质谱法C端序列分析

UPLC质量肽图

HPLC液相肽图

氨基酸序列覆盖度

多肽全序列分析

二硫键配对/错配分析

CDR区序列分析

DAR值分析

氨基酸组成分析

氨基酸D/L手性分析

二级及高级结构

圆二色谱紫外扫描分析

热稳定性分析

粒子粒径分析

内源荧光光谱

红外光谱分析

紫外光谱分析

核磁共振分析

氢氘交换质谱分析

X射线粉末衍射

理化、修饰、有关物质

毛细管电泳纯度

毛细管等电点

SDS-PAGE电泳纯度

SEC-HPLC纯度

RP-HPLC纯度

IEX-HPLC纯度

AUC聚集体分析

SEC-MALS聚集体分析

N糖基化位点分析

O糖基化位点分析

N/O糖谱/糖型分析

偶联位点分析

唾液酸含量分析

翻译后修饰分析

游离巯基含量分析

液相有关物质鉴定

胶带杂质鉴定

亲和力、细胞活性

药物与抗原亲和力

药物与FcRn亲和力

药物与FcγRI受体亲和力

药物与FcγRII受体亲和力

药物与FcγRIII受体亲和力

药物与C1q亲和力

ADCC细胞活性

CDC细胞活性

ADCP细胞活性

工艺有关物质含量检测

消泡剂类定量

抗生素类定量

诱导剂定量

诱导剂定量

缓冲盐成分定量

灭活剂定量

表面活性剂定量

辅料含量检测

工艺添加蛋白定量

宿主蛋白残留量检测

宿主DNA残留量分析

Protein A残留量检测

其他类检测

培养基化合物分析

金属元素（ICP-MS）分析

消光系数

HCP抗体覆盖率分析

质谱法HCP定性、定量

方法开发、验证及转移

定制化类服务
医学转化服务

医学产品

儿茶酚胺及其代谢物测定试剂盒

十九种类固醇激素测定试剂盒

维生素D测定试剂盒

药物浓度测定试剂盒

醛固酮、血管紧张素Ⅰ/Ⅱ测定试剂盒

VitaPad-定量干血样本采集保存器

微量血IGF-1测定试剂盒

Starlid质谱法全自动样本前处理系统, Biotree

CDMO服务

NGM全流程自动化产品方案

常规试剂OEM

创新产品CDMO
仪器平台

科研代谢组学平台

Orbitrap Exploris 120, Thermo

Stellar, Thermo

Q Exactive Focus, Thermo

TripleTOF 6600, Sciex

Qtrap 6500+, Sciex

Triple Quad 7500, Sciex

Triple Quadrupole 6460, Agilent

GC-TOF-MS Pegasus HT, Leco

GC-MS 5977B, Agilent

GC-MS QP2020, Shimadzu

ICP-MS 7850, Agilent

Xevo TQS, Waters

TSQ Altis Plus,Thermo

Mini-PROTEAN Tetra, Bio-Rad

ChemiScope6200，Clinx

Multiskan FC, Thermo

PCR仪 qTOWER3, Jena

科研蛋白质组学平台

Orbitrap Astral, Thermo

Q Exactive HFX, Thermo

timsTOF Pro 2, Bruker

蛋白冠™全自动化前处理工作站, Seer

生物医药服务平台

Qtrap 6500+, Sciex

Q Exactive HF-X, Thermo

GC-MS QP2020, Shimadzu

Mini-PROTEAN Tetra, Bio-Rad

ICP-MS 7850, Agilent

Acquity UPLC I-Class Plus, Waters

Maurice

J-1500, JASCO

1260 Infinity II/HPLC, Agilent

医学转化服务平台

Xevo TQS, Waters

Citrine™ Triple Quad™, Sciex
百趣概况

公司简介

公司简介

发展历程

百趣文化

荣誉证书

新闻资讯

百趣动态

行业资讯

人才发展

人才培训

员工风采

加入我们
联系我们

首页百趣概况新闻资讯 行业资讯

数据处理 | 一文教会你如何对非靶向代谢组学数据进行预处理

发布时间 2023-08-28

非靶向代谢组学是一种无偏向的代谢组学分析，能够同时检测大量代谢物信号。代谢组检测结果包含实验样本和质控样本(quality control, QC)，为了更好地分析数据，我们需要对检测数据进行一系列的预处理，主要包括偏离值过滤、缺失值过滤、缺失值填补和数据标准化。经过预处理，可以减小奇异数据对数据分析的影响，有利于更准确地筛选和挖掘代谢物。

数据处理 | 一文教会你如何对非靶向代谢组学数据进行预处理(图1)

偏离值过滤

偏离值，也称异常值，一般指相对误差较大、偏离正常范围的观测值。偏离值的存在可能会导致数据分布和真实分布差别很大，影响数据集的均值和标准差，从而影响统计分析的结果。使用QC样本的相对标准偏差（relative standard deviation, RSD, 即变异系数coefficient of variation, CV）作为衡量标准，认为QC组RSD大于0.3的物质检测不稳定，删除该物质的所有检测数据。

数据处理 | 一文教会你如何对非靶向代谢组学数据进行预处理(图2)

缺失值过滤

在检测分析过程中，样本可能会由于某些原因造成缺失，比如信号很低检测不到、算法限制等。代谢组学分析通常根据样本或组内缺失值的比例进行数据过滤，例如：保留单组或所有组中空值不超过50%的代谢物。

缺失值填补

过滤后的数据仍然会存在缺失值，如果直接忽视，可能会导致后续分析异常，也会影响分析结果的准确性，因此需要对缺失值进行模拟填充。比较简单的方法是用中位数、最小值的二分之一等直接进行填充；复杂一点的可以使用机器学习的算法如K-近邻算法(K-Nearest Neighbors, KNN)、奇异值分解(Singular Value Decomposition, SVD)等。

1. 最小值的二分之一填充

用实验样本检测结果中所有峰面积的最小值的二分之一来填补缺失值。

2. K-近邻算法

KNN算法是一种简单高效的缺失值填补方法，原理是通过计算距离来识别空间相似或相近的k个样本，然后使用这些样本来估计缺失数据点的值，每个样本的缺失值使用数据集中找到的"k"邻域的平均值进行插补。

数据处理 | 一文教会你如何对非靶向代谢组学数据进行预处理(图3)