网站首页 / 资源中心 / 技术分享 / 多组学百问系列 / 单细胞测序100问

小沐同学(AI)|单细胞测序100问(60)-分析篇

2023-11-15

来源:上海百沐生物科技有限公司

所属分类:单细胞测序100问

问:数据质控背景

答:

单细胞 RNA-seq 数据集有两个重要的属性,在进行分析时应牢记这一点。首先,scRNA-seq 数据被丢弃,这意味着由于 mRNA 的限制,数据中存在过多的零。其次,纠正数据和执行质量控制的潜力可能会受到限制,因为数据可能与生物学混淆。因此,选择适合基础数据且不会过度校正或消除生物效应的预处理方法至关重要

由于新的测序技术以及捕获的细胞、测量的基因识别的细胞群数量的不断增加,用于分析单细胞RNA 测序数据的工具集正在快速发展。其中许多工具专用于预处理,旨在解决以下分析步骤:双峰检测、质量控制、归一化、特征选择和降维。本章中选择的工具可以严重影响数据的下游分析和解释。例如,如果您在质量控制过程中过滤掉过多的细胞,您可能会丢失稀有的细胞亚群,并错过对有趣的细胞生物学的深入了解。然而,如果您过于宽容,并且没有在预处理管道中排除质量较差的单元格,则可能会很难注释单元格。因此,选择能够提供最佳实践并被证明在下游任务方面优于其他工具的工具非常重要在许多情况下,您仍然需要重新评估预处理分析并进行更改,例如过滤策略。

本次使用的单细胞数据,已进行原始处理,将数据对齐以获得分子计数矩阵,即所谓的计数矩阵或读数矩阵。计数矩阵和读数矩阵之间的差异取决于单细胞文库构建方案中是否包含唯一分子标识符 (UMI)。读数和计数矩阵的维数为条形码数 x 转录本数。值得注意的是,这里使用术语“条形码”而不是“细胞”,因为条形码可能错误地标记了多个细胞(双联体)或可能没有标记任何细胞(空滴/孔)。


科研服务 基因编辑 生信云平台 资源中心 关于百沐

百沐生物孵化于复旦大学,核心团队由复旦大学、中科院、协和医院等知名科研院所的卓越科学家以及来自阿里、美团、小米、生物医药集团等头部互联网科技公司和大型药企集团的综合背景精英组成,专注于将人工智能(AI)技术与生物技术(BT)深度融合,为生命科学研究和精准医疗领域带来创新解决方案。 公司核心平台为自研单细胞平台(BMBIOS)和小沐AI平台(AIGOBIO)。

上海市宝山区长江软件园

191 2100 2160

baimu@bmbios.com

微信联系我们

Copyright © 2023 上海百沐生物科技有限公司 版权所有备案号:沪ICP备2023019583号-1 网站建设