网站首页 / 资源中心 / 技术分享 / 多组学百问系列 / 单细胞测序100问

小沐同学(AI)|单细胞测序100问(85)-分析篇

2023-11-20

来源:上海百沐生物科技有限公司

所属分类:单细胞测序100问

Q:为什么高分文章中单个样本捕获细胞数在2000-3000?

A:

(1)不同的细胞浓度下,想要获得不同的目标细胞捕获数,需要上机不同体积的细胞悬液。在上机细胞悬液浓度固定时,如果目标细胞捕获数增加到8000甚至10000,上样细胞悬液体积势必增加,在细胞悬液质量不是很理想(细胞活性<90%、碎片率>5%、结团率均>5%)的情况下,引入的背景信号会增加,分析结果不理想的直接体现包括:cell、non-cell无法有效区分和Fraction reads in cells偏低。当cell和non-cell无法有效区分时,会使得数据出现假阳性和假阴性结果!


(2)当目标细胞捕获数很大时,多细胞率会增加,最终数据分析时,此部分“cell”表现为基因检测数和UMI检测数是正常cell的N倍(N是一个GEM包裹的细胞数),导致所有细胞的统计数据(单个细胞基因检测中位数、单个细胞UMI检测中位数)虚高。此部分“cell”虽然可以通过设置数据分析阈值进行过滤,但是容易会有此类数据的残留和正常高基因检测细胞的人为去除!


(3)最重要的原因,单细胞测序所有的分析都是基于细胞聚类进行,而细胞聚类是在区分cell和non-cell后,获得细胞基因表达谱,通过降维(pca),聚类(Graph-based& K-Means)以及可视化(t-SNE)得到的。进行细胞聚类时需要考虑到每个细胞的基因表达模式,因此即使是相同的数据,在剔除几个细胞的情况下,前后获得的聚类图也会出现明显不同。而当细胞捕获数过多时,无论是第一种情况出现的假阴性和假阳性数据,还是第二种情况引入的多细胞数据,都会对正常细胞聚类产生影响,造成聚类结果失真。这也是很多文章,特别是很多高分文章,为什么单个样本捕获细胞数在2000-3000的原因了。


科研服务 基因编辑 生信云平台 资源中心 关于百沐

百沐生物孵化于复旦大学,核心团队由复旦大学、中科院、协和医院等知名科研院所的卓越科学家以及来自阿里、美团、小米、生物医药集团等头部互联网科技公司和大型药企集团的综合背景精英组成,专注于将人工智能(AI)技术与生物技术(BT)深度融合,为生命科学研究和精准医疗领域带来创新解决方案。 公司核心平台为自研单细胞平台(BMBIOS)和小沐AI平台(AIGOBIO)。

上海市宝山区长江软件园

191 2100 2160

baimu@bmbios.com

微信联系我们

Copyright © 2023 上海百沐生物科技有限公司 版权所有备案号:沪ICP备2023019583号-1 网站建设