2023-11-13
来源:上海百沐生物科技有限公司
所属分类:单细胞测序100问
尽管scanpy提供了PCA、UMAP和各种可视化等普遍适用的工具,但它主要是为RNA-Seq数据的分析而设计的。muon 通过为其他组学(例如染色质可及性 (ATAC) 或蛋白质 (CITE) 数据)提供预处理功能来填补这一空白。如上所述,μon 进一步提供了运行多组学算法的算法,这些算法从联合模态推断知识。例如,用户可以在单一模态上运行 PCA,但 muon 进一步提供以多种模态作为输入的多组学因子分析算法。
使用muon进行多模态数据分析涉及以下几个步骤:
1. 安装muon:
首先,您需要在您的计算机上安装muon。muon可以通过Python包管理器PyPI安装。您可以使用以下命令进行安装:
```
pip install muon
```
2. 获取数据集:使用muon的`mudatasets`功能来获取数据集。例如,如果您想要分析的是公开可用的10x Genomics Multiome数据集,您可以使用muon提供的工具来获取这些数据。
3. 选择模态:如果您的数据集包含多种模态,例如ATAC-seq和RNA-seq,您需要首先选择您想要分析的模态。例如,您可以选择ATAC模态进行子集分析。
4. 预处理数据:尽管muon是为多模态数据分析设计的,它仍然提供了一些预处理功能,这些功能可以用于单一模态数据,如ATAC-seq或CITE-seq。您可以使用muon中的模态特定模块来进行预处理。例如,对于ATAC-seq数据,您可以使用muon的ATAC模块进行特定的预处理步骤。
5. 运行多模态分析算法:在单一模态上运行如PCA这样的分析之后,muon提供了多模态因子分析算法,这些算法可以接受多个模态作为输入。这些算法可以帮助您从联合模态中推断出知识。
6. 使用muon API进行分析: muon API提供了模态特定的函数,这些函数在相应命名的模块中提供。同时,muon模块直接提供了用于联合分析模态的函数。
7. 进行高级分析:对于更高级的多模态数据分析,您可以使用muon提供的多模态转换方法。这些方法考虑到了不同模态可能来自不同的生成过程,并且它们的特征不可比较。
请注意,这里提供的步骤是一个简化的概述,实际的多模态数据分析可能会更加复杂,并且需要根据具体的数据和研究目标进行调整。对于最佳实践和完整的数据分析流程,建议阅读muon的相关章节以及其他多模态分析的文献。
百沐生物孵化于复旦大学,核心团队由复旦大学、中科院、协和医院等知名科研院所的卓越科学家以及来自阿里、美团、小米、生物医药集团等头部互联网科技公司和大型药企集团的综合背景精英组成,专注于将人工智能(AI)技术与生物技术(BT)深度融合,为生命科学研究和精准医疗领域带来创新解决方案。 公司核心平台为自研单细胞平台(BMBIOS)和小沐AI平台(AIGOBIO)。
微信联系我们