网站首页 / 资源中心 / 技术分享 / 多组学百问系列 / 单细胞测序100问

小沐同学(AI)|单细胞测序100问(58)

2023-11-13

来源:上海百沐生物科技有限公司

所属分类:单细胞测序100问

Q:使用 MuData 存储多模态数据(扩展)

A:

MuData是一种用于存储和操作多模态数据的数据结构,它建立在AnnData之上。多模态测序,如CITE-Seq,通过同时测量RNA和表面蛋白来生成多模态数据。这种数据需要更高级的存储方式,MuData就是为此而设计的。

MuData利用AnnData对象的引用来存储单模态数据,同时MuData对象本身也存储多模态注释。这意味着你可以直接访问AnnData对象来执行单模态数据转换,并将结果存储在相应的AnnData注释中,也可以聚合多种模态进行联合计算,并将结果存储在全局MuData对象中。

技术上,MuData对象包含一个字典,其中每种模态对应一个AnnData对象,存储在其`.mod`(模态)属性中。和AnnData对象一样,它们也包含像`.obs`这样的属性。

要使用MuData存储多模态数据,你可以按照以下步骤操作:

  1. 安装MuData:MuData可以通过PyPI或Conda进行安装。你可以使用以下命令之一进行安装:
    ```
    pip install mudata
    ```
    或者
    ```
    conda install -c conda-forge mudata
    ```

  • 创建MuData对象:你可以创建一个MuData对象,并将不同模态的AnnData对象作为引用添加到它的`.mod`属性中。

  • 存储多模态注释:在MuData对象中,你可以添加多模态相关的注释,这些注释可以是关于整个样本的信息或者是跨模态的分析结果。

  • 使用多模态方法:准备好MuData对象后,你可以使用多模态方法来分析数据。例如,你可以编写一个简单的函数来运行主成分分析(PCA)在连接的多模态矩阵上。MuData对象提供了一个存储多模态嵌入的地方:`MuData.obsm`。这类似于在单模态上生成的嵌入是如何存储的,只不过这次它是保存在MuData对象内部,而不是在AnnData.obsm中。

通过这种方式,MuData为多模态单细胞测序数据的存储和分析提供了一个灵活且强大的框架。

注:MuData 概述

科研服务 基因编辑 生信云平台 资源中心 关于百沐

百沐生物孵化于复旦大学,核心团队由复旦大学、中科院、协和医院等知名科研院所的卓越科学家以及来自阿里、美团、小米、生物医药集团等头部互联网科技公司和大型药企集团的综合背景精英组成,专注于将人工智能(AI)技术与生物技术(BT)深度融合,为生命科学研究和精准医疗领域带来创新解决方案。 公司核心平台为自研单细胞平台(BMBIOS)和小沐AI平台(AIGOBIO)。

上海市宝山区长江软件园

191 2100 2160

baimu@bmbios.com

微信联系我们

Copyright © 2023 上海百沐生物科技有限公司 版权所有备案号:沪ICP备2023019583号-1 网站建设