来自瑞典和美国的研究人员开发了PanglaoDB数据库,一个用于探索小鼠和人类scRNA-seq数据的网站,为单细胞组学研究提供最新的公共scRNA-seq数据资源。其相关研究成果已发表在《Database》。
PanglaoDB数据库,包含了超过1054个单细胞实验的预处理和预计算分析,涵盖了大多数主要的单细胞平台和分析流程,基于来自各种组织和器官的超过400万个细胞。在线界面允许用户查询和探索细胞类型、遗传途径和调控网络。
为什么要构建PanglaoDB?解决单细胞数据难以访问的问题
scRNA-seq的分辨率达到了前所未有的水平,并且越来越多地被用于检测组织、器官和整个生物体的细胞结构。目前已发表了数百个单细胞测序数据集。然而,单细胞相关的研究数据常常以原始数据的形式存储,由于需要使用复杂的计算流程进行数据处理,生物研究人员很难访问这种格式的数据。
虽然目前已经有一些数据库收集、管理和整合scRNA-seq数据和生物信息工作流到易于访问的平台,例如scRNASeqDB和SCPortalen,但是没有一个数据库可提供预计算的生物信息分析和从用户角度进行高级可视化。
因此,研究团队搭建了PanglaoDB数据库,通过基于web的接口来探索scRNA seq数据。
PanglaoDB数据库和功能概述
PanglaoDB能做什么?
搜索功能
Q:我的目标基因在哪些细胞表达?
A :用户可以通Search功能,查看基因(可使用and/or搜索多个基因)在细胞中的表达情况。
在Search页面用户通过输入基因信息(可使用and/or搜索多个基因),勾选物种及其他限制条件,得到搜索结果表及柱状图:1)搜索结果表每一行表示一个基因所在的细胞簇。可以查看物种和组织类型,基因在该簇中表达值的排秩,预测的细胞类型,点击最后一列的望远镜可以查看整个数据集的详细信息。2)柱状图X轴表示该基因有表达的细胞类型,y轴表示细胞类型中包含的细胞簇数目。
搜索功能示例
浏览功能
Q:我想知道小鼠肺间质中的细胞亚型?
A:点击主菜单上的“Datasets”,再点击“Samples”,可以添加限制条件:物种、测序平台或表头顺序,得到搜索列表,点击“view”可查看数据集的基本信息和该数据集的细胞聚类图,使用t-SNE/UMAP进行降维可视化,不同颜色代表不同的簇。
浏览功能示例(Samples)
Q:如何查看某个细胞亚群的细胞marker?
A:点击主菜单上的“Datasets”,再点击“Cell type markers”,选择细胞类型,即可得到细胞类型的基因表达marker列表,绿色的行表示典型marker。发现细胞类型标记不准确,可通过flag按钮发送错误报告
浏览功能示例(Cell type markers)
数据下载
用户可在Bulk data download页面批量下载数据。
Bulk data download页面
用户还可以使用部署在数据库上的alona工具进行自有数据的分析。
PanglaoDB访问地址:https://panglaodb.se/.
首发公号:国家基因库大数据平台
参考文献
Franzén O, Gan L M, Björkegren J L M. PanglaoDB: a web server for exploration of mouse and human single-cell RNA sequencing data[J]. Database, 2019, 2019.
图片来源于PanglaoDB和参考文献,如有侵权请联系删除。