[转] GEO数据库--检索界面及检索结果简介
原文:http://baijiahao.baidu.com/s?id=1575064181962032&wfr=spider&for=pc
1、首先GEO数据库是个什么鬼呢?
GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。
关键是这个数据是免费的!免费的!免费的!重要的事说三遍。这么想一想世界还是很美好的。
2、那GEO数据库有哪些检索入口呢?
最常用的有两种方式,一种是通过网址http://www.ncbi.nlm.nih.gov/geo直接进入,另外一种就是通过pubmed入口啦。
接下来咱们就进入正题。PS:前方多图预警
1、GEO数据库最常用的入口当然是PUBMED入口啦,简单粗暴。
2、那么首先我们先来介绍一下数据库检索界面的基本信息:
和pubmed一样,GEO数据库界面主要包括检索框、检索结果列表、检索结果限定选项、检索记录信息,等
上图左侧就是检索结果限定选项,想要准确地找到需要的数据,限定条件很重要哦~
2.1 限定数据记录类型:首先数据导入类型主要分为四种:datasets、series、samples和platforms,可根据自己的需要选择,最常用的是series数据集显示格式
2.2 限定检测类型:要注意的是不同的实验检测类型不一样,比如DNA、mRNA、SNP、甲基化等等,在检索时就要结合自己的实验设计选择相应的检测类型。
2.3 限定作者:当想要检索某一个具体研究者发表的文章相应的数据资料时,就可以在这里ADD作者的名字来精确检索啦。
2.4 限定物种来源:在选择限定条件时,还有很重要的一项就是选择检测样本的物种来源,比如人、小鼠、家兔、犬等等。
2.5 限定层次类型:除了不同的物种外,如果想要查找某一层面基因表达的数据时,比如组织、细胞等等,在这里ADD想要的type就行。
3、那接下来我们就以关键词为endometriosis,筛选条件为series 检测类型为expression profilingby arry 物种为homo sapiens 为例简单介绍一下检索结果界面的解读。
看到这个检索结果页面是不是觉得还是无从下手呢?不要急,下面几张图告诉你原来真的 so easy
下面是检索结果列表的基本信息