利用GEOparse可以方便的从GEO数据库(Gene Expression Omnibus Database)下载并处理数据。
在Python中安装:
pip install GEOparse
同时请确保安装了numpy 和pandas等包。
使用:
1:如果你想直接下载GSE1563这一个系列的芯片数据
import GEOparse
gse = GEOparse.get_GEO(geo="GSE1563", destdir="./")
2:如果你已经在本地下载了芯片数据
import GEOparse
gse = GEOparse.get_GEO(filepath="./GSE1563.soft.gz")
以上两条是下载或打开芯片数据。
GEOparse有三个类GSM:单一的样本;GSE:一系列的样本;GPL:平台
.table 和.columns是GSM的两个属性,返回的是pandas.dataframe对象。table是值。