PASTIS:从HiC矩阵推断染色体3D结构

前言

  HiC数据的另外一个用途就是可以推断染色体的3D结构。小编也是第一次做染色体三维推断的分析,而网络上也很少能找到关于此分析的帖子,所以在这过程中也是踩了不少的坑,所以今天记录一下,抛一块砖。目前,利用HiC数据推断染色体三维结构的软件有不少,这里列举一二,如PASTIS、LorDG、ChromeSDE、Shrec3D、MOGEN等。这些软件从实现方法角度可以分成Distance-Based、Contact-Based、Probability-Based三大类,具体哪一种实现过程比较好这里就不做讨论。今天我们要说的PASTIS软件包含Distance-Based和Probability-Based两种算法,分别对应其中的四个函数pastis-mdspastis-nmdpastis-pm1pastis-pm2

软件使用

  PASTIS使用python编写的软件,目前支持使用pip命令来安装,所以安装和使用还是相对简单的。不过github源码库里面自带测试数据,如果想用测试数据的可以采用源码安装。

###安装
pip install --user pastis
### github下载源码安装
python setup.py install --user

  安装好软件,下面我们就来使用一下,这里用源码中测试数据测试一下(examples/pastis_example目录下含有测试数据)。这里还是忍不住想吐槽一下软件的文档写得太过简单了。第一次接触有点方,因为这个软件并不像其他命令行工具使用-h就可以查看使用帮助,该软件使用的是配置文件的方式,需要在目录下放置一个名为config.ini配置文件里面提供软件需要的参数,内容如下:

[all]
output_name: structure
verbose: 1
max_iter: 100
counts: data/counts.npy
normalize: True

  可是,作者提供示例的配置文件参数很少,其实有很多参数是有默认值的,想要知道全部参数的参数,可以通过python的交互式方式导入pastis包来看,或者粗暴一点直接看源码。下面演示一下交互式方式查看:

>>>import pastis
>>>pastis.config.parse()
{'chromosomes': '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16', 'organism_structure': 'files/budding_yeast_structure', 'binary_pm': 'PM_all', 'beta': 1.0, 'seed': 0, 'input_name': 'wish_distances.txt', 'adjacent_beads': None, 'alpha': -3.0, 'counts': 'data/counts.npy', 'logging_file': 'MDS.log', 'nucleus_size': None, 'output_name': 'structure.pdb', 'binary_mds': 'MDS_all', 'resolution': 10000}

  可以看到参数有很多,如果不提供就会使用默认参数,这可是一个巨大的坑,不清楚的情况下都不知道为啥程序跑不通,即使误打误撞跑通了,也不要高兴太早,因为后面你可能会发现结果不一定正确,因为里面内置的数据方面参数都是关于酵母物种,如果你分析是其他物种就要小心了(不要问我是怎么知道 >_<|||)。注意,下面这些参数需要根据数据自行调整:
chromosomes:染色体,多个用逗号分隔;
organism_structure:存储染色体长度的文件,一行是一条染色体长度;
counts:HiC矩阵存储为numpy数组格式;
resolution:HiC矩阵的分辨率。
  betaalphaadjacent_beadsnucleus_size这几个参数具体有什么作用咱也不清楚,但可以推测应该是跟建模有关,不清楚有什么影响时还是用默认参数比较稳妥。其余的参数基本可以选择忽略了。
  下面来看看具体怎么使用这个软件,首先看一下配置文件的内容:

[all]
resolution: 10000
output_name: structure
chromosomes: 1,2,3,4,5,6,7,8
counts: data/counts.npy
organism_structure: files/budding_yeast_structure
normalize: True

  然后是准备输入的目录,目录结构类似如下:

example
├── config.ini
├── data
│   └── counts.npy
└── files
    └── budding_yeast_structure

  最后,运行命令。pastis-mdspastis-nmdpastis-pm1pastis-pm2四个子命令自行选择使用:

pastis-pm2 example

  当程序结束时会在目录中生产两个文件,一个是三维坐标文件,一个是pdb格式的三维结构文件(后续用此文件画染色体的3D结构)。两个文件名都是以选择的相应算法名为前缀。

结束语

  至此,染色体的三维结构推断好了,后续就是可视化方面的事情了。虽然前面吐槽了软件使用方面的问题,但还是得承认这个软件预测的结果还是不错的。希望软件作者后续维护给力,软件能够更新的越来越好用,文档也能详细起来解释一下参数的作用,让用户明白如何根据数据来调整参数。

参考

https://github.com/hiclib/pastis
http://hiclib.github.io/pastis
<<A statistical approach for inferring the 3D structure of the genome>>

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,271评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,725评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,252评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,634评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,549评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,985评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,471评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,128评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,257评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,233评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,235评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,940评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,528评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,623评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,858评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,245评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,790评论 2 339

推荐阅读更多精彩内容