orthofinder2-sinple Chinese

Tips:
orthofinder 提供了dendroblast 或 msa的方式去构建基因家族树,可以使用-M开启
-M msa -A muscle -T iqtree ,默认aligen用MAFFT建树用fastree
使用多序列比对的方式更耗费计算资源但是树更准确
如果在算完dendroblast之后后悔了,又想用多序列比对来建树,那么可以使用作者提供的
-b <dir> Start OrthoFinder from pre-computed BLAST results in <dir>
-fg <dir> Start OrthoFinder from pre-computed orthogroups in <dir>
-ft <dir> Start OrthoFinder from pre-computed gene trees in <dir>
这些参数从你选择的点重新开始

安装 OrthoFinder (可以使用conda install)

  1. github下载最新的版本: https://github.com/davidemms/OrthoFinder/releases

  2. In a terminal, 'cd' to where you downloaded the package

  3. 解压文件: tar xzf OrthoFinder-2.2.7.tar.gz

  4. 安装依赖的其他软件: MCL, FastME and DIAMOND (see below)

  5. 测试OrthoFinder: OrthoFinder-2.2.7/orthofinder -h. OrthoFinder 会反馈help文档;

运行 OrthoFinder

OrthoFinder-2.2.7/orthofinder -f ExampleDataset -S diamond

输出文件: Orthogroups Directory

  1. Orthogroups.csv 每一行包含了不同同源基因族的名称. 每个物种的基因数目排列在以物种名的下。

  2. Orthogroups_UnassignedGenes.csv 包含了没有聚类到任何一个基因家族簇的基因。

  3. Orthogroups.txt (传统格式,与orthomcl输出的格式一样) 格式与 Orthogroups.csv 文件一样。

  4. Orthogroups.GeneCount.csv 每个物种下每个同源基因簇中包含的基因数。

同源基因可以呈现1对1,也可以是1对多和多对多依赖于基因复制事件。每个同源基因对应的同源簇都有一个文件包含了这些关联信息。Orthologs目录下包含了子目录中每个物种包含一个文件记载了 每个两两物种间对比的列表,并列出了同源基因。

输出文件: Gene Trees Directory

  1. 每组同源基因簇推断出的演化树

输出文件: Resolved Gene Trees Directory

  1. 使用OrthoFinder duplication-loss模型修正的每组同源基因簇基因的演化树。

输出文件: Species Tree Directory

  1. Species_Tree_rooted.csv Species Tree form All Genes 物种树

  2. Species_Tree_rooted_node_labels.csv 同上一样的树包含了Node值

输出文件: Comparative Genomics Statistics Directory

  1. Orthogroups_SpeicesOverlaps.csv 包含了每个物种同源基因簇交集关系,以数据矩阵的形式

  2. SingleCopyOrthogroups.txt 单拷贝同源基因簇的信息

  3. Statistics_Overall.csv 包含了同源基因簇大小的统计数据以及基因在同源基因簇中的比例。

  4. Statistics_PerSpecies.csv 与Statistics_Overall.csv 同样,但是每个物种单独统计的。

文件 'Statistics_Overall.csv' 和 'Statistics_PerSpecies.csv' 有一些解释如下:

  • Species-specific orthogroup: 包含只出现于一个物种的基因簇

  • G50: 基因簇中所包含的基因数目的中位数

  • O50: 基因簇中基因达到50时最小的基因簇总数

  • Single-copy orthogroup: 单拷贝基因簇,用来构建物种进化树以及其他分析.

  • Unassigned gene: 没有被列入任何同源基因簇的基因.

输出文件: WorkingDirectory

包含了运行过程中的所有信息,可以忽略

Additional Information

添加格外的物种:

OrthoFinder 允许你不需要重新blast计算的情况下添加额外的物种:

  • orthofinder -b previous_orthofinder_directory -f new_fasta_directory

通过添加新的序列目录 'new_fasta_directory' 到已完成的目录中, 再次使用所有之前的BLAST results, 只再次运行新添加的序列 BLAST searches 然后重新计算同源簇. 'previous_orthofinder_directory' 这个目录是 OrthoFinder 'WorkingDirectory/' 包含了'SpeciesIDs.txt'.

移除已经计算的物种:

OrthoFinder 允许你移除掉之前计算过的物种。 在之前计算的目录 'WorkingDirectory/' 中有个文件 'SpeciesIDs.txt'. 使用 '#' 符号注释掉对应物种的character然后运行OrthoFinder:

  • orthofinder -b previous_orthofinder_directory

'previous_orthofinder_directory' 目录在 OrthoFinder 'WorkingDirectory/' 下包含了 'SpeciesIDs.txt'.

同时添加删除目录中的物种

上述两种改变物种数目的方式可以合并,使用方法如下:

  • orthofinder -b previous_orthofinder_directory -f new_fasta_directory

单独运行 BLAST Searches (-op option)

'-op' 选项可以提供 OrthoFinder 需要的选项并打印需要运行的BLAST命令集

  • orthofinder -f fasta_files_directory -op

当你需要自己控制 BLAST searches 的时候这个命令很有用。比如,你可能需要分散在不同的计算机中计算. 当BLAST 计算完成后可以使用 '-b' 命令来计算同源簇,详细见"Using Pre-Computed BLAST Results"章节.

测试:

test目录下运行 'test_orthofinder.py' 检查软件是否正常运行

git 原版说明地址:https://github.com/davidemms/OrthoFinder

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,230评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,261评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,089评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,542评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,542评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,544评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,922评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,578评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,816评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,576评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,658评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,359评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,937评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,920评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,859评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,381评论 2 342

推荐阅读更多精彩内容