文件格式要求
chr-a start-a end-a chr-b start-b end-b options
chr9 4210121 4211225 chr10 19666298 19668816 color=140,105,20
chr9 4221308 4222192 chr10 19647682 19648089 color=140,105,20
chr9 4225247 4230980 chr10 19439605 19445179 color=140,105,20
chr9 20249400 20252312 chr11 798933 803498 color=140,115,20
chr9 20307676 20311487 chr11 792810 795351 color=140,115,20
##文件共有7列,使用tab分隔;每一行表示一对有联系的区域,前3列和后3列分别定义一个区域,最后一列为颜色
如何生成该格式?
-
生成共线性文件
NTX_1g01972 1972 NTX_1g01973 1973 1 NTX_1g01980 1980 NTX_1g01979 1979 1 NTX_1g01982 1982 NTX_1g01983 1983 -1 NTX_1g01988 1988 NTX_1g01987 1987 1 NTX_1g02003 2003 NTX_1g02002 2002 1 NTX_1g02004 2004 NTX_1g02003 2003 1 ##这是共线性文件(在wgdi的共线性分析中生成)
1 NTX_1g00001 12237 16451 - 1 chr1.g00002.1 1 NTX_1g00002 58474 59181 + 2 chr1.g00003.1 1 NTX_1g00003 59836 67849 + 3 chr1.g00004.1 1 NTX_1g00004 67865 69721 + 4 chr1.g00005.1 ##这是wgdi生成的特殊比对gff文件
awk -F "\t" '{print $1 "\t" $3}' 002.con | awk '/^NTX/{print $1}' | xargs -I {} grep {} ./NTX.gff | awk '{a=substr($2,1,8)}{print a "\t" $3 "\t" $4}' > 1.tmp awk -F "\t" '{print $1 "\t" $3}' 002.con | awk '/^NTX/{print $2}' | xargs -I {} grep {} ./NTX.gff | awk '{a=substr($2,1,8)}{print a "\t" $3 "\t" $4}' > 2.tmp paste 1.tmp 2.tmp >link.tmp ##把文件按照共线性文件生成新格式 ##excel打开文件,去除掉染色体内的比对(if语句即可)
给共线性文件添加颜色
##文件添加rgb颜色
##把文件输入到excel
#使color第二列为=MID(A1,4,2)*10+50,第四列为=MID(D3,4,2)*10等,可自行设置喜欢的颜色,之后到txt中去掉所有tab
#即可得到与两条染色体都相关的颜色代码,复制粘贴到links文件中,如下
chr1 4733065 4735993 chr18 13798474 13801492 color=60,185,20
chr1 4875770 4881299 chr18 14176762 14182099 color=60,185,20
chr1 24033076 24034330 chr2 25586015 25587734 color=60,25,20
chr1 24037473 24041511 chr2 25592131 25596678 color=60,25,20
#运行
circos -conf circos.conf