格式转换 脚本来源:https://github.com/edgardomortiz/vcf2phylip[https://github.com/edgardomortiz/...
格式转换 脚本来源:https://github.com/edgardomortiz/vcf2phylip[https://github.com/edgardomortiz/...
格式转换pop.list的第一列是个体名、第二列是种群名,tab分隔符. cat vcf.to.pomo.py 运行iqtree
@Once_9dbc 1. ”没有数据的窗口实在太多“,这就有可能是vcf中的SNP经过太多过滤导致的,你可以直接从bam文件转。 2. 在统计的时候,这种数据缺失的窗口是要丢掉的;我不知道你结果里面的NA是不是就是数据缺失太多导致的。 我们当时做的时候最起码有一半的窗口因为数据缺失都丢掉了。 3. 至于你说的重大偏差,你先用bam转了再看看
Dfoil - 推断祖先基因流-2. 在一篇讲泥炭藓的MBE看到了dfoil的使用 《Extensive Genome-Wide Phylogenetic Discordance Is Due to In...
说明在这个窗口上就没有序列或者没有足够的序列完成分析,没有序列或者序列不足的窗口扔掉就行
Dfoil - 推断祖先基因流-2. 在一篇讲泥炭藓的MBE看到了dfoil的使用 《Extensive Genome-Wide Phylogenetic Discordance Is Due to In...
@陶可爱_83e3 序列里面有*,说明有提前的终止密码子,*不能删除。可以删掉这种出现提前终止密码子的基因。
基于OrthoFinder的结果提取直系同源单拷贝基因建树0.运行Orthofinder略 1.建树 https://github.com/yongzhiyang2012/Two_iron_wood_genome_analysis/...
@是山不是海 有审稿人让我们删除色体间的互作,原因和你说的一样
仅作个人笔记 - 基于fithic的输出结果统计染色体体间显著互作的密度-1.更新于2025.4借助于GPT,这个功能一下子就可以实现,下面展示GPT的成果输出文件可以直接用pheatmap画图 cat interact_density_to_m...
注:脚本是用GPT生成的,请自己甄别。 perl gff3_to_bed12.pl in.gff > out.bed12 cat gff3_to_bed12.pl
ANGEs只能得到祖先染色体上基因的顺序,得不到祖先染色体的序列。
比如_Q / _P表示基因的先后顺序,你翻一下ANGEs的manual,有详细解释,我记不清了。
至于祖先染色体的序列,你如果是想拿到祖先整条染色体的序列,我不知道。
但是你如果是想重构某个基因/某段序列等等,工具有很多:
https://github.com/veg/hyphy-analyses/tree/master/AncestralSequences;
Cactus也能构建祖先序列, 基于比对块, 但是没有染色体的信息。
你说的这个负数的问题我一点印象都莫得了= =
使用Agora/ANGEs构建祖先核型0.部分参考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
参考以下链接, 本教程仅作一个跑通的示例https://github.com/PengNi/ccsmeth[https://github.com/PengNi/ccsmeth...
@1fa8330d5604 不用合并。一一对应来画。
使用Agora/ANGEs构建祖先核型0.部分参考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
@1fa8330d5604 是的。最后你得到的是祖先染色体在物种中的分布,所以是统一的。
使用Agora/ANGEs构建祖先核型0.部分参考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
众所周知ClusterProfiler是目前最 马赛克 的富集软件但是除了一些模式物种,大部分物种都没有相应的背景库,非常痛苦 怎么办呢?AnnotationForge这个R...
@大A子 我没用过wgdi提供的这些脚本,输入文件都是我自己准备的
WGDI - 推断祖先核型0.仅作个人笔记使用意思就是只考虑我能不能看懂具体每个参数的含义参照官方文档, 这里全部用默认参数https://wgdi.readthedocs.io/en/latest/...
@五个菠萝八块八 我用Agora跑完,CAR数量很多很多,然后我再投给ANGEs,CAR就只有23个了。
每条CAR上有多少基因我不太清楚,我的配置文件就是在简书里面那个截图,时间太久了原始文件找不到了- -
使用Agora/ANGEs构建祖先核型0.部分参考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
那就没法了,软件只能做到这了,不死心的话可以看看每个CAR里面都有多少个基因。
比如,是不是大部分CAR,都只有1-2个基因,那这样的可以不计入祖先核型数量。
使用Agora/ANGEs构建祖先核型0.部分参考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
是只有一个基因。
从共同祖先到现在,有三个物种,这个基因在每个物种中都有一份,也就是你看到的3个物种的基因。
使用Agora/ANGEs构建祖先核型0.部分参考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
首先需要看一下软件作者孙朋川老师的视频,孙老师做了好几次讲座了,B站有录屏。
以我的理解,核型就是自己根据共线性推的。
比如所有物种在X染色体上都有非常良好的共线性,那就认为祖先的X染色体一直传到现在都没咋变,那我们就得到祖先核型的第一条染色体了。
具体选哪个物种放进allspp.ancient.input.txt中,尽量挑各种结构重排比较少的物种写进去。
比如A, B, C, D个物种,你通过共线性发现D在X染色体上有一个易位,再结合系统发育关系/最大简约原则等等推断出是D发生了易位,而不是ABC发生了相同的易位。那就别选D,ABC随机选一个。
WGDI - 推断祖先核型0.仅作个人笔记使用意思就是只考虑我能不能看懂具体每个参数的含义参照官方文档, 这里全部用默认参数https://wgdi.readthedocs.io/en/latest/...
主播,不能切片,全基因组call和切片call,切片会少很多SNP,不知道为什么
freebayes快速群体call snp流程优化过滤和比对没什么好说的,fastp + bwa足够 重点是call snp这块,GATK作为精度最高的东西,运行速度也是最慢的,卡的要死。有人提出可以使用freebayes进...
bash get.longest.gff.sh input.gff > longest.gff cat get.longest.gff.sh 有的时候还会遇到gtf格式,ba...