ls *.fq.gz | while read f; do b="${f%.fq.gz}.bam"; if [ ! -f "$b" ]; then echo "$f"; fi...
ls *.fq.gz | while read f; do b="${f%.fq.gz}.bam"; if [ ! -f "$b" ]; then echo "$f"; fi...
最近有多个朋友问我关于二代重测序数据的分析问题(clean data 到vcf),我写了一个完整的步骤如下,若你是多个样品进行分析,最好是写 循环语句,这里我仅举一个例子“s...
StringTie 是用于 RNA-seq 的转录本组装和定量软件。 本文只是个笔记记录,更详细的内容还是要看说明书。 StringTie: Transcript assem...
1. bam2fasta -o xx.ccs.bam 2.hifiasm -o xjg04 -t 50 --hg-size 1.5g xjg.hifi.original.fa...
当基因组某些区域可能有着比较高的杂合度,这会导致基因组该区域的两个单倍型被分别组装成primary contig, 而不是一个为primary contig, 另一个是ass...
宏基因组二代测序结果binning之后的序列可能存在重复,首先使用prokka将binning后的序列转化为蛋白序列, 再使用CD-hit 命令默认参数将序列进行去重复 然后...
(全文5058字) 【推荐】用Smudgeplot评估物种倍性后,用组合jellyfish+GenomeScope1.0做二倍体物种的基因组调查,用组合KMC+GenomeS...
for file in */umap.svg; do mv "$file" "$(dirname "$file")/$(basename $(dirname "$file")...
ls *.fa | paste -sd " "解释一下 查看其他草稿 该命令由两部分组成: ls *.fa:列出文件夹中所有以 .fa 结尾的文件。 paste -sd " ...
可以在命令行模式中快速查看生成的图片 输入上述命令后在浏览器中输入远程服务器的地址后加入:8000即可
已知表格1中内容为: Pangenome_ALLmergeMGAL10B.pepOrthogroup HT_HIFI_Bat0035260.1MGAL_10B003480P1...
import pandas as pd # Load the Excel file into a pandas DataFrame df = pd.read_excel('C...
提取以P1结尾的全部序列 awk '/^>.*P1$/{flag=1;print;next} />/{flag=0} flag' xxx.fa > P1_xxx.fa 这个命...
1.修改服务器hostname hostname 查看当前主机名 修改主机名为: hostnamectl set-hostname [修改后的名字] 2. 将主机的ip 添加...
检测目录下所有文件的md5值 find ./目录 -type f | xargs md5sum > md5.txt
vcf-query -l xx.vcf 在进行admixture运算时,需要染色体名称为整数,常需要提取vcf文件中的染色体名称,并进行修改,需要以下几步。 第一步:提取vc...
mawk '!/#/' xxx.vcf | wc -l 1.新建了conda 2brad 环境 2.安装一系列软件,pear samtools bcftools plink,...
举例:输出sam文件的id中##*/表示删除id中从左往右遇到“/”时左边的全部内容以及“/”.
for id in $(ls ../00.extracted/*gz | sed 's/.fq.gz//'); do echo "bowtie2 -p 20 -x ../02.ref/gipl -r $id.fq.gz -S ${id##*/}.sam"; done > bowtie2.sh
文件改名2 利用for循环for id in $(ls */*_refine -d); do mv $id/metawrap_70_50_bins $id/step1; done 统一修改文件夹的名字...
sed 's/_/ /1'替换每一行中的第一个_为空格 sed 's/_/ /2' 替换每一行中的第二个_为空格
Linux 两个文件求交集、并集、差集 一、交集 sort a.txt b.txt | uniq -d 二、并集 sort a.txt b.txt | uniq 三、差集 a...