谋划半年多,又决定开始学生信,甚至还考了个生信专业的研究生,主要还是觉得生信分析能力终究是个非常有用的工具。兜兜转转又回来了,立个flag先,这次一定坚持下去! 看着四年前写...
谋划半年多,又决定开始学生信,甚至还考了个生信专业的研究生,主要还是觉得生信分析能力终究是个非常有用的工具。兜兜转转又回来了,立个flag先,这次一定坚持下去! 看着四年前写...
1809年2月12日,查尔斯·达尔文出生在英国,大西洋的对岸千里之外的美国总统林肯也在同一天出生,同样在2月,英国的军舰炮轰了中国澳门,泱泱中华逐渐滑落深渊。 对于成功人士,...
开始做题前需要生成vcf文件先: 想要顺利的把题目做完,基础的Linux命令当然需要熟练运用,更关键的是对 vcf 文件格式和内容的了解。 把突变记录的vcf文件区分成 IN...
用上一节下载的bowtie2软件中自带的测试数据生成sam和bam文件先: 一、统计共多少条reads(pair-end reads这里算一条)参与了比对参考基因组 二、统计...
第20题答案:
cat reads_1.fq|paste - - - -|cut -f 4|cut -c1|perl -alne '{print ord($_)-33}'| paste -s -d+|bc
学生信的那些事儿之十四 - 生信技能树fasta和fastq格式文件的shell小练习20题第18题和第20题不会做,求高手指教啊~~ 该练习使用的数据为bowtie2中的示例数据,获取方法如下: 统计reads_1.fq 文件中共有多少条序列信息 输出所有的rea...
第18题答案:
awk '{if(NR%2==0){print substr($0,6,length($0)-10)}else{print}}' reads_1.fq | head
学生信的那些事儿之十四 - 生信技能树fasta和fastq格式文件的shell小练习20题第18题和第20题不会做,求高手指教啊~~ 该练习使用的数据为bowtie2中的示例数据,获取方法如下: 统计reads_1.fq 文件中共有多少条序列信息 输出所有的rea...
第18题和第20题不会做,求高手指教啊~~ 该练习使用的数据为bowtie2中的示例数据,获取方法如下: 统计reads_1.fq 文件中共有多少条序列信息 输出所有的rea...
1. 在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列。 2. 在创建好的文件夹下面,比如我的是 /Users/jimmy/tmp/1/2/3/...
在Linux系统下安装了conda,配置了镜像,创建了分析环境,并且在环境下下载了常用的分析软件,那么接下来做什么呢?锅碗瓢盆、油盐酱醋都已准备妥当,准备开火煮饭却发现没有米...
理论上讲,前面非常基础的Linux知识学到位之后是可以“开始”尝试实战一下RNAseq分析的上游部分的。 不过呢,如果把组学的分析想象成是做一幅画的话,Linux基础知识仅仅...
大佬说,你这自学进度太慢了,先把Linux20题搞定了再详谈。于是赶紧翻出题目来写代码,前面四题半都超easy(毕竟基础到底了),做到第五题的时候终于卡壳了,题干如下: 在任...
折腾了至少5遍,终于搞定,2G用了3分钟,开心~
SRA 数据下载自救指南还在羡慕海峡那边的朋友下载SRA 快到飞起?还在难过用wget 下载数据经常下载不完整?用了官方的下载工具还是慢的不行?这里有一个SRA 下载自救尝试指南供你参考。 需要用到...
什么是正则表达式? 讲真"正则"这个词真的挺抽象,汉语里应该没有这个组合,不知道为什么这样翻译,倒是对应的英文更好理解一些。正则表达式( Regular Expression...
Shell脚本最常见的用途就是文本处理,但是想要处理更多类型的数据,sed和gwak工具是不得不学的。没有真正的处理实际的组学数据实操示例就说这两个工具多么多么重要,总感觉有...
沿着前面的轨迹,接下来是Linux中shell脚本的学习。这对于生信工程师后续处理大量 (海量更合适些) 数据是非常非常重要的,但是同样的,作为一个有点古板的人,对于"脚本"...
@胖嘟手绘小札 哈哈 不是的,我老板很nice的喔~
学生信的那点事之一 - 为什么学生信我是谁 几年前曾在中科院上海生命科学研究院生化细胞所读研,两年半后申请了退学,要说为什么,我只能羞愧地说:因为无知。 几经辗转,最后到诺禾海外部做了一名销售,光阴似箭,快两年...