参考生信技能树1以及生信技能树2只记录从数据下载,到最终结果展示,具体生物学知识请自行查阅稍后关于ChIP-seq的背景知识我会再发布一篇文章。数据下载:数据存放地址关于环境...
原文:http://521cto.blog.51cto.com/950229/945683 利用awk自身变量NR和FNR来处理多个文件2012年 07月 27日 星期五 2...
简写 RPKM: Reads Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的rea...
在硕士就读期间,就已经做过 GWAS 相关的分析。当时标记量非常少, windows 系统分析就足够了,作图方面涉及的脚本也基本是蔡师兄帮写的。后来,随着高通量测序成本的降低...
1 什么是motif分析 在DNA或蛋白的同源序列中,不同位点的保守程度是不一样的,一般来说,对DNA或蛋白质功能和结构影响比较大的位点会比较保守,其它位点则不是很保守。这些...
clusterProfiler 是业界大神Y叔写的一个R包,可以用来做各种富集分析,如GO、KEGG、DO(Disease Ontology analysis)、Reacto...
理解ChIP-Seq 到了目前这个水平,我学习新的高通量数据分析流程时已经不再考虑代码应该如何写的问题了。我更多要去考虑一个技术的目的和意义。 转录组主要研究的问题是基因在不...
total RNA-seq(whole-transcriptome sequencing全基因组测序): 对于所有RNA分子进行测序(编码区,非编码区) 但如果我们只关注编码...
背景 当处理临床样本的数据框时,列名是样本名(SID),而有些样本可能来源于同一病人,我们希望将来源于同一病人的数据进行整合(本例为求平均),变为一列,由此生成一个列名为病人...
为了查找某个研究领域的相关信息,生物学家往往要花费大量的时间,不同的生物学数据库可能会使用不同的术语,好比是一些方言一样,这让信息查找更加麻烦,尤其是使得机器查找无章可循。G...
转录调控的信息学分析 0. 引言 1. 转录因子结合位点的信息学预测方法 大量的实验证据表明,TFBS的长度一般在6~12bp之间。 然而,ChIP-chip技术的分辨率在2...