摘要
测了拟南芥整个生长阶段的来自27个不同组织或器官的小RNA。对测序数据进行分析之后发现大多数的miRNA普遍存在,然而有少数的miRNA是特异表达的。相同miRNA家族的不同成员有特异的时空表达模式。还发现在不同的发育阶段,相同发卡前体的不同臂都能产生miRNA。
INTRODUCTION
- 小RNA的分类,有什么作用(转录后调控),以及发生过程(miRAN如何从前体发展到与AGO蛋白结合到形成RISC复合物);
- miRNA与miRNA star由同一发卡结构的两条臂产生,通常miRNA star在形成后会被迅速降解,但已有研究表明在不同的组织和阶段,miRNA star会积累和起作用—— arm switching;
- 提到了三个相关的数据库:
PMRD: plant microRNA database, 和PNRD一样都是中农做的;
mirEX 2.0: expression profiling of plant microRNAs;
PmiRExAt: plant miRNA expression atlas database; - 共计353,686,537 reads,得到了全面的miRNA及一些突变体
- 基于观测到的结果,猜想miRNA双链体的两条链可能都有重要作用。
MATERIALS AND METHODS
我先看的方法部分,再看的结果和讨论部分。计划将文中的分析部分重复一遍。
1. Plant material and growth conditions
每个处理两个生物学重复,在一个生物学重复中还可能存在两到三个技术重复。
2. Small RNA library construction and deep sequencing
3. Bioinformatic analysis of sRNAs
在过滤掉低质量的reads和接头之后,将18-28nt的reads用bowtie比对到拟南芥的参考基因组(TAIR10)。不允许错配,且排除那些比对到产生rRNA-, tRNA-, snRNA-, snoRNA的区域的reads。S-plots (small RNA plots)用于评估这些miRNA位点。
拟南芥成熟miRNA和miRNA前体序列从miRBase数据库下载。miRNA和miRNA star的丰度用RPM标准化。
用R中的相关系数函数cor()计算cluster之间的相关系数并画出聚类树状图。计算中RPM取log2的值。
arm switching事件的研究是通过miRNA/miRNA*的值取log2()后作图来看的。
4. Small RNA Northern blot
Northern blot
:是一种通过检测RNA的表达水平来检测基因表达的方法,通过northern blot的方法可以检测到细胞在生长发育特定阶段或者胁迫或病理环境下特定基因表达情况。此处的基因包括编码及非编码蛋白基因。
UV cross-linked
:254nm紫外辐射系统,主要用于将核酸交联于膜上。尼龙膜上固定核酸的方法不限于烘烤,将吸印后的膜置于紫外灯下照射片刻也能使核酸与膜产生共价交联。
提取出的小RNA用15% SDS-PAGE的凝胶分离,后转移至Hybond-N+膜上,这种是紫外交联的,并且杂交了末端标记有P32的寡核苷酸探针。探针序列如下:
5. Accession numbers
GSE79414
总的来看,以上方法部分较简单。重复出来的难度应该不大。
RESULTS
1. 拟南芥中小RNA的特征
先是求出生物学重复之间的皮尔逊相关系数,接近1,说明强相关性,以此说明好的可再现性和建库测序质量。
接着做了各个组织中小RNA长度的分布柱形图,21,24nt的小RNA最多,符合先前的发现,分别对应miRNA和hc-siRNA。在不同的组织和阶段,二者又有比例高低的变化。在花组织中,hc-siRNA比例比miRNA高很多。子叶,幼叶,茎叶中,miRNA比例略高于hc-siRNA。
然后分析了在不同组织中,21nt和24nt小RNA的5’的起始碱基,发现21-nt sRNA倾向于以U开始,24-nt sRNA倾向于以A开始。而5'的碱基与AGO蛋白的结合有关。
2. 分析拟南芥中产生miRNA的基因
目的是评估miRBase数据中已记录的,以及发现新的。
如何评估呢?其实就是比对到已有的前体序列上。上图就是一个例子,横轴为碱基位置,纵轴为标准化的reads数。可以看出miRNA明显比miRNA*要多。
文章紧接着说到依据其数据将之前判定为miRNA基因的cluster重新认定为siRNA基因的cluster。基于两个标准:sRNA丰度比,链比。丰度比:在一个cluster上两个主要小RNA丰度/所有小RNA丰度的比值;链比:比对到一条链上的reads数/比对到两条链上的reads数。miRNA和miRNA*来源于一条链的折叠,因此链比接近1;而siRNA来源于两条链,链比接近0.5(之前分享的文献中判定phasiRNA也用到了链比这个标准)。
那这两个阈值如何界定呢?
文章又比较了保守miRNA和非保守miRNA的这两个指标。
最终分别选了0.63和0.8作为阈值。到这儿我有个疑问:区分siRNA-like cluster和miRNA,为何要比较保守和不保守miRNA?
3. miRNA表达的整体分析
miRNA表达量的计算,之前简单写过一篇笔记:计算已知miRNA的表达量
热图的绘制也有一篇笔记:用pheatmap画个热图
B图表示的是miRNA表达模式相似的样本聚为一类。
因为图B的聚类结果非常好,因此文章得出结论:miRNA表达差异更多得由组织差异贡献,发育阶段的差异贡献相对小。
68%保守miRNA在所有样本中表达,仅7%在低于25个样本中表达,这与非保守miRNA明显不同。事实也是如此:很多基础的生命活动由保守miRNA调控,如营养代谢,激素信号传导(nutrition metabolism and hormone signaling)。
探究发育阶段特异性对miRNA表达的影响,并做了Northern blot验证,验证结果与生信分析结果一致。
接下来做了萼片,花瓣,雄蕊和雌蕊四个花组织的表达分析。找了107个有差异的miRNA,并聚类为四类。结果表明雄蕊中,特异表达的miRNA最多。
随机挑了一些miRNA做Northern blot,来比较四个组织中miRNA的差异表达。miR776, miR771都是22nt的,又因为“22-nt的miRNA适合trigger phasiRNA的生成”,因此,文章觉得,雌蕊发育需要secondary siRNA (应该和phasiRNA差不多)。
4. 相同miRNA家族的不同成员显示了组织间的表达差异
如下图:
接着以miR156家族为例,绘制了其成员对应的loci的分子进化树
然后是成熟序列的比较,其中miR156h变异太多,影响了与原本可以结合的mRNA的结合,进而影响(启动)mRNA的功能。
接着是不同家族成员的差异表达分析及验证
从AtGenExpress expression atlas获取了SPL这几种转录因子的表达水平,如下图,Stamens,Carpels中SPL3表达水平有差异,可能就是C图Stamens,Carpels组织的miR156不同带来的。
5. 不同组织和发育阶段的Arm switching事件判定
这部分内容较简单,就是比对的时候记录清楚miRNA和miRNA*上的reads数即可。比值从>1变为<1或是从<1变为>1就是Arm switching事件。需要注意的是,文章在这里并没有取1为阈值,为了避免background fluctuations,文章选择了1.2和0.8作为界定值。