每周文献-190419-植物单细胞BAM重比对以及假基因研究

A Single-Cell RNA Sequencing Profiles the Developmental Landscape of Arabidopsis Root

DOI(url): https://doi.org/10.1016/j.molp.2019.04.004

发表日期：April 17, 2019

关键点

国内首篇植物相关单细胞文章，两个一作还都很熟。

参考意义

植物单细胞的阶段要开启了，今天提到的这篇文章是国内首篇，也是世界范围内的第四篇植物单细胞文章。除此之外，还有几篇已经在bioRxiv上上线了，不过还没有正式发表。这些文章都不约而同选择了植物中研究最广的模式之物拟南芥，而且全部研究的是根尖。后面在发展就要看看其它组织和物种的情况了。

如果一个东西在植物里已经出现要快速增长的趋势，那么它在人和动物里应该也就已经相对比较成熟了。此时，即便暂时还用不到，但是相关的技术和方法就需要留意和学习起来。

在这篇文章中，作者在单细胞水平揭示了拟南芥根尖细胞的异质性重构了根尖分生组织细胞的发育轨迹。按照文章的说法，成功拿到了 7695 个根单细胞转录组数据。聚类后根细胞被划分为24个细胞类群，细胞类群注释分析鉴定了一些潜在的新细胞类型，并找到了一批细胞类型标记基因。

用 t-SNE 和 UMAP 重构了根发育的基本轨迹，实现了根分生组织细胞分裂和分化在单细胞水平上的准确投影。进一步利用伪时间（pseudo-time）分析，捕获了根尖分生组织细胞的分化轨迹和过渡态细胞，解析了根分生组织细胞如何通过协调细胞分裂和分化进程逐步形成根尖不同细胞类型的分子机理。此外，通过分析细胞类群对离子吸收和激素响应情况，揭示了不同根细胞类群的响应热图。该研究加深了我们对拟南芥根细胞组成和发育轨迹的认识，将根发育生物学从原先的组织器官水平提升到了单细胞水平。

(上面这一段话主要来自官方报道，具体的细节需要仔细读完文章在分享)

Benchmarking of alignment-free sequence comparison methods

DOI(url): https://doi.org/10.1101/611137

发表日期：April 16, 2019.

关键点

有哪些 alignment-free (AF) 相关的工具，以及如何评价。

参考意义

AF 类的工具，在转录组分析层面使用最多的是定量分析。例如 salmon 和 kallisto，主要原理就是基于对kmer的各种操作。其实除了转录组的快速定量

这篇文章比较详细的介绍了目前主要 AF 相关工具的原理和工具。同时，作者使用了24个相关软件的74种方法，测试了五种应用场景，分别是：

protein sequence classification
gene tree inference
regulatory element detection
genome-based phylogenetic inference
reconstruction of species trees under horizontal gene transfer and recombination events

作者还提供了一个在线工具，用来展示这些结果。

Bazam: a rapid method for read extraction and realignment of high-throughput sequencing data

DOI(url): https://doi.org/10.1186/s13059-019-1688-1

发表日期：18 April 2019

关键点

bam 文件似乎可以方便的回滚了

参考意义

随着参考基因组的更新和比对方法的更新，很多之前的bam文件似乎就变得过时了。除了找出原始的fastq文件再重新来过一次，现在有了另一个选择。
bazam 首先可以从bam或者cram文件直接找到pair reads 在比对回其它参考基因组而不需要中间步骤；也可以按需要提取过滤后的reads，例如与特定基因位置有overlap的reads。结果可以直接传到下游工具，或以fastq格式存储以供进一步处理。另外还从read 这个input层面提供了多线程比对的思路。加快了比对速度。

整体而言，和目前已有的一些可以转换bam文件的工具相比，其在内存和存储占用，已经方便程度上都有优势。

目前我的问题是很多时候会对原始bam文件进行一波过滤，这个时候已经丢掉了很多fastq的reads。

Tool	Storage used	Memory	Effective Cores	Time
Sort-Extract-Realign	282 GB	20 GB	16	13 h, 15 min
Picard SamToFastq	148 GB	78 GB	16	16 h, 14 min
Biobambam bamtofastq	149 GB	30 GB	16	15 h 30 min
Bazam (no sharding)	68 GB	28 GB	16	14 h, 55 min
Bazam 10-way sharding	102 GB	20 GB	160	1 h, 11 min

Evolutionary Origins of Pseudogenes and Their Association with Regulatory Sequences in Plants

DOI(url): https://doi.org/10.1105/tpc.18.00601

发表日期：March 2019

关键点

在我看来，假基因和lncRNA这类非编码RNA其实大多数是定义方式不同，重合度不低。

参考意义

假基因（Ψs）一般是和功能基因的序列相近的非功能性基因，通过复制或逆转录方式形成，通常会含有各种突变导致基因功能的丧失。在这篇文章中，作者检查了七种被子植物（拟南芥，短柄草，大豆，苜蓿，水稻，杨树和高粱）假基因的起源，进化和表达模式及其与非编码序列的关系。作者鉴定了大约 250,000 个假基因，发现非常大比例的非转座因子调控非编码RNA（microRNA和lncRNA）起源于假基因近端上游区域的转录。还发现与随机基因间区相比转录因子结合位点优先发生在假基因近端上游区域，这表明假基因可能通过提供用作启动子和增强子的转录因子结合位点来调节基因组进化。

假基因定义流程：

假基因鉴定情况

相关内容

主要鉴定步骤

(1) identify intergenic regions (masked genic and transposon regions) with sequence similarity to known proteins using exonerate;
(2) quality control, identity ≥ 20%, match length ≥ 30 amino acids, match length ≥ 5% of the query sequence, and only the best match is retained;
- exonerate --model protein2genome --showquerygff no --showtargetgff yes --maxintron 5000 --showvulgar yes --ryo \"%ti\\t%qi\\t%tS\\t%qS\\t%tl\\t%ql\\t%tab\\t%tae\\t%tal\\t%qab\\t%qae\\t%qal\\t%pi\\n\".
(3) link homologous segments into contigs (set I Ψs);
(4) realign using tfasty to identify features that disrupt contiguous protein sequences
- tfasty34, with parameters -A -m 3 q
(5) distinguish WGD-derived Ψs and set II Ψs.
- MCScanX -k 50 -g -1 -s 5 -m 25

以及

PlantPseudo

扫码即刻交流

最后编辑于：2019.06.28 08:56:22

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,905评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,140评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,791评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,483评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,476评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,516评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,905评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,560评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,778评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,557评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,635评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,338评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,925评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,898评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,142评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,818评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,347评论 2赞 342

每周文献-190419-植物单细胞BAM重比对以及假基因研究

A Single-Cell RNA Sequencing Profiles the Developmental Landscape of Arabidopsis Root

关键点

参考意义

相关内容

Benchmarking of alignment-free sequence comparison methods

关键点

参考意义

相关内容

Bazam: a rapid method for read extraction and realignment of high-throughput sequencing data

关键点

参考意义

相关内容

Evolutionary Origins of Pseudogenes and Their Association with Regulatory Sequences in Plants

关键点

参考意义

相关内容

推荐阅读更多精彩内容