R 处理fastq数据,简单搜索后找到了Biostrings和ShortRead两个包。
但是,如果想自己写函数读入fastq数据呢?我个人处理还是想将其读入后处理为向量或者数据框。
if或者for循环会造成R处理过慢。刚想的思路如下:
- 按行读入为向量x
- 对向量x的索引对4求余,构造一个向量y。该向量与读入数据等长,且内容只有1,2,3,0四个值。
- 对向量y的值,用逻辑值从向量x中可以拆分出4个向量。
- 拆分出的四个向量可以作为数据框的四列,且其顺序都是一一对应。
可以避免直接出现if或者for,可能处理速度会快一些。
就是简单记录个思路,有空再来实现(实现也不会出现在该平台)。
没用链接,这次总不能锁我了吧?