[位运算]187. Repeated DNA Sequences

题目:187. Repeated DNA Sequences[Medium]
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACGAATTCCG". When studying DNA, it is sometimes useful to identify repeated sequences within the DNA.

Write a function to find all the 10-letter-long sequences (substrings) that occur more than once in a DNA molecule.

For example,

Given s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT",

Return:
["AAAAACCCCC", "CCCCCAAAAA"].

找出DNA序列中所有长度大于10且出现次数大于1的子串。

方法一:用HashMap存储所有子串,结果:Time Limit Exceeded

class Solution {
    public List<String> findRepeatedDnaSequences(String s) {
        List<String> res = new ArrayList<String>();
        if(s.length() <= 10) return res;
        
        Map<String,Integer> strmap = new HashMap<String, Integer>();
        int i =0;
        
        while( i <= s.length()-10){
            String temp = s.substring(i, i+10);
            if(!strmap.containsKey(temp)){
                strmap.put(temp,1);
                i++;
            }else{
                if(strmap.get(temp) == 1){
                    res.add(temp);
                    strmap.put(temp,-1) ; //had be add to res
                    i++;
                }
            }
        }
        return res;
    }
}

方法二:位运算
Runtime: 63 ms
对于A,C,G,T四个字符其二进制表示为如下,仅有最后三位不同。

A: 0100 0001
C: 0100 0011  
G: 0100 0111  
T: 0101 0100

每一位用1bit表示,10个字符供需要10x3 = 30bit。一个int有32bit,可以表示一个字符串。

注意

0x7ffffff 是 111...1111 , 一共3+6*4 = 27bit位个1
substring 的范围是前闭后开:[0, 10) 取得是->[0,9]

class Solution {
    public List<String> findRepeatedDnaSequences(String s) {
        List<String> res = new ArrayList<String>();
        if(s.length() <= 10) return res;
        
        Map<Integer,Integer> strmap = new HashMap<Integer, Integer>();//substring, 出现次数
        int i =0;
        int mask = 0x7ffffff; //111...1111  一共3+6*4 = 27bit位个1
        int cur =0;
        while( i< 9 ) {
            cur = cur<<3 | (s.charAt(i) & 7); i++;
        }
        //i =9
        while( i < s.length()){
            cur = ((cur & mask) << 3) | ((int)s.charAt(i) & 7); 
            //((cur & mask) << 3) |:取cur的后27位再补3个0,再加上i的三位
            if(!strmap.containsKey(cur)){
                strmap.put(cur,1);
            }else{
                if(strmap.get(cur) == 1){
                    res.add(s.substring(i-9,i+1)); //[i-9, i+1)
                    strmap.put(cur,-1) ; //had be add to res
                }
            }
             i++;
        }
        return res;
    }
}

方法三:
Runtime: 41 ms
在solution里看到的,更快更节约时间。

在set.add(obj)方法里,如果obj已在set中存在,该方法会返回false。

class Solution {
    public List<String> findRepeatedDnaSequences(String s) {
        Set set = new HashSet();
        Set repeat = new HashSet();
        
        for(int i=0; i<s.length()-9;i++){
            
            if(!set.add(s.substring(i,i+10))){
                repeat.add(s.substring(i,i+10));
            }
        }
        return new ArrayList(repeat);
        
    }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,056评论 5 474
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,842评论 2 378
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,938评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,296评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,292评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,413评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,824评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,493评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,686评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,502评论 2 318
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,553评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,281评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,820评论 3 305
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,873评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,109评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,699评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,257评论 2 341

推荐阅读更多精彩内容

  • 与文者字清合作,我上片,他下片 作者/若雪 烟雨打湿了江南 小桥流水弯弯 枝头双鹊呢喃 清风浮动杨柳岸 芷若悠悠 ...
    玉人初上阅读 337评论 15 14
  • 记 一场 跑路时长 长达 相聚时长 提伞 也要约的 会 。 可能怕以后 时间 距离 真的淡了感情 可能 以前经历过...
    _觅小金桔阅读 164评论 1 1
  • 我是一个胖子,一米六五的个儿,体重却超过80公斤。虽然我常在朋友面前自诩心宽体胖,表面上表现得满不在乎,但我心里苦...
    刘芷源07阅读 450评论 9 8
  • 我上学的时候理想的对象是会说俏皮话挑逗人的,有点文艺气质会写诗的,会把白衬衫穿成一道风景线的,干净清新、侧脸英俊的...
    茜喵阅读 1,202评论 3 17