240 发简信
IP属地:浙江
  • 倒数第二段,应为“TF的word2vec实现里,词频越大,词的类别编号越小,被采样到的概率越大。”

  • 很棒

    阿里分布式事务解决方案fescar简析

    一、概要 阿里最近开源了分布式事务的解决方案fescar。 Fescar 是 阿里巴巴 开源的 分布式事务中间件,以 高效 并且对业务 0 侵入 的方式,解决 微服务 场景下...

  • 写得很好呀~

    EarlyBird:Twitter 的实时搜索引擎分析

    前言 目前主流的搜索引擎实时性一般都不是很高。对于一般的网站内容,延迟一段时间问题不大,但对于 twitter 这种网站,热点信息会被迅速地发布和传播,对于搜索的实时性要求会...

  • 120
    EarlyBird:Twitter 的实时搜索引擎分析

    前言 目前主流的搜索引擎实时性一般都不是很高。对于一般的网站内容,延迟一段时间问题不大,但对于 twitter 这种网站,热点信息会被迅速地发布和传播,对于搜索的实时性要求会...