240 发简信
IP属地:北京
  • 海量文本去重simhash算法(python&scala)

    1.python(Numpy实现) 具体公式见reference中的论文。 短文本,如果文本很短,可以直接调用simhash_simmatrix_doc,直接读入字符串即可产...

  • 240
    十八岁,半夏锦年

    散落一地 流离 回忆不起 青石板长巷的雨季 独自撑伞 没有你陪伴的故地 簌簌樱花 零落成思绪 一场雨 让我离开这里 出其不意 燕啄泥 诉说那十八岁半夏锦年 未完的结局 风萧萧...

  • 240
    那年夏天

    那年的夏天,我们拎起书包 无奈的走向,复习班的怀抱 幻想一年后,大学生活的逍遥 寂寥与苦恼,我们一起去熬 月光下,漫步操场,有人和心爱姑娘倾诉着衷肠 听着歌,踏进流年,哼出那...

个人介绍
《推荐系统开发实战》作者,「搜索与推荐Wiki」公号负责人,原京东算法工程师,CyanScikit科技创始人。