窦慧明 - 简书

发简信

窦慧明

5
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
5

总资产

IP属地：上海

步闲

基于HBase构建千亿级文本数据相似度计算与快速去重系统
前言随着大数据时代的到来，数据信息在给我们生活带来便利的同时，同样也给我们带来了一系列的考验与挑战。本文主要介绍了基于 Apache HBase 与 Google SimH...

2264 3 2
Lisong

docker 简单入门
docker 部署标签（空格分隔）： docker 系统centos6.8 mini docker 官方文档https://docs.docker.com/engine/i...

678 0 1
火眼0狻猊

GBDT、XGBoost、LightGBM 的使用及参数调优
GBDT 概述 GBDT 是梯度提升树（Gradient Boosting Decison Tree）的简称，GBDT 也是集成学习 Boosting 家族的成员，但是却和传...

33691 1 36
Daisy丶

PySpark笔记(一)：Spark简介与安装
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类H...

21527 0 12
mogu酱

局部敏感哈希LSH(Locality Sensitive Hashing)
原文：http://blog.csdn.net/yc461515457/article/details/48845775?locationNum=1 顶1 踩

9560 0 5
斯坦因和他的狗

python gensim 词向量训练笔记
记录词向量训练过程，备忘（系统ubuntu16、python2.7）涵盖内容：python rar解压、大文件分解、HDF5文件操作、文本预处理(文本编码、分词处理)、多进程...

12790 1 11
bupt_周小瑜

基于LSTM三分类的文本情感分析
背景介绍文本情感分析作为NLP的常见任务，具有很高的实际应用价值。本文将采用LSTM模型，训练一个能够识别文本postive, neutral, negative三种情感的...

63741 6 32
ToeKnee

[NLP] MXnet与TensorFlow的自然语言处理应用
MXnet的学习笔记，这次主要是MXnet和TensorFlow在自然语言处理(NLP)上的应用。关于MXnet中其他应用例子的综述介绍可以看这里[MXnet] Simple...

6649 2 20
lyy0905

Word2vec原理浅析及tensorflow实现
Word2vec简介 Word2Vec是由Google的Mikolov等人提出的一个词向量计算模型。输入：大量已分词的文本输出：用一个稠密向量来表示每个词词向量的重要意...

12120 3 21