240 发简信
IP属地:北京
  • python udf 函数使用

    参考资料 用python实现Hive中的UDF函数 1.创建表 ——hive窗口或者命令行 2.加载数据 文件路径为服务器上的路径 只能在hive命令行运行,客户端不能使用 ...

  • @豪门百里 👍👍

    RNN及其在NLP中的应用

    神经网络基本理论 人工神经网络本质是用机器函数拟合的过程(输入→拟合函数→输出)模拟人脑学习的过程(现象→内在规律→知识),其基本结构如下图: 其具有如下特点: •神经元及其...

  • 您好,就是普通的文本,任意文本就可以。里面有去空白字符和切词的过程。如果还有什么不明白的可以私信我,加油

    文本向量化方法比较:tf-idf、doc2bow、doc2vec、lsi、lda

    先放个代码和结果,改天闲了总结。用余弦距离计算相似度以判断向量化效果tf-idf、doc2bow稀疏,适合短文本doc2vec效果时好时坏,偶然性大,不稳lsi、lda效果好...

  • NLP体系导览

    自然语言处理(NLP) 数学基础 概率论条件概率、联合概率与独立全概率公式与贝叶斯公式信息熵马尔科夫过程 图论贝叶斯网络马尔科夫链条件随机场 统计学tf-idf常用分布正态分...

  • 已经换成了Echarts,java web交互.....

    可视化,字字网络

    现有方法是用Matlab生成邻接矩阵然后导入到Gephi画图,里面有手工成分,另外节点布局只能依赖Gephi的自带函数。我要做的就是实现完全自定义,和完全自动化。 也就是说,...

  • 文本向量化方法比较:tf-idf、doc2bow、doc2vec、lsi、lda

    先放个代码和结果,改天闲了总结。用余弦距离计算相似度以判断向量化效果tf-idf、doc2bow稀疏,适合短文本doc2vec效果时好时坏,偶然性大,不稳lsi、lda效果好...

  • 120
    RNN及其在NLP中的应用

    神经网络基本理论 人工神经网络本质是用机器函数拟合的过程(输入→拟合函数→输出)模拟人脑学习的过程(现象→内在规律→知识),其基本结构如下图: 其具有如下特点: •神经元及其...

  • 120
    可视化,字字网络

    现有方法是用Matlab生成邻接矩阵然后导入到Gephi画图,里面有手工成分,另外节点布局只能依赖Gephi的自带函数。我要做的就是实现完全自定义,和完全自动化。 也就是说,...