@ioiogoo 谢谢!我找到了用string库的punctuation做匹配,也好用的,等下再试试您的方法。
使用K-means及TF-IDF算法对中文文本聚类并可视化点击查看原文 对于无监督学习来说,聚类算法对于数据挖掘、NLP处理等方向都有着非常重要的地位。常见的聚类算法比如K-means、BIRCH(Balanced Iterativ...
@ioiogoo 谢谢!我找到了用string库的punctuation做匹配,也好用的,等下再试试您的方法。
使用K-means及TF-IDF算法对中文文本聚类并可视化点击查看原文 对于无监督学习来说,聚类算法对于数据挖掘、NLP处理等方向都有着非常重要的地位。常见的聚类算法比如K-means、BIRCH(Balanced Iterativ...
请问去掉标点符号时用到的remove_punc, 是您自己写的方法吗?是否能提供代码呢?
使用K-means及TF-IDF算法对中文文本聚类并可视化点击查看原文 对于无监督学习来说,聚类算法对于数据挖掘、NLP处理等方向都有着非常重要的地位。常见的聚类算法比如K-means、BIRCH(Balanced Iterativ...