写入json 文件test_feature.json内容: 中文的写入 json.dump需要加上ensure_ascii=False参数。否则...
摘自 https://zhuanlan.zhihu.com/p/21441807[https://zhuanlan.zhihu.com/p/21...
Shallow parsing 又叫Chunking(分块)是介于词性标注和Constituency parsing 之间的一种浅层分析方法。用...
Type Token Ratio (TTR): 一种有用的衡量复杂性的方法,它记录词汇丰富程度或词汇的多样性。 Token 形符:文章所用单词总...
在用sklearn训练了模型之后,需要保存模型,以便日后使用。下面介绍了关于如何持久化sklearn模型的方法。 可以使用python自带的pi...
Specializing Word Embeddings (for Parsing) by Information Bottleneck 来源:...
假设有两种语言L1和L2,L1既有大量无标签数据又有下游任务的监督数据,L2只有大量无标签数据,整个流程可分为一下四步: 在L1无标签的数据集上...
最长回文子串 leetcode 5[https://leetcode-cn.com/problems/longest-palindromic-s...
快慢指针的在leetcode的问题中有很多应用,例如通过一次遍历找到链表的中间节点。 这里要介绍的是作为哨兵,应用于数组或者链表中删除特定元素,...