一、背景 最近在做一个简历语料的训练,对简历中的关键信息进行标注(标注出应聘者的技能、专业等内容),已经有了大量的已经标注好的语料,之前是用crf++进行训练,后来迁移到cr...
IP属地:重庆
一、背景 最近在做一个简历语料的训练,对简历中的关键信息进行标注(标注出应聘者的技能、专业等内容),已经有了大量的已经标注好的语料,之前是用crf++进行训练,后来迁移到cr...
我好像最近也遇到这个问题了,词典里只有一万六千多个词也出现分词问题了,问下LZ有解决方式了吗
pkuseg的自定义词库过大会导致出现严重的分词BUG?1.背景说明 【前情提要】 怀着异常激动的心情测试了一下北大刚发布的中文分词库,然后加载了之前整理的自定义词汇,发现出现了很严重的分词问题,希望有人能帮忙解决。 2. 上代码...