在之前的闲聊对话语料中提到,爬取了400w+新闻语料训练word2vec,考虑到这个平台数据质量比较高, 但是爬取的时候又有频率限制、网页打开慢、甚至有时候需要多次访问才...
IP属地:北京
在之前的闲聊对话语料中提到,爬取了400w+新闻语料训练word2vec,考虑到这个平台数据质量比较高, 但是爬取的时候又有频率限制、网页打开慢、甚至有时候需要多次访问才...
命名实体识别在越来越多的场景下被应用,如自动问答、知识图谱等。非结构化的文本内容有很多丰富的信息,但找到相关的知识始终是一个具有挑战性的任务,命名实体识别也不例外。 前面我们...
Github地址:https://github.com/1234560o/Bert-model-code-interpretation.git Contents 前言 模型输...
最近一直在研究文本检测方向的内容,把最近看的论文整理一下。近期有时间会把所有的写完,写一个综述。 基于文本框的坐标回归的方法 CTPN: Detecting Text in ...