1. 基本概念 概念:一般来说,NER的标注列表为['O' ,'B-MISC', 'I-MISC', 'B-ORG' ,'I-ORG', 'B-PER' ,'I-PER'...
1. 基本概念 概念:一般来说,NER的标注列表为['O' ,'B-MISC', 'I-MISC', 'B-ORG' ,'I-ORG', 'B-PER' ,'I-PER'...
1. 常见的函数 re.match函数、re.search函数相比:search函数匹配的是全局的一次,而match是只匹配字符串的开始的一次,如果字符串开始不符合正则表达式...
文本的预处理操作大致分为:去除停用词、映射成索引、补全或截断、随机打乱、加载预训练词向量 1. Stop Words 2. To Word Index 下面的这几条也非常实用...
每年在分类上的paper不断,我主要罗列一些我觉得还行的分类模型吧。 1. Self-Attention based Bidirection LSTM for Text Cl...
0. 安装及环境 a. 下载JDK并设置环境路径 (官网下载pkg文件) b. 下载Spark并设置环境路径 (官网下载tar文件) c. 下载Pyspark (用p...
总的来说,BERT 在预训练时候用到的是以下三个元素:一、 Next Sentence Prediction (NSP) : 按照 [CLS] [token_A] [SEP]...
下面,我主要总结一些在NLP中,尤其结合文本分类的场景任务中,一些Attention思想的重要原理和细节。 1. Soft Attention & Hard Attenti...
1. 通过pkg安装包下载的python,最后安装路径都在 /Library/Frameworks下。 2. 通过 homebrew 安装: 这种方式安装是先将包下载在 /u...
1.添加path 2.终端颜色修改 3. 查询在运行的进程号 4. 查询java_home的路径 5. 查询正在运行的java进程 6. 杀死相关的所有进程