一、给定需求下,判断使用哪个模型进行文本分类。 1、 首先判断是线上环境还是离线环境?(线上环境指,模型放到线上,有实时要求,要小于50ms,一...
决策树:机器学习一种具有树状结构的算法,树中每个内部节点表示一个属性的判断,每个分支代表一个判断结果的输出,最后每个叶节点表示一种分类的结果。 ...
支持向量机:监督学习,二分类算法,线性分类器。 假设数据线性可分,svm找到合适的决策分界面和边界分界面,将两个类别最大限度区分开来。SVM尽可...
随机森林:是一种集成学习,由多个弱监督模型组成,每个弱监督模型在某个方向表现比较好。 随机森林是通过集成学习的思想,将多棵决策树进行集成的算法。...
textcnn一般用于文本分类。 1、TextCNN的网络结构 (1)embedding层,嵌入层 嵌入层使用word2vec或者glove(无...
一、线性回归1、线性回归假设目标值与标签之间是线性关系,采用最小二乘法(MSE均方差)找到一个最好的模型来拟合数据。y=wx+b. 损失函数: ...
1.什么是语言模型? 语言模型是描述自然语言概率分布的模型,是一个非常基础和重要的自然语言处理任务。利用语言模型,可以计算一个词或者一句话的概率...
一、HMM是概率图模型的一种,属于生成模型。HMM模型描述的就是从隐状态生成可观测状态的过程。 HMM有两个基本假设:1、马尔科夫假设:第t个隐...
fasttext用于训练词向量和文本分类。fasttext采用c-bow模型,融合了词的n-gram和subword信息,并采用了层序softm...