Markdown是一种纯文本格式的标记语言。通过简单的标记语法,它可以使普通文本内容具有一定的格式。 相比WYSIWYG编辑器 优点:1、因为是纯文本,所以只要支持Markd...
Markdown是一种纯文本格式的标记语言。通过简单的标记语法,它可以使普通文本内容具有一定的格式。 相比WYSIWYG编辑器 优点:1、因为是纯文本,所以只要支持Markd...
今天开箱树莓派,从树莓派下载NOOBS下载超级慢,花了一夜下载下来。现附上百度云,有需要的可以提取。 包括NOOBS和SDCardFormatterv5_WinEN.zip,...
该模型假设一篇文章是由多个分布所产生的。此处,模型简化为由一个主题分布和一个背景词分布。 接下来需要求出模型的各个分布的参数,课程在这里假设其他参数已知,只有主题分布中的各单...
发现K个主题 计算每个文档包含哪些主题 此处引入了单词集,用来计算各主题的词分布。 通过调整模型的参数,使得生成数据的条件概率最大。 可以用最大似然法或贝叶斯估计找到最优值。...
文本表示有很多种,不同的种类对应着不同的应用场景和算法。 基于单词的表示方法有如下几个好处 通用性和鲁棒性:可以应用于多种自然语言 不需要太多人工操作 很多应用中能有很好的效...
要想了解LDA背后的算法原理,我们首先要有一定的数学基础,这一节,我们一起来学习LDA算法中涉及的一些基础的数学知识。 1、gamma函数 所谓的gamma函数其实就是阶乘的...
1. 近似算法 t 时刻最有可能的状态,这个公式取值最大的 i 2. 维比特算法 t 时刻状态为 i 的最大概率(在该模型下,观测序列为O,且t 时刻状态为 i ,使得概率最...
1.1 监督学习方法 已知S个长度相同的观测序列和对应的状态序列,可以通过极大似然估计法。频率算概率:转移概率,观测概率,初始状态概率 1.2 Baum-Welch算法(非监...
1.1 直接计算法 由于已知马尔可夫模型参数和观察序列,所以有 模型产生某一状态序列的概率 模型产生某一状态序列时得到某一观测序列的概率 上面两概率可求得,在该模型下,产生状...
1. 马尔可夫模型 特征: 有限历史假设该随机变量的概率,只取决于前面一个随机变量 时间不变性时间变化不影响各随机变量的概率 但是n-gram模型是马尔可夫模型的特殊情况,n...
所谓搭配,感性理解可以认为搭配就是自然语言中经常联合一起使用的词。比如我们小学英语经常被的词组等,这章讨论的问题便是如何通过一些技术手段找到常用搭配。 1. 频率 最简单的方...
在香农的信息论里面,把信息本身看成是一个随机变量,因此要量化信息,自然就是同随机变量的概率以量化。 关于熵的数理运算完全可用概率来理解,依然讲究变量之间的相互独立,同时概率之...
算法过程 N个训练样本,M个特征 选定特征数目m作为每个决策树的特征,m<<M 训练多个决策树(两个随机性)训练集随机从数据集有放回抽样,得到与数据集一样大的训练集(每抽完就...
1. 直接插入 基本思路:不断地把 指针 i 指向的关键字插入到前面的有序序列,然后 i 指向无序序列的第一个关键字 指针 i 指向第一个关键字 指针往后移一位 指针指向的关...
6.1 查找算法_基础 顺序查找(1)排没排序查找没区别(2)遍历设置没找到的标志(3)ASL(成功,不成功) 折半查找(1)ASL公式(2)判定树 分块查找(1)ASL(2...
1. 查找基本概念 查找:只有两种情况,查找成功,查找失败 查找表:查找的数据集合称为查找表 静态查找表 / 动态查找表:区别在于是否只进行查找,还是需要插入,删除处理。 平...