240 发简信
IP属地:贵州
  • 120
    序列到序列模型(seq2seq)

    1. 简介 序列到序列模型其实是使用两个RNN。一个读取输入序列,将读取的序列发送给另一个RNN,接着输出序列。如下图,左侧的RNN叫做编码器,右侧的RNN叫做解码器。 编码...

  • 120
    利用隐马尔可夫(HMM) 进行词性标注

    引言 文章根据udacity自然语言处理进行整理,提供给初学者进行参考。主要围绕隐马尔可夫的基本实现原理和维特比算法进行介绍。 相关参考学习视频: udacity--自然语言...

  • 120
    朴素贝叶斯的垃圾邮件分类器

    引言 文章根据udacity自然语言处理进行整理,提供给初学者进行参考。主要围绕朴素贝叶斯算法的基本原理和使用朴素贝叶斯实现邮件分类。 相关参考学习视频: udacity--...

  • 120
    随机投影与ICA

    引言 文章根据udacity 的机器学习视频进行整理,提供给初学者进行参考,为了降低学习门槛,文中尽量避免了复杂的数学公式,使用比较简单的例子叙述相关原理。如发现错误欢迎指正...

  • 特征选择-PCA

    1. PCA 定义 PCA(主成成分分析)是将输入特征转换为其主成分的系统化方式。这些主成分作为在分类或回归任务中新特征。 主成分的定义是数据中会使方差最大化的方向,它是在对...

  • 特征缩放-MinMaxScaler

    1. 简述 在某些类型的机器学习中,特征缩放是特征处理的重要步骤。在机器学习中 使用RBF的 SVM函数 和 K-均值 算法会受到特征缩放的影响。 2. 特征缩放的必要性 先...

  • 120
    无监督学习-聚类

    引言 文章根据udacity 的机器学习视频进行整理,提供给初学者进行参考。主要围绕几种聚类算法:K-Means、层次聚类、DBSCAN、高斯混合模型聚类(GMM) 几种聚类...

  • 120
    支持向量机-SVM

    引言 文章根据udacity 的机器学习视频进行整理,提供给初学者进行参考,为了降低学习门槛,文中尽量避免了复杂的数学公式,使用比较简单的例子叙述相关原理。如发现错误欢迎指正...

  • 知识图谱-从建模到应用相关知识整理

    引言:文章是针对知识图谱建模到应用的相关知识整理,其中主要包括相关概念、方法、工具、模型、论文等,主要是基于 集智学院--知识图谱 课程进行整理,同时参考部分网络内容和课程。...

  • 120
    5.假设检验

    等级 科学家规定如果样本均值概率小于:5%、1%、0.1% 通常认为不太可能发生。这被定义为水平 等级:

  • 4.中心极限定理

    特定样本在样本均值中分布的什么位置,该分布的标准偏差就等于总体标准偏差除以根号n 。 公式:(n 为样本数量) SE 也被叫做标准误差。

  • 120
    3.归一化-使用Z值

    Z 值是指任何值中距离平均值的标准偏差数。我们可以将正太分布中的任何值转换为Z值。 公式:

  • 120
    2.差异性-方差和标准偏差定量分析数据

    1. 计算公式 ---> 数据集合中的某个值 ---> 均值 n ---> 总体数量 离均差:每个数值与数据集均值之间的差,可能存在负数。常用于衡量数值之间的差异性。 ...

  • 2.差异性

    1. 四分位数 1.1 简述 四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。多应用于统计学中的箱线图...

  • 120
    1.集中趋势

    把握问题的核心才是当务之急。 (推荐学习书籍:《深入浅出统计学》笔者根据自身学习总结书中内容。部分图采制书中) PDF 版统计学下载:https://pan.baidu.co...