240 发简信
IP属地:广东
  • 120
    [说人话的统计学·协和八]第四章·上 方差分析(ANOVA)-多组平均数的比较

    注:说人话的统计学系列原连载于协和八微信公众号。本文为笔者的学习笔记,每篇文章标题已加入原文超链接。如侵权请告知。 01 要比较三组数据,t检验还能用吗?| 协和八 多次对同...

  • 120
    推荐算法会使用的模型

    Classification Classification分类的主要目的就是为我们的数据记录打上标签。分类模型主要分为两大类:1.Supervised 2.Unsupervi...

  • 120
    推荐系统算法概览和数据预处理方式

    推荐系统基础知识概览图 在进行推荐系统构建时,我们主要分为四大步:1.基于数据源获取数据 2.对数据进行预处理操作 3.通过相关模型对数据进行分析 4.对分析过后的结果进行转...

  • 抱歉,是我的错。其实,按照公式它应该还要加上之前的value值,也就是-0.75 + (-1)=-0.75

    动态规划(Dynamic Programming)

    区分Continuing Task和Episodic Task 前一节我们已经解释了什么是episode,episode即为从初始的状态到终止状态的整个过程。那么什么是Con...

  • 120
    Web基础

    概述 Web主要由Web服务器和Web客户端组成。Web客户端(浏览器)通过Http协议向Web服务器发送请求,Web服务器接收到请求后便会对该客户端作出回应。 比如:客户端...

  • 120
    策略梯度(Policy Gradient)

    简述 强化学习方法主要分为两类,一类是Model-based,另外一种是Model free,如图所示: 而Model Free中又包含两种方法,其中一种是基于策略的角度考虑...

  • 120
    Deep Q-learning Network(DQN)

    概述 DQN其实是深度学习和强化学习知识的结合,也就是用Deep Networks框架来近似逼近强化学习中的Q value。其中,使用的Deep Networks有两种框架,...

  • 120
    时序差分算法(Temporal-Difference Learning)

    概述 时序差分算法是一种无模型的强化学习算法。它继承了动态规划(Dynamic Programming)和蒙特卡罗方法(Monte Carlo Methods)的优点,从而对...