CristianoC - 简书

发简信

CristianoC

4
关注
29
粉丝
83
文章
134965

字数
18

收获喜欢
0

总资产

IP属地：广东

CristianoC

深度强化学习落地指南总结（一）-需求分析
本系列是对《深度强化学习落地指南》全书的总结，这本书是我市面上看过对深度强化学习落地讲的最好的一本书，大大拓宽了自己对RL落地思考的维度，形成了强化学习落地分析的一套完整框架...

4770 0 1
CristianoC

virtualenv使用说明
用PPO要用tensorflow_proballity 自己电脑是tf1.x 没法顺利安装所以要用虚拟环境一般就是进入venv的bin目录下 source activat...

1693 0 0

CristianoC

机器学习中的频率派和贝叶斯派-以极大似然估计和最大后验估计为例
这是一个新的系列，会整理一下以前在ipad上写的笔记。前言把概率引进到机器学习当中是一件很自然的事情，许多机器学习当中问题的本质都可以从概率中的频率派（Frequenti...

4410 0 1
CristianoC

强化学习算法总结（一）——从零到DQN变体
这是新开的一个系列，将结合理论和部分代码（by ElegantRL）介绍强化学习中的算法，将从基础理论总结到现在常用的SAC,TD3等算法，希望能帮助大家重温知识点。本文是第...

5918 0 4
CristianoC

@小火车程序员细节写多是为了方便大家感谢认可

全面解析可变形卷积家族（Deformable Convolutional Networks v1+ v2）
目录 DCN v1 DCN v2 参考 DCN v1 背景在计算机视觉领域，同一物体在不同场景，角度中未知的几何变换是检测/识别的一大挑战，通常来说我们有两种做法: (1)...

CristianoC
12558 4 0
CristianoC

@简简单单0828 插值没必要讲了吧都用DCN的人了不至于插值都不会把

全面解析可变形卷积家族（Deformable Convolutional Networks v1+ v2）
目录 DCN v1 DCN v2 参考 DCN v1 背景在计算机视觉领域，同一物体在不同场景，角度中未知的几何变换是检测/识别的一大挑战，通常来说我们有两种做法: (1)...

CristianoC
12558 4 0
CristianoC

深入浅出解读并思考AlphaGo
本文是对2016年发表在Nature的<< Mastering the game of Go with deep neural networks and tree searc...

4183 0 0

CristianoC

蒙特卡洛积分与重要性采样
重要性采样在强化学习有着重要作用,它是蒙特卡洛积分的一种采样策略. 目录概率论基础蒙特卡洛积分重要性采样参考概率论基础本文先补充两条基础的概率论公式,方便大家更好...

5561 0 0
CristianoC

强化学习之蒙特卡洛学习,时序差分学习理论与实战(四)
前言上一讲讲解了如果应用动态规划算法对一个已知状态转移概率的MDP进行策略评估或通过策略迭代或直接的价值迭代来寻找最优策略和最优价值函数,同时也指出了动态规划算法的一些缺点...

3723 0 0
CristianoC

强化学习之动态规划寻找最优策略理论与实战(三)
前言本讲将着重讲解如何利用动态规划(Dynamic programming)来解决强化学习中的规划问题。"规划"是指在已知环境动力学的基础上进行评估和控制,具体来说就在了解...

4032 0 0
CristianoC

强化学习核心之马尔科夫决策过程理论与实战(二)
前言本讲将从基础的马尔科夫过程开始讲解,到马尔科夫奖励过程,马尔科夫决策过程,最后也会用代码巩固这部分理论. 目录马尔科夫过程马尔科夫奖励过程马尔科夫决策过程编程实...

3180 0 0
CristianoC

强化学习总体介绍-初步搭建强化学习理论体系(一)
前言两年前接触强化学习是通过莫烦的课程,那时候对强化学习整体有一个基础的认识,最近听了David Silver的课程后又建立起了完整的强化学习体系,故连载David Sil...

4292 0 0

CristianoC

离散数学
偏序：在整数集中定义偏序：若a能整除b，我们就记为a≺b显然它满足序公理。但整数集中，不是任何两个数都存在整除关系，这个关系是局部的（partial），太“偏颇”，于是被称为...

2669 0 0
CristianoC

数据库三大范式
第一范式(确保每列保持原子性，即不能分解，比如生日年月日就可以继续分解)第二范式(确保表中的每列都和主键相关，不能存在部分依赖，学分依赖课程号，姓名依赖与学号，所以不符合二范...

1342 0 0
CristianoC

数据库
原子性（Atomicity）: 事务要么全部完成，要么全部取消。如果事务崩溃，状态回到事务之前（事务回滚）。隔离性（Isolation）: 如果2个事务 T1 和 T2 同...

1360 0 0
CristianoC

计算机网络
因特网由边缘部分和核心部分组成，边缘部分由主机组成，由用户直接使用，核心部分由大量网络和连接这些网络的路由器组成。 C/S是客户/服务器方式，运行在一个端系统上的客户进程总是...

2865 0 0
CristianoC

AVL
AVL是平衡二叉树，有两个特点 1.左右子树的高度差小于等于 1。（平衡因子绝对值不超过1）2.其每一个子树均为平衡二叉树。平衡的操作有两种：左旋和右旋，这两种操作也是左右...

1643 0 0

CristianoC

动态规划
动态规划分为三步：定义数组元素含义，找到初始值，写状态转移方程，做多基本就没啥问题了，当然都会做之后还涉及到一个优化问题。最大序列和最长上升子序列判断在某个数前面是不是...

1135 0 0
CristianoC

判断链表有环
1、快慢指针：比如设置一个慢指针一次走一步，一个快指针一次走两步，两个指针同时开始走，如果在某个时刻，快慢指针相遇了，代表快指针“走回来了”，所以就是有环的。时间复杂度是o(...

1616 0 0
CristianoC

全面解析可变形卷积家族（Deformable Convolutional Networks v1+ v2）
目录 DCN v1 DCN v2 参考 DCN v1 背景在计算机视觉领域，同一物体在不同场景，角度中未知的几何变换是检测/识别的一大挑战，通常来说我们有两种做法: (1)...

12558 4 0