本节课主要将两件事情: 1. Pytorch 搭建分类神经网络 2. 神经网络基本架构 --- 0 项目准备: 这里先下载数据,这里主要是下载手...
这节课主要解决两个问题 - 验证集的大小如何设定? - 训练集中有些类别数据量太小怎么办? 验证集的大小如何设定? 这里有个简单的方法来验证。 ...
今天介绍从两个角度来介绍机器学习的商业领域的产品应用: - 横向领域:在不同类型的业务中执行的操作。即涉及营销的一切。 - 垂直领域:在企业内部...
这节课我们主要讲讲: 1。OOB 和 validation 的数值计算上区别 2。时间序列模型建立时,如何处理 validation 和 tes...
“当模型建立后,如何解释和分析模型,往往是科研中必不可很少的一部分。机器学习模型往往被成为黑箱子,如何在传统领域的分析方法上进行一定解释,是我们...
1. nan 的处理 先讲一个真事: 在 Kaggle 的一个竞赛里面,是要求预测哪些大学的基金项目会得到批复而那些不会。随后一个参赛者通过其中...
“本文通过 Python 代码实现的方式来来介绍具体的实现。 以 Python 为基础,调用各种比较基础的库,其中穿插一些Kaggle处理的建议...
“本文内容的诉求为实用、易上手,所以理论的内容以及公式只做少量的解释,并不着重涉及。“ 本节内容:1。评价函数 —— 如何评价模型的好坏2。测试...
随机森林 RF 在 Kaggle 大名远播,称霸很久。 那么,我们这里就先聊聊原因。以下分析来自 University of San Franc...