本分析基于GBDT系的算法和个人信用模型 1. 样本不均衡(标签不均衡) 1.1 问题描述 假设x∈Rn,y∈{0,1}。所谓样本,就是在特征空间Rn中分布着一堆0和1。所谓...
本分析基于GBDT系的算法和个人信用模型 1. 样本不均衡(标签不均衡) 1.1 问题描述 假设x∈Rn,y∈{0,1}。所谓样本,就是在特征空间Rn中分布着一堆0和1。所谓...
“神策杯”2018高校算法大师赛是一个只能高校在校生solo的单人赛。神策数据提供了10万篇左右资讯文章的标题以及正文,其中一千篇文章有对应的标注数据。标注数据中每篇文章的关...
上一篇总结简单地阐述了IJCAI-18阿里妈妈搜索广告转化预测大赛的初赛做法和心得总结,这一篇主要是针对复赛进行总结。对于初赛和复赛,每一条数据样本的格式其实是一样的,最大的...
上一篇文章:关于《注意力模型--Attention注意力机制》的学习是对注意力模型的理论知识进行学习,这一篇文章将结合,在github上找到的一份基于keras框架实现的可运...
原文链接 https://jinkey.ai/post/tech/shou-cang-!836fen-zhong-de-gu-ge-ji-qi-xue-xi-jiao-che...
多分类 背景:多分类是指具有两类以上的分类任务; 例如,分类一组可能是橘子,苹果或梨的水果图像。本文旨在为大家提供一段即写即用的代码,跳过对原理的解说,直接上手跑一版base...
导读:pyecharts是一款将python与echarts结合的强大的数据可视化工具,本文将为你阐述pyecharts的使用细则。 前言 我们都知道python上的一款可视...
目录1 特征工程是什么?2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化与归一化的区别2.2 对定量特征二值化2.3 对定性特征哑编码...
这篇文章承接上一篇预热TensoFlow2.0——IRIS数据集实战,主是想更加详细介绍一下如何使用tensorflow2.0中使用Keras高级API快速构建模型。Kera...
写在前面 态度决定高度!让优秀成为一种习惯! 世界上没有什么事儿是加一次班解决不了的,如果有,就加两次!(- - -茂强) 综述 面对着大数据时代的发展,数据成为目前一切科学...
本文是【Predict Future Sales】用深度学习玩转销量预测的续集,主要介绍另一个强大的机器学习算法--随机森林(Random Forest,下文简称RF)在销量...
sklearn、XGBoost、LightGBM的文档阅读小记 文章导航 目录 1.sklearn集成方法 1.1.bagging 1.1.1.基本思想 1.1.2.常见变体...