JasonChiu17 - 简书

发简信

JasonChiu17

16
关注
95
粉丝
41
文章
34453

字数
136

收获喜欢
65

总资产

IP属地：广东

JasonChiu17

Various classifier comparisons on NSL-KDD
加载数据分类器评估

964 0 0
JasonChiu17

Imbalanced-learn for NSL-KDD
RawData Over-sampling RandomOverSample SMOTE ADASYN BorderlineSMOTE Under-sampling Clus...

2395 0 1

JasonChiu17

FP-growth
FP-growth(频繁模式增长) 数据库的第一遍扫描用来统计出现的频率；第二遍扫面中考虑那些频繁元素优点：大约比Apriori算法快一个数量级缺点：实现比较困难，在...

1669 0 1
JasonChiu17

Apriori算法
关联分析概念：关联分析是一种在大规模数据集中寻找有趣关系的任务；目标是发现频繁项集和发现关联规则；频繁项集：是经常出项在一块的物品的集合；关联规则：暗示两种物品之间可能...

1584 0 0
JasonChiu17

K-Means
原理聚类是无监督学习，将相似的对象归到同一个簇中，簇内的对象越相似，聚类的效果越好；首先，随机确定K个初始点作为质心；然后，将数据集中的每个点分配到一个簇中，具体来讲，...

1933 0 2
JasonChiu17

树回归
原理：将数据集切分成很多份易建模的数据利用线性回归技术建模优点可以对复杂和非线性的数据建模缺点结果不易理解适用数据类型数值型和标称型数据选择最佳特征之后，数...

481 0 0
JasonChiu17

深度学习·神经网络·CV&NLP
zhwhong 编，631 篇文章，6723 人关注

本专题招募管理员，有意向请简信私聊，谢谢！用来分享机器学习，深度学习，神经网络，计算机视觉等领域的一些技术。 Machine Learning 学习资料：http://www.jianshu.com/p/e0238db24973 相关参考： 1. [Coursera - Machine Learning by Andrew Ng]：https://www.coursera.org/learn/machine-learning 2. [ Stanford CS231n Course]：http://cs231n.github.io/ 课程整理：http://www.jianshu.com/p/182baeb82c71 3. [深度学习与神经网络(英文原版)]：http://neuralnetworksanddeeplearning.com/ [GitBook同步链接]：https://www.gitbook.com/book/tigerneil/neural-networks-and-deep-learning-zh/details 4. [UFLDL教程]：http://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B （中文） http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial （英文） 5. [Deep Learning - An MIT Press book]：http://www.deeplearningbook.org/ 6. [Neural Network Playground]： http://playground.tensorflow.org/ 7. [A Guide to Deep Learning]： http://www.jianshu.com/p/6752a8845d01 8. [知乎“机器学习”专栏]： https://www.zhihu.com/collection/108812637 9. [How do Convolutional Neural Networks work?] http://www.jianshu.com/p/fe428f0b32c1 …… 希望大家可以相互交流，相互学习！

JasonChiu17

机器学习与模式识别
JasonDing 编，233 篇文章，9629 人关注

机器学习算法关注机器学习，人工智能，数据挖掘，计算机视觉等相关领域的文章
JasonChiu17

回归
线性回归原理：寻找一组最优参数来拟合数据优点结果易于理解，计算上不复杂缺点对非线性的数据拟合不好适用数据类型数值型和标称型数据加载数据标准回归函数画图可...

926 0 0
JasonChiu17

提升方法(boosting)
原理：通过改变训练样本的权重，学习多个分类器，并将这些分类器进行线性组合，提高分类的性能； bagging是通过随机抽样的替换方式，得到与原数据集规模一样的数据； boos...

1090 0 0
JasonChiu17

天池o2o优惠券使用预测比赛解析（初级）
天池o2o优惠券使用预测比赛解析（初级）赛题链接：天池o2o优惠券使用预测加载数据缺失值处理统计比赛的意义是把优惠券给那要购买商品却没有优惠券的人（701602 ...

3226 0 0
JasonChiu17

Logistic回归
原理对分类边界建立回归公式，找到最佳拟合参数，以此来进行分类。优点：计算代价不高，易于理解和实现。缺点：容易欠拟合，分类精度可能不高。在数据不是完全线性可分的情况，...

884 0 0

JasonChiu17

朴素贝叶斯算法
原理选择具有最高概率的决策朴素的意思是每个特征之间是独立同分布的，互不影响。优点：在数据较少的情况下仍然有效，可以处理多类别问题。特征条件独立假设，使得模型预测所需要...

555 0 0
JasonChiu17

支持向量机SVM
原理寻找一个分割超平面来作为分类边界，找到离分割超平面最近的点，确保它们离分割超平面的距离尽可能远。支持向量就是离分割超平面最近的那些点优点：泛化错误率低，计算开销不...

436 0 1
JasonChiu17

决策树算法
原理通过选择最好的特征来划分数据集，对数据子集继续划分，直到数据子集中是相同的类别；划分数据集的特征可以通过计算信息增益的方法来选择。优点计算复杂度不高，输出结果容易理...

1272 0 1
JasonChiu17

K-近邻算法
原理已有一系列带标签的数据，通过计算新数据与带标签数据的相似度（距离），来判定新数据是属于哪一类数据。其中，计算新样本与所有带标签数据之间所得到的距离，按从小到大排序，选取...

740 0 2
JasonChiu17

@思无邪cc 谢谢，对，那个进程写错了，还有些问题我没来得及整理解答，希望大家能在这里说说自己的理解和想法。

计算机网络基础/数据库/Linux/编程
BAT面试题复习 http协议 http协议是无状态无连接；无状态：指的是http协议无法保存客户机的信息，比如客户机浏览了什么网页，判断用户是否由权限访问等，因此产生了两...

JasonChiu17
2720 10 67

JasonChiu17

Git入门
1.建立仓库 2.版本控制添加文件到Git仓库，分两步：使用命令git add <file>，注意，可反复多次使用，添加多个文件；使用命令git commit -m <...

225 0 1
JasonChiu17

企业安全最佳实践-全流量Web入侵检测系统
一.背景说明从目前来看，大多数互联网业务是以web服务对外交付的，攻击者大多数也是通过web入侵到系统里，不管什么方式，都绕不过web系统的探测和入侵尝试这一关，所以如果...

libinlarry
2570 9 20
JasonChiu17

@_zyw15 这样啊，我倒很少这样听到

计算机网络基础/数据库/Linux/编程
BAT面试题复习 http协议 http协议是无状态无连接；无状态：指的是http协议无法保存客户机的信息，比如客户机浏览了什么网页，判断用户是否由权限访问等，因此产生了两...

JasonChiu17
2720 10 67