关于臭名昭著的"GIL"严重阻碍了python多线程在实际工程上的应用,很多人理直气壮的说:“为什么要用python里面的多线程,它的速度比单线...
搞机器学习的人,都会有自己偏爱的某种算法,有的喜欢支持向量机(SVM),因为它公式表达的优雅和可利用方法实现的高质量;有的人喜欢决策树,因为它的...
Part 1: 本篇内容简介 在前一篇文章完全手写,自给自足完成贝叶斯文本分类中,我们使用首先假设在文档中出现的单词彼此独立,利用贝叶斯定理,完...
Part 1: 本文解决的问题: 我在有这样的一个数据集,里面存放了人们对近期播放电影的评价,当然评价也就分成两部分,好评和差评。我们想利用这些...
这篇博客和美国西雅图人们使用自行车情况分析与预测(初步)是姊妹篇,是对前一篇博客的延续,更多的背景信息这里不多介绍,可以去以上提到的博客中找到,...
Background: 首先声明一点,这篇博客不是我的原创,我被作者对大家习以为常的数据而具有深入细微的思考方式所折服,花了两天时间把数据下载下...
对于python和机器学习的爱好者来说,scikit-learn 是一个极好的,包含几乎所有重要的机器学习算法,而且文档详尽,英文阅读能力过得去...
Part 1: 动机 作为一个知乎的重度用户,我深深的被知乎社区的高素质群体所吸引,这也是我在微信朋友圈、新浪微博、baidutieba等社区见...
Part 1: 你真的认识大数据吗? 我周围很多人,开口闭口都是云计算、大数据。你要是真的去追究什么事大数据,什么级别的数据才叫做大,那么他们多...