Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hi...
![240](https://upload.jianshu.io/collections/images/1800494/baggio-italy2.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hi...
没有并发就没有锁Enqueues 队列型锁,队列阻塞 锁的原则 1、只有被修改时,行才会被锁定。2、当一条语句修改了一条记录,只有这条记录上被锁...
我们先来看看结构 定义就不多说了,我们一一展开内容 ndarry数组 创建数组: import numpy as npa = np.array(...
最近这段时间自己一直在学习数据分析这一块,其中关于数据收集方面就可以用到爬虫。那么自己也想把最近所学的一些知识分享给大家。 爬虫的方式有很多种,...
上次我们讲了,如何爬取图片,大家可以点击链接查看。"python爬虫:用request最简单的代码爬取图片,以及XpathHelper的使用" ...
用id3算法,得出泰坦尼克号生存率预测: 测试集与训练集:链接: https://pan.baidu.com/s/1AsWe81NfddCoWA...
我们用pagerank来查看,各个点的影响力,以及用nexworkx中的graph来展示其关系。 如图ABCD代表着4个网页,其中箭头指向表示,...
沪指一般指上海证券综合指数简称“上证指数”或“上证综指”,其样本股是在上海证券交易所全部上市股票,包括A股和B股,反映了上海证券交易所上市股票价...
我们都知道,信用卡诈骗相对于违约来说比例极低,但是危害重大,如何通过以往的交易数据分析出眉笔交易是否正常呢? 算法: 逻辑回归,logistic...
分类器: 随机森林分类器(RandomForest):包含多个决策树的分类器,每一个子分类器都是一颗CART分类器。 GridSearchTV工...
专题公告
1、理论知识
2、基础练习
3、python算法练习