回顾篇（二）——决策树预测Titanic幸存者

822第一次知识分享

时间：2017-05-07 19:30～22:00
地点：822实验室
参加人数：8人
主持人：刘开心
收获：解决机器学习问题的流程；后续学习点汇总；边讲述边总结的技能

内容

决策树预测泰坦尼克生存者
主讲人：刘开心

活动流程

主持流程

项目简介

我简单说一下这个项目，它会有这个训练集，是叫训练集吗？或者说数据的来源，是根据……就是泰坦尼克号沉船以后掉到了水里，他们各自的……有，有一些年龄啊，他们在上船的年龄、船票呀之类的，很多的信息，然后把这个人最后做统计，这个人……这个，泰坦尼克号沉了之后有没有活下来。我们的任务就是通过之前的类似于年龄啊还有船票啊这些乱七八糟的信息去预测这个人到底能不能……就是，通过已有的东西去预测这个人能不能被被被就是他能不能活下来，假设以后再来个人有这些信息的话，能不能预测再有一艘泰坦尼克预测他能不能活下来。

——摘自ArtistQiu现场描述

都说口语不论说者还是听者都只有上下两句话的逻辑，看起来好像是对的😂，因为我们都听懂了，当时也没有觉得有什么问题，当写成文字的时候就感觉好逗😂Anyway，mark一下，看看大家之后口语表达会不会更清晰明了。

项目回顾

步骤

加载数据——pandas读取csv
将数据分为特征变量和目标变量——一般来讲用DataFrame的drop函数将csv文件的目标变量拷贝出来，然后drop掉，其余作为特征变量。
确立模型评价指标——本次使用accuracy。
拟合数据训练模型，找模型最优参数
预测
- 预测全死——正确率61.62%.
- 预测船上女性乘客全部存活，而剩下的人全部遇难——正确率78.68%.
- 预测所有女性以及小于10岁的男性都存活——正确率79.35%.
- 自行添加条件，让正确率尽可能高，几位同学的正确率有80.92%、81.+%、82.94%、83.+%。

手工决策树

ArtistQiu的决策树

sklearn决策树（正确率93.+%）

刘开心的决策树

惊喜汇总

1、accuracy计算

(truth == pred).mean()*100

为什么用平均值呢，因为truth==pred可以得到一个[0,0,0,1,1,1]的序列，它们的正确率就等平均数。
2、Jacob惊喜
（1）找出数据中小众的部分
（2）跳出题目所给的限定
（3）记录解题过程，分享惊喜的点
（4）记录疑问
3、DataFrame使用注意index对应，否则无法比较
4、我们自己在不断的人工尝试中摸索出了决策树算法的实现
5、威武学长惊喜：通过交叉熵找每一步最优节点

后续学习点

总结Python切片
交叉熵
one-hot
KNN预测Titanic
权重矩阵预测Titanic
AdaBoost预测Titanic
总结DataFrame
sklearn文档
基尼系数

智慧锦囊

1、碰到瓶颈暂停，一件事太繁琐，一定有简便方法，比如人工尝试节点太困难，可以想到一定有库能直接调用，切忌一直磨刀。
2、记录学习过程。
3、碰到问题多尝试。
4、细心、认真。
5、上台讲话不怯场。
6、讲述人学会凝练话语、增加话语的趣味性，把自己想表述的东西用听者想听的话表述出来。
7、听者学会不打断发言，从感觉“无用”的谈话中找到有用的部分。

我们的822，我们的青春
欢迎所有热爱知识热爱生活的朋友和822实验室一起成长，吃喝玩乐，享受知识。

最后编辑于：2017.12.07 05:56:13

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,980评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,178评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,868评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,498评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,492评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,521评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,910评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,569评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,793评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,559评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,639评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,342评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,931评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,904评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,144评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,833评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,350评论 2赞 342