用PowerBI分析往届世界杯赛球队成绩
用PowerBI与Python做个简单对比
python分析文章请见用Python分析热门夺冠球队
1、 获取所有世界杯比赛的数据(不含预选赛)
2、 获取世界杯所有比赛的前20强数据情况
2.1 获胜场数
2.2 进球总数量
2.3 参加场次
数据来源于International football results from 1872 to 2018
数据集包含以下信息:
date - 比赛日期
home_team - 主队
away_team - 客队
home_score - 主队进球数 (不含点球)
away_score - 客队进球数 (不含点球)
tournament - 比赛的类型
city - 比赛所在城市
country - 比赛所在国家
neutral - 是否中立TRUE/FALSE
一、导入数据
从kaggle下载数据文件后用PBI导入,并筛选出世界杯比赛:
二、数据检查
2.1>查看PBI自动生成的代码,数据类型转换正确
2.2>过滤出世界杯正式比赛场次,总共847场,数据比较“干净”
简单浏览一下数据情况
三、数据统计
3.1>获胜场次统计
制作报表:
结果如下:
巴西、德国、意大利、阿根廷获胜场次名列4强
查看一下阿根廷的获胜场次情况:
3.2>进球数统计
分别统计出主、客进球,然后求和即可
客队也如法炮制,然后合并结果生成报表:
德国、巴西、阿根廷、意大利攻击力名列4强
3.3>参赛场次统计
与进球总数的统计方法相似,分别统计出主、客场次数然后合并相加,最后结果如下:
德国、巴西、意大利、阿根廷名列4强,其中墨西哥名列第8,也是世界杯常客
对本届32强XXX年以来的分析,采用同样的套路即可。
对于这种数量不大又很干净的数据,PowerBI做统计分析,其实比python+pandas更快捷!