前置内容——lianjia数据清洗
分析lianjia房源数据(一)——Python数据清洗
分析lianjia房源数据(二)——SPSS数据清洗
分析lianjia房源数据(三)——SPSS数据分析
分析lianjia房源数据(四)——PowerBI可视化展示效果
分析lianjia房源数据(五)——生成词云图
正文
前文清洗后的2019-08-12当天的房源数据,一共剩余有效数据共计60054条。
1.上海房价分布
通过箱线图可看出:中位数房价340万元,平均值487万元,同时存在较多的温和异常值与极端异常值。
2.上海各辖区房价分布
黄浦静安还是强啊~
3.价格、单价、面积分区间统计:
3.1价格分段区间分布图
可看出,200~300万范围内的挂牌房源数最多,达到了14806套。500万内的房源占总房源的70%,1000万内的房源占87%,
3.2单价分段区间分布图
3~7万的区间占总数的56%以上。
3.3面积分段区间分布图
4.各辖区价格、单价、面积箱线图
4.1各辖区总价箱线图
可看出黄浦区的价格数据更加分散,金山、奉贤则相对集中,金山区的极端异常值都没超过黄浦区的中位数房价(-_-||)
4.2各辖区单价箱线图
各区身价大PK,黄浦静安遥遥领先啊!
4.3各辖区面积箱线图
橙色虚线是70㎡的刻度线,红色是50㎡刻度线。一起看看哪些区域老破小和豪宅比较集中吧(* ̄︶ ̄),至少虹口、杨浦的50㎡以下房源是比较多的。
5室厅的量与房屋均价对比关系
数据中排除一些较大室厅(如7室以上,频数极低)。
可看出:按照房源数排列,2室1厅>3室2厅>2室2厅>1室1厅>3室1厅......,随着室厅数的增加,价格也呈现上升的趋势。
6装修风格与房屋均价关系
精装房价格显著高于其他类型房源。
后续文章将使用Python、PowerBI做后续的分析。