影响房价的因素有很多,除了央妈,还有地理,人口,气候,交通,经济......等很多因素
因为R语言中绘制气泡图非常简单,所以这篇变成了一篇伪技术文,实质是探讨小学生数量是否能影响房价走势。
小学生代表了人口的未来购买力,一方面,说明城市平均年龄较为年轻,另一方面,学区房的需求也会诱发房市的火热,就像人口老龄化会降低房价走势一样。当然,这种关系并非单纯的线性关系。(要真是那么简单就好啦)
数据来源:小学生数据参考以下图表,补充了几个我感兴趣的城市,比如苏州。
全市人口也很容易获得,因为2015年进行过全国人口普查,所以各城市的人口数据都比较齐全。这里采用了常住人口而非户籍人口。生成以下excel表格,ratio=2015年小学生数量/2008年数量,total=全市常住人口,price=2016年8月均价
数据展现过程:
r<-mydata$price
attach(mydata)
symbols(ratio,total,circle=r,inches=0.3,fg="white",bg="lightblue",
xlab="小学生人数2015/2008同比",ylab="全市常住人口",
main="城市人口,小学生人数增长与房价气泡图")
text(ratio,total,mydata$X1,cex=0.6)
方案一:以2015/2008年比例为x轴,全市常住人口为y轴,房价高低代入为气泡大小。
苏州的小学生数在2014到2015年有一个30多w到60多w的跳升,并在2016年保持了60多w,所以比例特别高,相比之下,苏州的房价倒还不算太高。
方案二:以2015/2008年比例为x轴,2016年8月均价为y轴,城市常住人口代入为气泡大小。
北京和上海不出所料的仍然浮在最上端,两个比例高的城市中,厦门人少价高,苏州比较亲民。
symbols(ratio,price,circle=total,inches=0.3,fg="white",bg="lightblue",
xlab="小学生人数2015/2008同比",ylab="2016年8月均价",
main="城市人口,小学生人数增长与房价气泡图")
text(ratio,price,mydata$X1,cex=0.6)
方案三:以城市常住人口为x轴,2016年8月均价为y轴,2015年全市人口与小学生之比代入为气泡大小。
相对于这种比例,深圳,厦门,东莞属于比较年轻有活力的城市,东莞的价格属于比较亲民。
symbols(total,price,circle=total%/%s2015,inches=0.3,fg="white",bg="lightblue",
xlab="2015年城市人口",ylab="2016年8月均价",
main="城市人口,小学生人数增长与房价气泡图")
text(total,price,mydata$X1,cex=0.6)
气泡图在统计学中据说并不太受重用,因为相比于长度,人们对面积的判断统筹更困难,但在商业应用中非常受欢迎。它的另一个特点是需要三个维度,而前面提到过的dotchart点图就只需要一个维度。
从上文可见,根据不同的维度安排x轴,y轴,气泡大小,不但做出不同的图形,也会因此有不同的解读。因此,如何安排这三个维度,是气泡图的挑战。