昨天深夜我一个朋友发微博说,“选择用哪个技术框架仿佛一个分叉路口,一个不小心选错了都不能重来 。”
然后我回复了她,“有时候选题才是不归路...”
其实挺心酸的,作为某普(la)通(ji)二本的我的毕业设计题目是《旅游规划系统》,和另一个朋友搭伙,开始我们想有点逼格不想像别的同学一样做那样的《xxx管理系统》、《xxx论坛/博客》、《xxx商城》之类,加上我们也喜欢旅游并且不喜欢做旅游规划,所以这样的选题就.........
我们的开始想法分为几个部分:
- 爬虫系统与文本分析系统
- 获取主流旅游网站的数据(如x程,去x儿等)
- 获取某地点旅游攻略信息,进行分词等处理,提取旅游景点名称,进行统计
- 爬取天气,机票,酒店住宿信息
- 路线规划系统(pongyou负责实现)
- 搭建一个web应用,利用网页来实现数据的展示
(有空我再把想法补充完整点)
对于这个选题,开始我们的想法和感觉的实现就这样好了吧挺简单的、就这样简单点吧,但是导师习惯性地“加需求”,什么大数据啊文本分析机器学期人工智能给“我”上一打......emmmmmmmmm并因为导师突然傻逼的事情,为保住该选题进行了一番惨绝人寰的“抗争”,唉。
事不如人愿,既已至此,前行矣。然后在摸鱼很长很长一段时间之后,我们来到了这个3月,留给中国队的时间不多了,很虚!!
所以萌生出写毕设日志的想法来记录完成这个毕设的步伐吧
以开学前后为分界,开学后所实现的功能爬取的数据之类的,开学前所学习的东一块西一块的知识点回忆,多多少少,缘,妙不可言(
又本人菜鸟一枚,文章所写的实现与代码可能比较粗糙,设想中总体以提出/遇到问题与解决问题的实现为主,一来时间不多,二来是技术水平所限吧......系列文章就当做个人对于知识的回顾总结记录,看官轻喷。
先挖坑吧,就目前进度所想到的有文章标题有:
- 豆瓣电影Top250数据爬取
- 景点热度分布图——仿大佬教程《国庆不去哪儿:用python爬虫爬取热门景点并生成热力图》
- x程厦门旅游景点数据采集
- 以免费代理网站为目标——维护一个代理ip池
- 爬虫框架scrapy与requests模块个人的一点理解
恩,先做了再想怎样优化吧,慢慢慢慢慢慢慢慢慢慢慢慢慢慢慢慢慢慢填坑吧23333333333333333