昨天主要是对于tensorflow代码的梳理, 同时学习了下phantomjs + selenium的爬虫基本操作...
其实还是挺简单的,不过要真实很好地运用到爬虫中,感觉还需要对网页结构的比较好的熟悉程度...感觉还有很多东西需要去做.
好像一句话把昨天概括的事情概括完了..
托福GRE单词老样子~ 强化学习真是一个挺神奇的东西, 越了解越能体会到人工智能的神奇, 那参数一遍遍的自行反向传播, 机器自行选择决策, 以前觉得好像什么机器人有自己的思想是一件很遥远很不现实的事情,后来想想...细思极恐啊..
其实就简单从神经网络来说,已经近乎一个黑箱了.意思是,我只不过是把数据和一个目标函数丢给神经网络,然后神经网络自行学习并选择出最好的参数,由此又出现了强化学习,给出一些特定的状态,然后每个状态的每个决策的reward,然后让网络自己学习应该选择什么样的action.
所以其实你给网络的只是两个东西:
- 你当前的状态
- 你采用某个决策后的一个奖赏(reward)
而好像并没有什么死决策去规定它所学习的方向
想起曾经看过的一个知乎上关于人工智能的讨论:
说制作一个人工智能机器, 好像是寻求生产纸张, 数量尽量满足要求.
最后结果是人工智能把所有人类都干掉了,从而达到了最优策略:满足所有"人类"要求
当时还觉得太扯淡了,不过其实思想还是挺有道理的.因为机器永远是向一个最优决策去努力,去训练,但人类时无法保证其训练过程的.
好吧扯淡时刻到此结束,想想今天需要干啥:
- 帮学姐理好tensorflow代码;
- 爬虫学习;
- toefle & GRE
- Leetcode算法
有时间的话:
- Redis 分布式
- Java熟悉
- 顺便该整理整理内务了