开始文章之前呢,我们首先看一个搜索。
很明显,我们如果用like是没发实现这种功能的,这里就用到了我们今天要聊的分词搜索。
项目是从一个爬虫开始的,毋容置疑我们想做搜索,肯定要有数据呀,这里我选用了半糖这个网站的商品信息。
第二步,我们开始建立索引,我建索引的方式比较简单,是通过字符转unicode码拼接成文件路径的方式,这里也期待你用更好的方式做,比如说存在内存中(这里要做数据持久化),那实际上我最新的一个开源项目gosearch就用了这种方式,当然如果你想追求更有意思的事情,你可以尝试一下分布式,你可以自己设计一套分布式的方案,就会很酷了。
最后,就是用Flask展现我们的数据了,这一步就简单一些了,但是我这里用了一些AOP的全局处理方案,还是挺有意思了,有兴趣的可以看一下。
github地址: https://github.com/apple-han