240 发简信
IP属地:北京
  • Resize,w 360,h 240
    游戏领域舆论的数据获取与分析项目总结

    项目目标 数据获取。使用scrapy-redis框架构建分布式爬虫, 数据分析。主要分为以下三个模块:新词发现。由于语料中含有许多在常规的语料当...

  • 一个隐蔽的jq getJson回调不执行问题

    一般而言jq的getJson回调不执行除了请求本身就出错之外那肯定就是json格式本身有问题了最近在做一个demo,使用python的flask...

  • Resize,w 360,h 240
    百度贴吧高级爬虫

    最近做了一个完整版的百度贴啊全吧爬虫,过程比较具有代表性,分析过来供大家参考。代码在解禁后后贴吧爬虫查看。 项目结构项目主要采用scrap-re...

  • 2019-07-25

    回归简书,最近几日逐渐把之前的文章都搬运过来~

  • xpath一些经验记录

    常做爬虫的人肯定是对xpath非常地熟悉了,在这么多h5元素选择器当中,我还是最喜欢xpath。下面就来记录一些xpath当中用到的东西: cl...

  • CCF NLP比赛

    好久没写文章了,因为最近在忙这个比赛。初赛已经刷到第一了,但是实在没有什么所谓的经验,我在想是不是这种类型的比赛参加的选手都在挖空脑门怎么去调模...

  • 剑指offer刷题笔记

    因为剑指offer的题目比较简单,所以就做成合集了,刷一题更新一题。 1 二位数组中的查找 在一个二维数组中(每个一维数组的长度相同),每一行都...

  • List

    今天研究了一下markdown的语法才发现还有一种可以划分出区域的方法。链表是一种很常见的数据结构,那么我们就复习一下,使用C++现撸出一个li...

  • Permutation

    leetcode里面应该有很多个与permutation相关的问题,那么首先就先写出一个全排列把。 道理其实很简单,就是简单的backtrack...

个人介绍
一只咸鱼
求一个数据分析のoffer