python抖音爬虫


抖音视频的爬取过程

抖音由于没有网页版只有APP导致一些想爬的人都放弃了去尝试,但是作为一个程序员不要怕麻烦。麻烦才是你产生bug的开始 - -

python环境:3.6

爬取前必要做的事(按照前后顺序)

首先我在这里先说明 我这里使用的python。**但是这篇文章重点是理解整个过程**。下面开始。

1. 首先我们先选择一个软件:

    (1.**charles**(简称:花瓶),2.**fiddler**)我个人使用的是**charles**

    charles :charles官方网址自行下载

    Fiddler:fiddler官方网址自行下载

   在这里我给大家一个Tips:

        如果发现手机不能正常代理charles或者fiddler 我可以告诉你们一个肯定适配的

        **苹果 + charles**设置肯定可以正常代理!!!!!(经历了几个月的惨痛教训得出来的真理)

2.代理配置和手机配置:

    charles :charles代理配置官方网址自行下载

    Fiddler:fiddler代理配置官方网址自行下载

   这样就已经完成了一大半了 剩下的就看进入破解抖音的部分了,让我们来看看重点部分吧



抖音部分

在手机上下载抖音APP;

配置好后 要先打开charles 再打开抖音APP不然手机没有网,这其中类似于中间人代理的原理;

1.抖音随便查找一个用户然后点开它的用户界面

   charles出现以下界面:

出现这样的图,点红箭头会出现这样图:

这就是用户的数据了,但是其实下面有几个会影响你的判断,我是直接给你们标出了,爬虫做多了你会有避开一定明显错误信息(多做,多尝试)


然后我们用在线的json解析工具解析一下这串json数据:


继续====》


找到我们需要的数据。我需要的是视频,所以我找我需要的视频url的位置,用户信息都是有的(耐心的找找就都有了):


这样我们基本的爬虫就结束了,就是这么的简单有木有。接下来就是一点代码了,由于某些原因不能展现全部代码我把关键的代码展示出来:



这边有三点很容易错误:

一、是headers(头部)尽量全一点在第二张图有全部的headers 你全搬过来就行了。

二、request一定要加verify=false 不然会报错。

三、数据是json数据要直接用request.json()解析,如果后续用json.dumps 或者 json.loads都没用。

这是其中的关键代码片:

url = '不敢放。在第二章图的 get 后面复制一下就行了'

headers = {

'User-Agent':'Aweme 8.6.0 rv:86018 (iPhone; iOS 12.3.1; zh_CN) Cronet',

'x-tt-trace-id':'00-5990d4d209cf8a1db8ebc1dd7c600468-5990d4d209cf8a1d-01',

'Connection': 'keep-alive',

'X-KHronos':'1573460693',//标示用户的 url通用的 每个用户都不一样

'X-Gorgon':'830099900000b7f5660d88c11c18d1ba30080507077bc534f0a9'//标示用户的 url通用的  标示用户的 url通用的 每个用户都不一样

}

resp = requests.get(url=url,headers=headers,verify=False)

text_json = resp.json()

print(text_json)


!!headers头部中的X-KHronos和X-Gorgon才是标示用户的,url都是一样的!! 

做个简单的数据库 就可以大量的爬取了。记得换IP噢 - -


如果一些人卡在手机代理配置的过程中。那就一步一步来,勿急勿躁,做为一个程序猿要习惯这种感觉~


其实我觉得爬虫难的不是写代码。难的是在于你看到你要爬的网站,APP是否在你心里有一套完成的流程。当然写代码的时间永远没有配置环境的时间长。抖音视频爬虫也可以用APPium模块(jdk,sdk,adb........) 手机模拟滑动来获取视频。但是!!!环境的配置会让你崩溃(可自行问度娘)。这篇文章希望能帮助大家。有时间我会写一篇关于微信小程序爬虫、验证码解决的方法。记得关注噢~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,841评论 5 472
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,415评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,904评论 0 333
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,051评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,055评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,255评论 1 278
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,729评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,377评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,517评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,420评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,467评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,144评论 3 317
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,735评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,812评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,029评论 1 256
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,528评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,126评论 2 341

推荐阅读更多精彩内容