使用python筛选基金

天天基金网上可以公开购买的基金有8000多个,如何从其中筛选出比较好的基金进行投资,可能会有很多策略,我这里使用了一个非常简单粗暴的方法,从六个时间维度,即'近1周', '近1月','近3月', '近6月', '近1年', '近2年',分别提取出其中盈利排名前100的基金,取他们的交集。首先需要将所有基金信息全部爬取下来,然后使用pandas进行处理。

环境

  • python3 + pandas(anaconda3)
  • win10
  • Firefox开发版

爬取基金信息

打开天天基金网的官网,在基金排行中可以看到所有的基金数据。


基金排行数据

首先使用浏览器分析一下HTTP请求
这是请求


HTTP请求

这是响应
HTTP响应

响应是一段js代码,其中rankData变量为返回的数据

var rankData = {
    datas: [
        "008121,万家自主创新混合C,WJZZCXHHC,2020-07-10,1.3649,1.3649,1.1037,16.1123,30.4377,43.4321,,,,,,36.49,2020-02-10,1,36.49,,0.00%,,,,", 
        "257070,国联安优选行业混合,GLAYXHYHH,2020-07-10,3.5262,3.8272,1.3480,16.0622,29.4113,50.5186,65.7283,151.0465,160.7943,128.0854,78.9132,334.4737,2011-05-23,1,150.6361,1.50%,0.15%,1,0.15%,1,110.7711", 
        ...
    ], 
    allRecords: 6279, 
    pageIndex: 2, 
    pageNum: 50, 
    allPages: 126, 
    allNum: 6279, 
    gpNum: 1248, 
    hhNum: 3131, 
    zqNum: 1739, 
    zsNum: 954, 
    bbNum: 0, 
    qdiiNum: 161, 
    etfNum: 0, 
    lofNum: 260, 
    fofNum: 121
};

这个爬虫很简单,直接上代码

#-*- coding:utf-8 -*-
# writen by wlj @20200712
import requests
import json
import js2py,re
import pickle

#全局变量,requests使用的头部字段
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:79.0) Gecko/20100101 Firefox/79.0',
    'Cookie': 'st_si=12097774306782; st_sn=7; st_psi=20200712090801308-0-3225966371; st_asi=delete; ASP.NET_SessionId=d3i2hxkiu0rzmshtsa3kw514; st_pvi=49218209189172; st_sp=2020-07-11%2012%3A21%3A10; st_inirUrl=https%3A%2F%2Fwww.baidu.com%2Flink',
    'Referer': 'http://fund.eastmoney.com/data/fundranking.html'
}

def spider():
    #用来保存所有基金数据的列表
    all_data = []
    #基金排名页的url
    url = 'http://fund.eastmoney.com/data/rankhandler.aspx'
    #提交的参数
    params = {
        "op":"ph",
        "dt":"kf",
        "ft":"all",
        "rs":"",
        "gs":"0",
        "sc":"3nzf",
        "st":"desc",
        "sd":"2019-07-11",
        "ed":"2020-07-11",
        "qdii":"",
        "tabSubtype":",,,,,",
        "pi":"5",#page_index 请求的页面的索引
        "pn":"100", #page_number,一个页面中包含的最大的记录数
        "dx":"1",
        "v":"0.3103526639937624"
    }
    s = requests.Session()

    #将整个表爬取下来
    all_pages = 1
    page = 1
    while page <= all_pages:
        r = s.get(url,params = params, headers = headers)
        if r.status_code == 200:
            t = re.findall(r'var rankData = .*?;',r.text)
            #使用js2py库的eval_js方法可以执行js代码,返回rankData的值,将一个js对象,转化为一个python的字典
            data = js2py.eval_js(t[0]+'rankData') 
            #页面总数
            all_pages = data['allPages']
            #将当前页面数据添加到all_data中
            all_data += data['datas']
            print(page)
        #下一页
        page += 1
        #修改params参数
        params['pi'] = str(page)
    
    #将结果保存为pickle格式
    pickle.dump(all_data,open('data.db','wb'))
    #将结果保存为csv格式
    open('data.csv','w',encoding='utf-8').write('\n'.join(data))

spider()

结果中没有title,可以结合全面手动补上表格的title,结果如下图。


结果

筛选近期收益较好的基金

image.png

当然还要结合其它因素来选择,以往的业绩不能代表这些基金未来的走势,不作为投资建议。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342