今天看到一篇雪球文章叫海龟交易法
大概思路是通过回看20天的盘中最高和10天内盘中最低,结合前一天收盘价制定的交易策略。
想自己编程试试看。
第一步是取得数据,因为一直用雪球,感觉上可以从雪球上获取数据。于是打开chrome用F12找到雪球日K里面的数据源,和我预期的一致,是JSON格式的。那就好办了,把URL粘贴出来
https://xueqiu.com/stock/forchartk/stocklist.json?symbol=SH600000&period=1day&type=after&begin=1434173957486&end=1465709957486&_=1465709957486
一开始想要用linux shell直接执行wget获取,但发现不行,雪球设置了必须登录才能获取数据。
Linux shell显然是不支持登录后下载的,必须考虑用其他语言实现,找了一圈,php似乎是最简单的,利用CURL包可以模拟浏览器操作。
检查了雪球的登录界面,找到了登录的URL https://xueqiu.com/user/login , 登录需要提供参数,参数名称花了一段时间,一开始直接用username和password,发现不行,于是去截包,发现用手机登录应该是telephone和password,登录代码如下
$curl = curl_init();
$cookie_jar = tempnam('./tmp','cookie');
curl_setopt($curl, CURLOPT_URL,'https://xueqiu.com/user/login');
curl_setopt($curl, CURLOPT_POST, 1);
$request = 'telephone=$phoneno&password=$password';
curl_setopt($curl, CURLOPT_POSTFIELDS, $request);
curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_jar);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_HEADER, false);
curl_setopt($curl, CURLOPT_NOBODY, false);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
$content = curl_exec($curl);
print($cookie_jar);
print($content);
Bingo 登录成功>接下来用Curl取刚才的那个URL顺利获得的JSON.
接下来是处理URL动态参数,分析这个URL:https://xueqiu.com/stock/forchartk/stocklist.json?symbol=SH600000&period=1day&type=after&begin=1434173957486&end=1465709957486&_=1465709957486
可以看到前面https://xueqiu.com/stock/forchartk/stocklist.json?symbol=SH600000 这一段大概是取SH600000这个股票,后面的period=1day 就是按天取数据,type=after 默认应该是后复权,begin end 和&_参数看起来像是unix 时间戳。但仔细一看好像后面多了3位数字,不知道是干什么的,试试都加上000看看
于是有了这段代码:
$ts=time();
$start_date=strtotime("-1 week");
$url='https://xueqiu.com/stock/forchartk/stocklist.json?symbol='.$stockno.'&period='.$period.'&type='.$type.'&begin='.$start_date.'000&end='.$ts.'000'.'&_='.$ts.'000';
把这两段代码略作整合,得到了一个function 如下,默认取当前日期一周内的数据。
Function getStock($stockno,$type,$period){
print('printing:'.$stockno);
$curl = curl_init();
$cookie_jar = tempnam('./tmp','cookie');
curl_setopt($curl, CURLOPT_URL,'https://xueqiu.com/user/login');
curl_setopt($curl, CURLOPT_POST, 1);
$request = 'telephone=$phoneno&password=$password';
curl_setopt($curl, CURLOPT_POSTFIELDS, $request);
curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_jar);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_HEADER, false);
curl_setopt($curl, CURLOPT_NOBODY, false);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
$content = curl_exec($curl);
//print($cookie_jar);
//print($content);
curl_close($curl);
$curl2 = curl_init();
$ts=time();
$start_date=strtotime("-1 week");
$url='https://xueqiu.com/stock/forchartk/stocklist.json?symbol='.$stockno.'&period='.$period.'&type='.$type.'&begin='.$start_date.'000&end='.$ts.'000'.'&_='.$ts.'000';
curl_setopt($curl2, CURLOPT_URL, $url);
curl_setopt($curl2, CURLOPT_HEADER, false);
curl_setopt($curl2, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl2, CURLOPT_COOKIEFILE, $cookie_jar);
$content = curl_exec($curl2);
print_r($content);
return content;
}
getstock('SH600000','normal','1day');
发现可以获取,但数据似乎比预期的要多,但也没什么关系,可能和URL参数的理解有关系,不过没关系,至少第一步获取数据的任务完成了.接下来需要将这些数据存储到数据库中,以便后续的分析和处理。