【需求】Jsoup爬取淘宝订单的订单号总结

简介

公司最近在做淘宝商城类的APP,需要获取到用户的淘宝订单信息并用自己的列表展示出来,用过阿里百川的朋友都知道SDK是直接提供了打开用户订单的方法,但是它是用H5或淘宝app进入用户订单,并没有返回json这样的数据供我们使用,所以就想到了利用webview获取到用户订单的html代码,然后jsoup爬取用户订单信息再展示出来。这里只介绍如何获取淘宝订单号,商品名称、价格等数据可以举一反三获取到。

准备工作

依赖最新的jsoup包

implementation 'org.jsoup:jsoup:1.11.3'

步骤如下

1.先定义一个类用于获取当前webview显示的html代码,这里我在activity用类部类的方式来写

class HTMLJavaScriptInterface {
        @JavascriptInterface
        @SuppressWarnings("unused")
        public void processHTML(String html) {
            //html 为当前webview显示的html代码,这里就是最终要处理的操作
        }
    }

2.定义WebViewClient

/*WebViewClient主要帮助WebView处理各种通知、请求事件*/
    private WebViewClient webViewClient = new WebViewClient() {
        @Override
        public void onPageFinished(WebView view, String url) {
            //页面加载完成,处理html代码,复制黏贴不用改动
            mWebView.loadUrl("javascript:HTMLOUT.processHTML(document.documentElement.outerHTML);");
        }
    };

3.初始化用于显示网页的webview属性

//添加刚才我们定义的js接口
mWebView.addJavascriptInterface(new HTMLJavaScriptInterface(), "HTMLOUT");
//设置WebViewClient
mWebView.setWebViewClient(webViewClient);

4.访问淘宝订单网址

淘宝订单的h5页面地址为:https://h5.m.taobao.com/mlapp/olist.html

mWebView.loadUrl("https://h5.m.taobao.com/mlapp/olist.html");

Jsoup处理获取到的html代码

当我们访问到我的订单页面时,可以再HTMLJavaScriptInterface中打印出html代码先看看代码结构,这里我直接贴图我自己的淘宝订单。


2018-08-16_120911.png

然后我们展开一个li标签,查看详情


2018-08-16_121514.png

众所周知,淘宝订单号是18位的数字,而我们可以观察看,class中的属性,是19位的数字,这是为什么呢?我们继续查看第2个li标签


2018-08-16_122338.png

好了,知道订单号后,我们接下来就是重点了。

回到我们定义的HTMLJavaScriptInterface中,编写如下代码:

class HTMLJavaScriptInterface {
        @JavascriptInterface
        @SuppressWarnings("unused")
        public void processHTML(String html) {
           //创建一个集合用来最后存订单号
           List<String> idList = new ArrayList<>();
           //需要抛异常来查看问题
            try {
                //通过parse方法拿到Document对象
                Document doc = Jsoup.parse(html);
                //通过getElementById定位到订单的div位置
                Element div = doc.getElementById("order1");
                //拿到该div下面所有的li标签
                Elements lis = div.getElementsByTag("li");
                //遍历li标签,用来得到里面div的class属性
                for (Element li : lis) {
                    //保存不为空的class属性
                    if (!TextUtils.isEmpty(li.select("div").attr("class"))) {
                       //从上面的class属性我们可以看到是module 1754124142728272452 storage这样的,我们就从第7位取到25位,这样就保留了中间18位的订单号
                       idList.add(li.select("div").attr("class").substring(7, 25));
                    }
                }
                //结束idList就是我们最终获取到的淘宝订单号集合
            
            } catch (Exception e) {
               //查看Jsoup操作的异常
            }
        }
    }

想要了解更多Jsoup的操作,可以访问Jsoup的中文网学习
官网地址

好了,下课,其他问题可以在评论区咨询。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容