- 1.提取标签中的文本内容:/text()取直系文本 //text()取所有文本
#数据解析:图片地址+图片名称
tree = etree.HTML(page_text)#HTML()专门用来解析网络请求到的页面源码数据
#该列表中存储的是每一个li标签
li_list = tree.xpath('//div[@class="slist"]/ul/li')
for li in li_list:
#局部解析:将li标签中指定的内容解析出来
img_title = li.xpath('./a/b/text()')[0]+'.jpg'# 左侧./表示xpath的调用者对应的标签
img_src = 'https://pic.netbian.com'+li.xpath('./a/img/@src')[0]