Docker环境下运行python+selenium+chrome

docker运行时占用的资源非常少，而且能将环境进行有效的隔离，可以快速的进行部署，因此可以将docker与selenium结合实现在容器中执行无界面的自动化操作。例如：自动测试、自动下载邮件等。

需求说明

通过Selenium自动的登录邮箱，下载邮箱中符合条件的邮件，并对邮件的内容进行解析存档。

方案选择

Selenium官方提供了基于selenium hub的方式来管理selenium的node节点，提供了分布式的远程调度方案，可以为SeleniumGrid添加各种类型的WebDriver。

Selenium Grid架构图

基于Selenium Grid的方案适用于以下场景：

1.通过Selenium自动访问网页时，需要阻塞等待与用户的交互，例如需要输入短信验证码的场景，通过Selenium Grid的调度，可以最优的利用所有可访问的资源，提高系统的并发执行效率。

2.需要对网页的兼容性进行测试时，可以接入多种内核的WebDriver到Selenium Grid中，这样在进行网页的自动化测试时，也同时对浏览器的兼容性进行了测试。

3.访问只支持IE内核的网站时，例如一些开发比较早的政府网站等。

4.访问需要安装安全控件的网站，例如网银的登录等。

本次的需求对时效性要求不高，邮件的获取需要由定时器进行触发，如果使用Selenium Grid，可能会增加了整个系统的复杂程度，分布式系统中每引入一个中间件，就会增加系统的复杂性，系统的可用性就会随之降低。

基于以上分析，考虑采用selenium handless的模式，在Docker中运行Chrome的WebDriver，完成最终邮件的自动获取。

在确定方案之后，需要寻找合适的docker镜像，最终找到了chromium-xvfb这个镜像文件，集成了chromium和xvfb，可以满足在Docker容器中通过selenium来进行无界面的操作。

方案验证

1.下载chromium-xvfb的镜像文件

[root@prod ~]# docker pull markadams/chromium-xvfb-py2

2.交互模式运行

[root@prod ~]# docker run --rm -it markadams/chromium-xvfb-py2 bash

3.进入pytho环境

root@8016c66877aa:/usr/src/app# python

4.输入以下python代码

from selenium import webdriver
driver = webdriver.Chrome()
url = 'https://github.com/mark-adams/docker-chromium-xvfb/blob/master/samples/python3/test_google.py'
driver.get(url)

没有错误输出，证明Chrome已经在Docker下可以正常工作。

方案实施

以markadams/chromium-xvfb-py2作为基础镜像，重新编写的Dockerfile如下：

FROM markadams/chromium-xvfb-py2
WORKDIR /opt/zs5s/download-mail
COPY ./download-mail/.pip /root/.pip/
COPY ./download-mail/requirements.txt /opt/zs5s/download-mail/requirements.txt

RUN pip install --upgrade pip

RUN pip install -r requirements.txt && mkdir /tmp/downloaded_files

ENV DISPLAY :1
COPY ./download-mail /opt/zs5s/download-mail
COPY ./data_service /opt/zs5s/data_service
COPY ./save_mail /opt/zs5s/save_mail
COPY ./common/ /opt/zs5s/common
USER root

在编译运行后，发现在这个docker容器内单纯的去访问网页没有问题，如果去执行带有键盘的操作时，会报错，错误信息如下：

raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.WebDriverException: Message: unknown error: an X display is required for keycode conversions, consider using Xvfb
  (Session info: chrome=57.0.2987.98)
  (Driver info: chromedriver=2.28.455506 (18f6627e265f442aeec9b6661a49fe819aeeea1f),platform=Linux 4.4.27-moby x86_64)

经过调查是需要在启动容器时执行Xvfb，申请一块Screen，具体可以参考链接1。在Dockerfile中加入启动脚本：

CMD sh start.sh

start.sh的内容如下：

#!/bin/sh
export DISPLAY=:1   
Xvfb $DISPLAY -ac -screen 0 1280x1024x8 &
sleep 1 
ps -aux 
tail -f start.sh #测试用，为了阻塞住容器内的进程

结果验证

在新生成的容器内执行以下的python脚本，可以正常执行，说明在Chrome中已经可以接收通过selenium传入的键盘事件。

from splinter import Browser
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
url = 'https://github.com/mark-adams/docker-chromium-xvfb/blob/master/samples/python3/test_google.py'
browser = Browser('chrome')
browser.visit(url)
element = browser.find_by_xpath('/html/body/div[1]/header/div/div/div/div/form/label/input[1]')
element.type('aaaa')

残留问题

在python退出selenium时，虽然执行了driver.quit()函数，但是实际上Chrome并没有真正的退出，似乎是selenium的一个Bug，在3.1中提到了修正，但是好像没有起作用，
selenium-commit-url

解决办法可以考虑执行shell脚本主动的kill掉Chrome的进程。

参考链接

1.protractor-sendkeys-not-working-an-x-display-is-required-for-keycode-conversion
2.crawling-python-selenium-docker
3.docker-chromium-xvfb

最后编辑于：2017.12.06 11:17:33

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,924评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,781评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,813评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,264评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,273评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,383评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,800评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,482评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,673评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,497评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,545评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,240评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,802评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,866评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,101评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,673评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,245评论 2赞 341