pytest插件探索——pytest-xdist

背景

经常做pytest插件开发的话, 一定会看到不少如下代码片段:

def pytest_configure(config):
    ...
    # prevent ... on slave nodes (xdist)
    if not hasattr(config, 'slaveinput'):
        ...

其实这些代码都是为了兼容一个叫pytest-xdist的插件的.简单介绍一下这款插件, pytest-xdist这款插件允许用户将测试并发执行(进程级并发). 主要开发者是pytest目前的核心开发人员Bruno Oliveira, 截至写作时, 该项目已有371个star, 应用于4150个项目. 需要注意的是, 由于插件是动态决定测试用例执行顺序的,为了保证各个测试能在各个独立线程里正确的执行, 用例的作者应该保证测试用例的独立性(这也符合测试用例设计的最佳实践).

流程

这里介绍了插件的执行原理, 我作了简单的翻译并且加了一部分注解.

和大多数的分布式系统相似, xdist里有masterworker的概念.master负责整个测试任务的调度, 测试报告等工作, 而worker则是实际执行测试的宿主进程.

具体的测试执行的流程如下:

  1. 在test session的起始阶段, xdist会spawn一个或者多个worker进程. masterworker间的通信基于 execnet 和它的gateways. worker的解释器可以是本地或者远程的.

  2. 收集测试项:

    每个worker是个迷你的pytest runner对象. workers这时会执行一个完整test collection过程, 然后将结果发回到master(master本身不做测试收集工作).

  3. 测试收集检查:

    master收到这些节点发回的结果后, 执行一些sanity检查以确保所有worker节点都收集到相同的测试项(包括顺序). 当所有的检查都通过后, 再将这些测试项转换为一个简单的索引列表, 每个索引对应一个测试项的在原来测试集中的位置. 这个方案可行的原因是所有的节点都保存着相同的测试集, 并且使用这种方式可以节省带宽, 因为master只需要告知节点需要执行的测试项对应的索引, 而不用告知完整的测试项信息.

    FAQ环节其实提到, 在各个node上单独执行测试收集工作是因为如果在master上执行测试收集,那么就需要作很多序列化处理, 因为worker是进程级的. 这会使问题复杂化, 并且使pytest变得不易于维护.

  4. 测试分发:

    • 如果dist-modeeach, 那么这时master只需将完整的列表发送给每个节点.
    • 如果dist-modeload, 那么这时master会将大约25%的测试项以轮询的方式发往各个worker. 剩余的测试项则会等待workers执行完测试以后分发, 见下文.

    注意: pytest_xdist_make_scheduler 这个hook可以用于实现自定义的分发逻辑.

  5. 测试执行:

    workers 重写了 pytest_runtestloop: pytest的默认实现基本上是循环执行所有在session这个对象里面收集到的测试项, 但是在xdist里, workers实际上是等待master为其发送需要执行的测试项的. 当worker收到测试任务, 就顺序执行 pytest_runtest_protocol. 值得注意的一个细节是:workers 必须始终保持至少一个测试项在的任务队列里, 以兼容pytest_runtest_protocol(item, nextitem) hook的参数要求.为了将 nextitem传给hook, worker会在执行最后一个测试项前等待master的更多指令.如果它收到了更多测试项, 那么久可以安全的执行 pytest_runtest_protocol , 因为这时nextitem参数已经可以确定. 如果它收到一个 "shutdown"信号, 那么就将 nextitem 参数设为 None, 然后执行pytest_runtest_protocol .

  6. 测试分发(Load模式):

    当测试项在 workers里的开始/结束执行时, 测试结果会发回到master, 这样其他pytest hooks比如pytest_runtest_logstartpytest_runtest_logreport就可以正常执行.master (处于loaddist-mode时)在节点执行完一个测试后, 基于测试执行时长以及每个节点剩余测试项综合决定是否向这个节点发送更多的测试项.

  7. 测试结束:

    master没有更多待执行测试项时, 它会发送一个"shutdown"信号给所有workers, worker将剩余的测试项执行完毕并退出进程. master则一直等待workers全部退出, 当然此时任然需要处理诸如pytest_runtest_logreport等事件.

Best Practice

在了解了pytest-xdist的实现原理后, 为了保证开发的插件能够正常与其配合(没办法, 这个插件太流行了), 建议在插件开发时:

  • 对于只需在master上执行的代码, 比如report类插件, 通常只需在master节点上初始化一遍并处理各个report对象. 我们可以通过判断 hasattr(config, 'slaveinput')来确定是否为worker节点, 区分处理相逻辑;

  • 由于测试执行实际是在各个worker节点上执行的, 在pytest_runtest_makereport等hooks里要避免对象实例化操作, 因为你的实例化对象在序列化时会报错, 比如某些测试使用了下面的conftest.py文件:

    import pytest
    
    
    class SomeThing(object):
        pass
    
    
    @pytest.hookimpl(hookwrapper=True)
    def pytest_runtest_makereport(item, call):
        outcome = yield
        report = outcome.get_result()
        report.something = SomeThing()
    
    
    def pytest_runtest_logreport(report):
        print('something: %r' % report.something)
    

    那么当你使用pytest -n执行时, 就会报类似这样的错误:

    INTERNALERROR> raise DumpError("can't serialize {}".format(tp))
    INTERNALERROR> execnet.gateway_base.DumpError: can't serialize <class 'conftest.SomeThing'>

    正确的做法是, 将需要保存的数据保存到report对象, 比如下面这段代码可以将测试执行的时间戳保存在report对象里, 之后worker便会将report同步给master节点:

    def pytest_runtest_makereport(item, call):
      outcome = yield
      report = outcome.get_result()
      if report.when == "call":
            report.call_start = call.start
            report.call_end = call.stop
    
  • 目前发现除了自定义的类以外, 诸如datetime类型也是不能直接序列化的, 遇到这种情况可以考虑将其保存为timestamp, 之后再做类型转换操作.

  • 还有一种典型的错误是, 将诸如pytest_runtest_makereport的hook函数写成类的方法, 由于此类hook函数是在worker节点执行的, 如果这个类只在master节点上进行了实例化, 相当于写了个无效的hook函数, 而且这时虽然程序不会报任何错, 这点要特别注意.

总之, 牢记config对象是进程间独立的, 但是report对象之间的值可以互相同步的, 但是要避免同步对象;

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,319评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,801评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,567评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,156评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,019评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,090评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,500评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,192评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,474评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,566评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,338评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,212评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,572评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,890评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,169评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,478评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,661评论 2 335

推荐阅读更多精彩内容