黑盒测试进阶之后端server巧用对比测试

本文章转载于搜狗测试

一、什么是对比测试

一般而言，对比测试是一种将两个可比较的对象、在相同的环境下、使用特定的工具或方法等进行比较后，分析两者之间的变化情况是否有潜在风险、是否符合测试预期的方法。

二、为何要做对比测试

后端server测试常遇到这样的问题：测试某些任务如server重构或业务逻辑特别复杂、引入新计算模型等任务时，小数据集的功能测试和大数据集的性能测试，并不能可靠地评估性能、效果变化是否符合预期。对比测试能在数据多样、逻辑繁多复杂的测试任务中，帮助测试人员发现更多待测对象内部问题, 更全面地保证任务的测试质量、降低出现问题的风险。

三、对比测试适用对象

需要评估性能、效果变化影响的持续迭代的server或流程测试任务，以及需要验证功能是否一致但功能自动化测试覆盖率低的server或流程测试任务。

四、如何做对比测试

后端server对比测试的常规操作方法是，尽可能保持测试环境一致性前提下，通过对新旧两版server分别进行同大数据量输入，结束后统计和对比日志，得到对比结果。

对比测试一般有功能一致性对比、效果对比和性能对比。通常情况下，同server的版本迭代，不会引起性能、效果等的大幅度变化。

功能一致性对比

功能一致性对比指将新旧版server输出结果相关日志按字段逐一进行异同比较，预期结果是除时间、随机字段等不确定或无意义字段外，其他字段值对比一致。一致性对比对测试环境要求很高，除了新旧版本运行环境一致外，还需事先排除环境配置和数据中不可控因素如流量比例。

案例

在商业广告后端server测试中一致性对比亦发挥极其重要的作用。某测试任务的测试场景是广告server的某个id从32位升至64位，涉及到id定义、赋值、输出等升级修改，但不涉及server代码逻辑变动。由于广告server功能模块多，逻辑复杂，代码量大，若仅仅采用代码走读方法测试需要测试人员非常熟悉server全部代码且火眼金睛，同时有足够长的测试时间，否则遗漏未改处不易发现，以致导致极严重后果。而采用一致性对比测试，若某正常日志字段对比不一致，即可定位到某处id未修改或修改错误。

上图是server log中的查询词返回广告对比结果示意图，通过逐字段对比可见日志35字段有差异，同时本次打压发现有8%的结果数据有差异，通过该差异定位到server某功能模块代码中id修改遗漏导致数据截断，业务逻辑失效。

效果对比

服务效果有对应的效果指标，如消耗（收益）、过滤比例等。为了能尽快在比较中发现问题，设定的效果指标要全面、并逐级细化。

案例

消耗对比常用于评估商业广告后端server提升或优化效果。从总体消耗入手，细化到各个渠道或策略，再进一步细化到各个广告位，分渠道分广告位统计和对比消耗，并给出差异情况。通常情况，一定比例范围内的差异如2%属于正常情况。

消耗对比在商业广告后端的Xserver中统计，该server日志记录了与消耗统计相关的多个信息字段。评估后端某个server对广告消耗的影响时，可通过搭建整套的商业广告后端server测试拓扑，对比测试时仅切换待测server新旧版本。如下图所示是某次测试任务消耗对比图之一，可见新server广告效果有一定幅度提升。

性能对比

通常性能测试是获得server在某种特定条件下的性能指标数据，作为后续的参考和对比依据，其往往受硬件系统、测试环境（配置和数据）等外在因素影响，易与标准值产生偏差。性能对比不失为一种独辟蹊径的性能评估方法，其可将外在因素导致的偏差降到最低，同时测试人员亦不必准确掌握服务各性能指标的标准值。

案例一

性能对比常用于评估商业广告后端server的性能影响，测试时除了采用部分通用性能测试指标外，还可根据待测server的自身特点和测试目的建立特有性能指标。在某server性能对比测试中，采用如下性能指标：CPU、虚存、实存、负载均值、句柄数、平均响应时间、总超时率、rs超时率、qs超时率、丢包率10个指标。

特有性能指标对比：

通用性能指标对比：

如上图所示是该server某测试任务的性能对比图，其任务场景是server新增一接口字段代替原有字段并更新对应逻辑，server整体功能不变，评估性能影响。对比结果一目了然：新server平均响应时间约增加 0.05ms，其他指标不变（系统负载正常波动），经评估这个结果符合预期。

案例二

案例一server在某次重构测试任务中，性能对比结果除句柄数外其他9个指标不变（系统负载正常波动），句柄数有变化这不符合预期（如下图所示）。经检查发现句柄泄露，这是由于新server不断创建线程却未相应调用CloseHandle进行释放，导致句柄数量不断增加，而操作系统对句柄最大数量是有限制的，在达到最大数量后将会导致server停止提供正常服务。

五、对比测试平台化

上述三种对比测试方法均没有特定的比较工具，需要根据需求，编写脚本或代码完成各项数据或指标对比。根据测试经验，为保证对比测试结果的可靠性，每次测试任务中同种对比测试平均进行三次，观察三次对比结果是否稳定。同时对比测试时务必确保新旧server运行环境的一致性。这些工作包括操作测试、收集测试结果等都非常耗时间人力，也易出差错，为了提高测试效率和质量，亟需对比测试平台化，通过测试平台自动地完成测试环境准备，测试数据收集及测试结果展示。

目前商业测试团队开发了自动化、可视化的测试平台，提供测试环境的一键式部署和一致性对比，支持多种测试类型的自动化测试，支持测试数据自动收集，并提供多种报表形式展示结果数据。对比测试亦已纳入平台，并正逐步完善中。

对比测试作为一种辅助测试手段，在持续迭代的后端server的巧用能有效提高测试效率、保证测试质量。本文希望带给大家一种不同的思路，也欢迎大家一起探讨。

最后编辑于：2017.12.09 01:24:29

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,468评论 5赞 473
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,620评论 2赞 377
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,427评论 0赞 334
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,160评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,197评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,334评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,775评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,444评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,628评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,459评论 2赞 317
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,508评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,210评论 3赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,767评论 3赞 303
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,850评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,076评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,627评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,196评论 2赞 341

黑盒测试进阶之后端server巧用对比测试

推荐阅读更多精彩内容