有时系统上线之后出现bug,有些bug是非常难出现或者存在特定的用户上,假如我们在开发环境或者测试环境,有时是很难重现出来的,所以对于现场保留或者重现很重要。
此时如果能在生产系统上直接进行“debug”,那得多好,解决问题就更加容易和方便了。
本文是使用阿里开源的技术框架-Java诊断利器:阿尔萨斯Arthas,来解决生产上的问题,当前最新版本是3.1.7。
github地址 https://github.com/alibaba/arthas/,目前star已有18.5K,也说明这个框架多么成功和受欢迎吧。
Arthas并且也提供非常丰富的功能和文档,可以查看https://alibaba.github.io/arthas/quick-start.html 。
这里有关于arthas的简单介绍《开源神器:Java诊断利器Arthas》,不清楚的可以了解下。
相信你早已了解清楚,也可能还没真正实战过吧,那么这篇文章可以帮您体验下它的好处哈。
0
背景
发现生产一个接口返回的跟自己的实现逻辑不符,令人非常不解,多次检查都确保是没问题,并且针对其他用户进行校验是可以百分百确保是OK的。
所以非常令人疑惑而不解,至此借助Arthas来辅助我解决此“难题”!
1下载框架jar包
curl-O https://alibaba.github.io/arthas/arthas-boot.jar
2启动Arthas
java-jararthas-boot.jar
使用dashboard命令可以查看当前Java进程实时数据面板:
当运行在tomcat时,会显示当前tomcat的实时信息,如HTTP请求的qps, rt, 错误数, 线程池信息等等。
启动之后,Arthas会将相关Java进程列表打印出来,此时选择对应的目标Java项目对应下标,这里是:2,紧接着Arthas attach目标Java进程。
3问题排查
命令列表:
非常丰富的命令!
由于系统使用Spring管理Bean实例,并且Bean的生成默认是单例模式。
所以需要从Spring容器中拿出实例对象需要首先获得ApplicationContext实例,当前是借助springmvc RequestMappingHandlerAdapter对象实例。
当前使用tt命令:
tt-torg.springframework.web.servlet.mvc.method.annotation.RequestMappingHandlerAdapterinvokeHandlerMethod
此时,可以看到一个调用列表,包含:索引、时间戳、耗时等。
这里只需要获取其中一个即可,如:index=1000,也就是通过当前实例获取ApplicationContext。
接着,执行
[arthas@11315]$ tt -i1000-w'target.getApplicationContext().getBean("实例name").实例方法("参数")'@Boolean[false]// 返回结果Affect(row-cnt:1) costin73ms.// 当前调用耗时
如上,-i 1000:就是上面说的索引下标1000,target.getApplicationContext():获取ApplicationContext实例,进而通过ApplicationContext获取Spring容器管理的Bean实例,再指定调用的实例方法,并且传递方法参数,即可以达到调用接口的效果。
执行完成命令之后,可以获取到方法的返回结果,还有当前执行的耗时(这对于排查耗时长问题也是非常有帮助的)。
[arthas@11315]$ tt -i1000-w'target.getApplicationContext().getBean("实例name1").实例方法({"参数1","参数2"})'@ArrayList[isEmpty=true;size=0]// 返回List结果Affect(row-cnt:1) costin2ms.
这里的参数可以按照ognl语法进行设置数据,比如List<String>需要用{参数1,参数2}。如果需要更加复杂的参数,比如自定义对象等,可以查看https://commons.apache.org/proper/commons-ognl/language-guide.html获得更详细的ognl使用方法。
通过这次实战,也解决了我的疑惑(问题)。如果使用中有什么问题或者疑问的,欢迎讨论~
Arthas真的是一个硬货,非常好用,非常强大,使用Arthas非你莫属了。
推荐阅读