一文带你了解agent机制

1. 插桩的使用场景

在实际业务开发中，系统层面会有一些公共模块需要进行实现，类似于校验、权限等等，在成熟的解决方案中会通过AOP的方式进行实现。

通常链路日志追踪上，每个公司都会有ELK的解决方案，但是公司的业务线众多的情况下，通常会要求业务系统在日志打印上会增加不同标记来进行区分，方便后续不同业务部门进行成本核算以及权限管控等等，也就是说在日志输出上会有一定的格式要求。

另外，在实际排查问题中往往需要完成的上下文参数才能有助于问题的高效排查，因为平时在系统中主动的编写日志，实际上是一种防御式编程了，那么一定是在写代码时就考虑了这种或者那种的业务异常情况，基本上在线上出现问题的概率会很小。大多数情况，出现线上问题一定是日常开发中没有考虑的地方了，也只能通常arthas去分析。如果涉及到上下游服务时进行沟通的时候，往往上下游开发同学会询问调用服务的参数以及链路的traceid，才能高效的排查。糟糕的是，如果系统中没有提前埋入的话，只能临时去加代码，然后发布到预发等环境上，如果幸运的话能够复现问题，也就能解决。针对这种情况，如果系统能够自动打印出方法的上下文出入参数的话，在每一条链路上并且自动种入traceId的话，这样就能在问题排查场景上更加高效，针对这块日志标准化的能力可以抽象成公共基础能力。

因此，在这样的诉求下，如果涉及到日志标准化改造就需要一套通用的解决方案来进行，来完成日志格式的改造当然有很多的方式来进行推进，比如堆人集中改造：通过团队组织层面，作为技术驱动的事项，有每个同学在原先的log.info（其他日志级别的日志一样）中按照公司的日志格式要求添加部门特殊的业务标记KV对。或者实现一套spring AOP的方案，定义一些注解提供给各个业务系统使用，但是针对存量代码来说，需要投入人力去改造，在类或者方法上添加相应的注解，这种方式也会带来人效很低的问题。

针对上述这些问题，可以通过agent的方式来实现方法级别的字节码插桩并且进行日志标准化。AOP是一类解决方案的“指导思想”，具体的落地实现方式会有很多，比如aspectJ，cglib等等工具，通过记录方案的执行耗时以及异常和方法出入参来完成业务链路的非侵入监控。整体思路是，agent机制提供了“字节码更改”的时机，字节码插桩则是AOP的一种具体落地方式。

在 JDK 1.5 中，Java 引入了 java.lang.Instrument 包，该包提供了一些工具帮助开发人员在 Java 程序运行时，动态修改系统中的 Class 类型。其中，使用该软件包的一个关键组件就是 Java agent。从名字上看，似乎是个 Java 代理之类的，提供了一个可以更改class字节码的时机。有很多开发工具都是基于Java Agent实现的，例如常见的热部署JRebel，各种线上诊断工具（btrace, greys），还有阿里最近开源的arthas。

2. agent使用

2.1 agent静态加载

Javaagent是java命令的一个参数。参数 javaagent 可以用于指定一个 jar 包，并且对该 java 包有2个要求：

这个 jar 包的 MANIFEST.MF 文件必须指定 Premain-Class 项。
Premain-Class 指定的那个类必须实现 premain() 方法。

premain 方法，从字面上理解，就是运行在 main 函数之前的的类。当Java 虚拟机启动时，在执行 main 函数之前，JVM 会先运行-javaagent所指定 jar 包内 Premain-Class 这个类的 premain 方法。premain方法签名如下：

public static void premain(String agentArgs, Instrumentation inst)
public static void premain(String agentArgs)

默认会优先使用带有Instrumentation的premain加载，如果加载了第一个方法，那么第二个方法就不会再去加载。如果第一个方法没有，才会去加载第二个方法。

agent静态启动方式

使用 javaagent 需要几个步骤：

定义一个 MANIFEST.MF 文件，必须包含 Premain-Class 选项，通常也会加入Can-Redefine-Classes 和 Can-Retransform-Classes 选项。
创建一个Premain-Class 指定的类，类中包含 premain 方法，方法逻辑由用户自己确定。
将 premain 的类和 MANIFEST.MF 文件打成 jar 包。
使用参数 -javaagent: jar包路径启动要代理的方法。

在执行以上步骤后，JVM 会先执行 premain 方法，大部分类加载都会通过该方法，注意：是大部分，不是所有。当然，遗漏的主要是系统类，因为很多系统类先于 agent 执行，而用户类的加载肯定是会被拦截的。也就是说，这个方法是在 main 方法启动前拦截大部分类的加载活动，既然可以拦截类的加载，那么就可以去做重写类这样的操作，结合第三方的字节码编译工具，比如ASM，javassist，cglib等等来改写实现类。

2.2 静态加载示例

首先创建一个agent类，其中包含了premian方法，并且通过实现ClassFileTransformer接口来完成一个自定义重写字节码的类。

public class PremainAgent {
    public static void premain(String agentArgs, Instrumentation inst) {
        System.out.println("agentArgs : " + agentArgs);
        inst.addTransformer(new CustomClassTransformer(), true);
    }

    static class CustomClassTransformer implements ClassFileTransformer {

        @Override
        public byte[] transform(ClassLoader loader, String className, Class<?> classBeingRedefined, ProtectionDomain protectionDomain, byte[] classfileBuffer) throws IllegalClassFormatException {
            System.out.println("premain load class !!!");
            return classfileBuffer;
        }
    }

}

配置MAINFEST.MF文件

Manifest-Version: 1.0
Can-Redefine-Classes: true
Can-Retransform-Classes: true
Premain-Class: com.agent.example.PremainAgent

该文件的生成也可以通过maven插件配置后自动生成，具体配置如下：

<plugin>
    <artifactId>maven-jar-plugin</artifactId>
    <version>3.0.2</version>
    <configuration>
        <archive>
            <manifest>
                <addClasspath>true</addClasspath>
            </manifest>
            <manifestEntries>
                <Premain-Class>com.agent.example.PremainAgent</Premain-Class>
                <Agent-Class>com.agent.example.PremainAgent</Agent-Class>
                <Can-Redefine-Classes>true</Can-Redefine-Classes>
                <Can-Retransform-Classes>true</Can-Retransform-Classes>
            </manifestEntries>
        </archive>
    </configuration>
</plugin>

配置JVM参数指定agent路径，启动应用

-javaagent:path-to/agent-core-0.0.1-SNAPSHOT.jar

启动应用后，在类加载之前会先被agent先进行拦截，可以看示例代码的输出：

premain load class !!!
premain load class !!!
premain load class !!!
premain load class !!!
premain load class !!!
premain load class !!!

2.3 agent动态加载

premain的方式是在应用启动执行main函数之前，提供了可以对类进行修改的时机。在main函数执行之后或者说业务应用正常运行后，再去更改类字节码的时机只能通过agentmain方法，具体如下：

//采用attach机制，被代理的目标程序VM有可能很早之前已经启动，当然其所有类已经被加载完成，这个时候需要借助Instrumentation#retransformClasses(Class<?>... classes)让对应的类可以重新转换，从而激活重新转换的类执行ClassFileTransformer列表中的回调
public static void agentmain (String agentArgs, Instrumentation inst)
public static void agentmain (String agentArgs)

具体的步骤和静态加载的基本一致：

新建agent类，其中包含agentmain方法，并在次类中完成对应的agent逻辑。并且，如果需要完成对字节码的更改，同样可以实现ClassFileTransformer接口，将实现类放置到Instrumentation；

完成MAINFEST.MF文件，配置Agent-Class等选项，具体如下：

Agent-Class: com.agent.example.AgentMainAgent
Can-Redefine-Classes: true
Can-Retransform-Classes: true

对MAINFEST.MF文件也可以通过maven插件完成配置，在打包的时候自动生成，具体配置如下：

<plugin>
    <artifactId>maven-jar-plugin</artifactId>
    <version>3.0.2</version>
    <configuration>
        <archive>
            <manifest>
                <addClasspath>true</addClasspath>
            </manifest>
            <manifestEntries>
                <Agent-Class>com.agent.example.AgentMainAgent</Agent-Class>
                <Can-Redefine-Classes>true</Can-Redefine-Classes>
                <Can-Retransform-Classes>true</Can-Retransform-Classes>
            </manifestEntries>
        </archive>
    </configuration>
</plugin>

2.4 agent挂载

动态agent的方式实际上是指业务应用在运行中能够注入一个agent，借助agent完成相应的代理逻辑。那么，怎样才能在JVM运行的时候向其完成注入，自然而然也就涉及到了两个JVM进程之间的通信，可以通过VirtualMachine来完成。

VirtualMachine 字面意义表示一个Java 虚拟机，也就是程序需要监控的目标虚拟机，提供了获取系统信息(比如获取内存dump、线程dump，类信息统计(比如已加载的类以及实例个数等)， loadAgent，Attach 和 Detach （Attach 动作的相反行为，从 JVM 上面解除一个代理）等方法，可以实现的功能可以说非常之强大。该类允许我们通过给attach方法传入一个jvm的pid(进程id)，远程连接到jvm上。

代理类注入操作只是它众多功能中的一个，通过loadAgent方法向jvm注册一个代理程序agent，在该agent的代理程序中会得到一个Instrumentation实例，该实例可以在class加载前改变class的字节码，也可以在class加载后重新加载。在调用Instrumentation实例的方法时，这些方法会使用ClassFileTransformer接口中提供的方法进行处理。

整体流程就是通过VirtualMachine类的attach(pid)方法，便可以attach到一个运行中的java进程上，之后便可以通过loadAgent(agentJarPath)来将agent的jar包注入到对应的进程，然后对应的进程会调用agentmain方法。

2.5 动态加载示例

首先创建一个包含了agentmain方法的agent类，并新建实现ClassFileTransformer接口的类加载到instrument中。

public class AgentMainAgent {
    public static void agentmain(String agentArgs, Instrumentation inst) {
        System.out.println("start agentmain");
        inst.addTransformer(new CusDefinedClass(), true);
    }

    static class CusDefinedClass implements ClassFileTransformer {
        @Override
        public byte[] transform(ClassLoader loader, String className, Class<?> classBeingRedefined, ProtectionDomain protectionDomain, byte[] classfileBuffer) throws IllegalClassFormatException {
            System.out.println("agentMain load class !!!");
            return classfileBuffer;
        }
    }
}

将整个agent进行打包，完成MAINFEST.MF文件配置；

在测试类中中通过VirtualMainche类完成对agent动态挂载到正在运行的JVM进程中

public class AgentTest {
    public static void main(String[] args) throws IOException, AttachNotSupportedException, AgentLoadException, AgentInitializationException {
        List<VirtualMachineDescriptor> vms = VirtualMachine.list();
        for (VirtualMachineDescriptor vm : vms) {
            if ("com.agent.example.AgentTest".equals(vm.displayName())) {
                VirtualMachine machine = VirtualMachine.attach(vm.id());
                machine.loadAgent("/path-to/agent-core-0.0.1-SNAPSHOT.jar");
            }
            System.out.println(vm.displayName());
        }
    }
}

VirtualMachine.list()可以列出当前正在运行JVM进程，示例中通过具体的进程名判断出当前正在执行的JVM，然后通过VirtualMachine.attach与目标VM建立连接后，通过loadAgent的方式将agent挂载到目标VM中。示例代码如下：

start agentmain
com.agent.example.AgentTest
  
agentMain load class !!!
agentMain load class !!!

agent机制提供了在应用执行前或者应用执行后，能够获取class字节码的时机，并且能够通过更改class字节码的方式来完成相应的业务逻辑，比如方法级别的监控、日志标准化等等AOP常见的业务场景，这种方式对业务应用的侵入性是最低的，并且性能是相当可观的。在后续文章中会总结下字节码的使用、基于字节码插桩完成业务监控以及实际开发中遇到问题。

参考资料

https://www.cnblogs.com/rickiyang/p/11368932.html#3812389359

https://www.cnblogs.com/huanshilang/p/12206644.html

最后编辑于：2021.06.25 11:52:38

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342