来源 | 阿里巴巴云原生公众号
随着微服务的流行,应用更加轻量和高效,但是带来的困境是线上问题排查越来越复杂困难。传统的 Java 排查问题,需要重启应用再进行调试,但是重启应用之后现场会丢失,问题难以复现。
因此自 2018 年 9 月,阿里巴巴开源了久经考验,深受开发者喜爱的应用诊断利器 Arthas。
Arthas 通过创新的字节码织入技术,可以在应用无需重启时,查看调用上下文,高效排查问题;结合火焰图,可以直接定位热点,发现性能瓶颈;通过字节码替换,实现在线热更新代码;同时支持黑屏化和白屏化诊断,可以连接诊断大规模的集群。
在 2020 年 5 月时,我们做了 Arthas Star 破 2 万的回顾:
冬去春又来,转眼间一年过去了,Arthas 的 Star 数突破 2.5 万了~
下面来回顾 Arthas 去年的一些数据和工作。
Arthas 的开源贡献者人数从 85 增长到 119,非常感谢他们的工作:
过去一年,Arthas 在工商银行、中原银行、朴朴科技、贝壳找房、斗鱼等生产场景落地,欢迎更多用户登记:https://github.com/alibaba/arthas/issues/111。
人均体验时长 23 分钟以上。
上线了 Arthas 新网站之后,我们统计平均每个月 arthas zip 包下载 6.5 万次。所以保守估计,Arthas 平均每个月诊断 6W+ 台机器。
阿里内部的技术论坛 ATA 发布年度热搜关键词 top 100,Arthas 作为 Java 诊断神器是唯一进入 top 10 的非集团指定产品。Arthas 在阿里内部的受欢迎程度可见一斑。
在过去的一年里,Arthas 发布了 19 个 release 版本,做了大量的改进,下面列出一些重点:
Github:https://github.com/alibaba/bytekit
Bytekit 框架可以通过简洁的注解来实现字节码增强,具体功能点:
public static class SampleInterceptor {
@AtEnter(inline = true, suppress = RuntimeException.class,
suppressHandler = PrintExceptionSuppressHandler.class)
public static void atEnter(@Binding.This Object object,
@Binding.Class Object clazz,
@Binding.Args Object[] args,
@Binding.MethodName String methodName,
@Binding.MethodDesc String methodDesc) {
System.out.println("atEnter, args[0]: " + args[0]);
}
比如在 Dubbo Filter 里插入 APM 代码:
@Instrument(Interface = "org.apache.dubbo.rpc.Filter")
public abstract class DubboFilter_APM {
public Result invoke(Invoker<?> invoker, Invocation invocation)
throws RpcException {
System.err.println("invoker class: " +
this.getClass().getName());
Result result = InstrumentApi.invokeOrigin();
return result;
}
}
通过 Bytekit 框架,Arthas:
Http API 提供类似 RESTful 的交互接口,请求和响应均为 JSON 格式的数据。相对于 Telnet/WebConsole 的输出非结构化文本数据,Http API 可以提供结构化的数据,支持更复杂的交互功能。
在今天,应用的安全越来越受到重视。因此,诊断工具在提升诊断效率的同时,也要注意自身的安全性。 因为 Arthas 增加了 auth 命令,并且统一了 Telnet/WebSocket/HTTP API 的鉴权,参考:
之前,Arthas 里的 redefine 命令已经支持热更新功能,但是容易和 jad 命令或者其它 java agent 冲突。因此,我们开发了全新的 retransform 命令。
retransform 命令和 watch/trace 命令等是同一机制下实现的。如果对同一个类执行多个命令,则会经过下面的处理:
retransform 命令 -> watch 命令 -> trace命令
可以看到,retransform 命令执行后,不会影响 watch/trace 命令。
通过 Arthas Tunnel Server/Client 可以远程管理/连接多个 Agent。Tunnel Server 新增加功能:
通过 arthas-spring-boot-starter,用户可以直接以编程方式引入 Arthas,结合 Tunnel Server,可以轻松实现集群化管理。
之前,Arthas 的文档放在 github io 的域名下,经常访问失败。为了改进访问速度,因此,我们建设了全新网站,用户访问文档和下载 Arthas,都更加方便快捷。
Arthas 征文活动一共办了七期,共收到投稿 30+ 篇,下面是一些优秀的文章:
有奖征文活动还在继续,欢迎大家分享~
投稿地址:http://alibabacloud.mikecrm.com/9khcRrs
去年,我们规划了三个目标:
实际上完成了 2.5 个,其中插件化支持,我们孵化出全新的 One Java Agent 项目来实现。
One Java Agent 项目的目标:
从开源到现在,Arthas 在 Github 上一共有 1200 多个 Issue,最近我们回收了第一个 Issue:
在不断增强功能的同时,我们一直在持续改进 Arthas 的易用性。
我们相信:赠人玫瑰之手,经久犹有余香,感谢广大用户的支持和喜爱。
欢迎登陆 start.aliyun.com 知行动手实验室体验 Arthas 57 个动手实验: https://start.aliyun.com/handson-lab/#! category=arthas
Arthas 实验预览