近日,由复旦大学计算机科学技术学院教授彭鑫领导的智能化软件开发CodeWisdom团队与北京大学教授谢涛、新加坡管理大学副教授孙军合作完成的关于微服务故障分析和调试的研究论文“Fault Analysis and Debugging of Microservice Systems: Industrial Survey, Benchmark System, and Empirical Study”(作者:Xiang Zhou, Xin Peng, Tao Xie, Jun Sun, Chao Ji, Wenhai Li, and Dan Ding)被评选为软件工程领域的国际旗帜期刊、CCF A类期刊《IEEE Transactions on Software Engineering》2018年唯一的最佳论文。
该奖项由评选委员会从该期刊2018年录用的109篇论文中评选而出。本次奖项为第一次颁发,隶属于IEEE计算机学会2019年发起资助的最佳论文奖计划。该计划旨在表彰和奖励IEEE计算机学会旗下每个期刊杂志在上一年度发表的最佳论文。
微服务架构已经成为云计算软件应用的主流选择,但是其复杂、多变的运行环境和服务交互使得微服务故障分析和调试成为企业面临的一个重要挑战。此外,由于缺少公开可用的基准系统,学术界在微服务故障分析和调试方面的研究工作还比较少。针对这些问题,研究组首先针对微服务系统的典型故障及其调试过程开展了面向工业界的调查研究,总结了一系列有代表性的微服务系统故障以及常用的故障分析和调试方法,并在自主研发的开源微服务系统TrainTicket(https://github.com/FudanSELab/train-ticket/)上进行了迁移性的故障复现。在此基础上,研究组针对企业广泛使用的微服务故障分析和调试方法开展了经验研究,并提出了一种基于轨迹日志追踪和可视化分析的改进方法。该研究系统总结了工业界微服务系统的典型故障及故障调试的实践方法,同时为后续的微服务技术研究提供了一个开源基准系统TrainTicket以及基于TrainTicket复现的22个典型故障。此外,该研究还针对智能化的微服务轨迹日志分析和可视化提出了相应的技术思路。