本站訊(通訊員 陳俊潔)10月25日至28日,第32屆軟件可靠性工程國際會議The 32ndInternational Symposium on Software Reliability Engineering (ISSRE 2021)在中國武漢舉辦。智能與計算學部軟件工程團隊的論文《How Long Will it Take to Mitigate this Incident for Online Service Systems?》榮獲ISSRE 2021唯一最佳論文獎(Best Research Paper Award)。該工作由天津大學智能與計算學部軟件工程團隊與微軟亞洲研究院合作完成,其中第一作者為學部2019級碩士生王維靖,指導教師為陳俊潔副教授(第二作者),學部2021級博士生楊林為第三作者,其他合作作者包括:紐卡斯爾大學Hongyu Zhang教授、微軟亞洲研究院副院長張冬梅博士、首席研究員林慶維,以及趙普、喬波、康昱三位研究員;還包括Microsoft 365的Saravanakumar Rajmohan,Microsoft Azure的Feng Gao、Zhangwei Xu以及Yingnong Dang。
線上頒獎截圖
據悉,ISSRE是軟件可靠性領域的旗艦會議,專注于評估、預測和改善軟件產品可靠性、安全性,包括前沿理論方法與創新技術工具等,同時也是中國計算機學會推薦國際學術會議(軟件工程、系統軟件與程序設計語言)B類會議(CCF-B)。
現場展示
該篇論文是AIOps領域首個研究云服務系統異常恢復時間的工作。為了減少服務中斷時間,并保證服務的高質量運行,需要及時緩解在線服務系統中的異常(incident)。對異常緩解時間進行預測可以幫助提高團隊運維的工作效率,由于在線服務系統的異常與傳統軟件缺陷的特點不同,因此針對傳統軟件缺陷修復的時間預測方法并不能應用于本場景。
最佳論文獎
該工作在微軟的20個在線服務系統上對在線服務系統異常的緩解進行實證研究,并進一步提出一種在連續分配場景中預測異常緩解時間的深度學習方法,名為TTMPred。該方法在微軟的4個大型在線服務系統的異常數據上進行了實驗,結果表明本方法顯著優于其他對比方法。
TTMPred方法示意圖
(編輯 趙暉 全莉)