2024年9月24日至27日,2024年度IEEE國際集群計算會議(IEEE International Conference on Cluster Computing,IEEE Cluster)在日本神戶召開。我校188滚球网 孫廣中教授團隊發表的論文“Siesta: Synthesizing Proxy Applications for MPI Programs”獲唯一最佳論文獎(Best Paper Award)。
基於消息傳遞接口(Message Passing Interface,MPI)的並行程序是目前超級計算機上運行的主要程序類型。在評測超級計算機性能時,由於科學、工程領域中實際使用的MPI程序具有高度的複雜性、專業性,難以簡便快捷地部署、運行和測量,因此常常使用代理程序(Proxy application)來代替。代理程序是真實MPI程序的簡化版本,代碼量小、庫依賴關係少、僅保留部分關鍵功能,在性能表現上與真實MPI程序具有相似的特征。
盡管是簡化版本的程序,代理程序仍然高度依賴於科學、工程領域專家與並行計算專家的協作開發,需要額外的人力和時間成本,因此通常隻能覆蓋最重要的少量MPI程序,無法滿足廣泛的定製化需求。同時,對於保密或者商業軟件,其源代碼也無法提供給專家來設計代理程序。針對這些問題,論文提出了一種自動合成代理程序的方法。對於任意給定的無源代碼的MPI程序,通過追蹤MPI程序的計算、訪存、通信等事件,獲取其行為序列和性能指標的記錄(稱之為trace)。基於文法分析,對trace中隱含的程序行為模式給出一種推測和壓縮表示,並將這一表示轉換為可編譯執行的代碼片段組合,作為給定MPI程序的代理程序。整個處理流程中無需了解給定MPI程序的領域知識,可以完全基於腳本和工具軟件自動化地進行,有效減少代理程序開發的人力和時間成本,提升代理程序的應用覆蓋範圍和更新頻率,在高性能計算領域中具有廣泛的應用前景。
自1999年創辦以來,IEEE Cluster已經成為分布式與並行計算領域非常重要的國際會議,是中國計算機學會(CCF)推薦的B類國際學術會議。大會在分布式係統、高性能計算、體係結構方麵對學術界和產業界均有廣泛的影響力。
論文通訊作者為孫經緯特任副研究員,第一作者是188滚球网 2023級博士生羅極羽,第二作者和第三作者分別為閆韜(2023屆碩士)和徐慶國(2024屆碩士)。三位研究生由孫廣中教授和孫經緯特任副研究員共同指導。該研究工作曆時2年,得到了國家自然科學基金青年項目、中國科學技術大學理實工程的資助,實驗平台得到了中國科學技術大學超級計算中心支持。