
電 話:(0551)63603412
E-Mail:ykli@ustc.edu.cn
個人主頁:http://staff.ustc.edu.cn/~ykli
主要研究方向:存儲係統、內存係統、雲計算、Serverless、智能計算與分布式係統。
李永坤,男,特任教授,IEEE、ACM、CCF會員,信息存儲專委委員。本科畢業於中國科學技術大學,博士畢業於香港中文大學,師從John C.S. Lui教授。主要致力於麵向大規模數據密集型計算的存儲係統研究,共發表論文70餘篇,包括FAST、ATC、ICDE、SIGMETRICS、TOS、TC、TPDS等。主持國家自然科學基金青年與麵上項目、安徽省自然科學基金項目、華為、PingCAP、阿裏等提供的多項企業合作項目,以單位負責人參與科技部重點研發計劃課題、重點研發青年科學家項目。入選中科院青促會並獲評優秀會員,獲評唐仲英基金會仲英青年學者、翟光龍學者等。
導師選題:
麵向服務器無感計算的多租戶大模型推理係統 | 大模型是當前最重要的技術變革之一,構建多租戶大模型推理係統,是實現大模型應用落地必須的基礎係統。由於大模型推理任務在多租戶場景中呈現突發性負載特征,而服務器無感計算雲服務範式憑借其細粒度計費模式和高彈性優勢,能夠針對這一特性提升GPU集群利用率,降低推理成本。麵向服務器無感計算,構建多租戶大模型推理係統,對於充分釋放集群性能至關重要。主要參考文獻:ServerlessLLM@OSDI24, vLLM@ SOSP23。 | 麵向數據密集型計算的資源池化 | 當前主流的存算一體係統架構麵臨著計算與存儲資源耦合的問題,資源擴容能力差,且難以跨節點共享。未來數據中心的發展趨勢是將關鍵資源解耦,通過高可擴展性的高速互聯網絡(CXL/NVLINK/RDMA)聚合與共享大規模資源池,突破傳統架構的資源約束。該課題主要關注池化後的資源如何高效使用,麵向數據庫、微服務與大模型等常見業務場景,研究如何降低應用遷移到池化架構的難度,並隱藏跨網絡訪問帶來的性能損失,以充分利用池化架構下的共享能力、可擴展性與容災能力。主要參考文獻:Pond@ASPLOS23,Memliner@OSDI22, LegoOS@OSDI18。 | 麵向終端大模型推理的操作係統支持 | 隨著大模型等技術的突破、智能手機等終端設備的廣泛普及,麵向智能終端的大模型推理具有非常重要的價值,而麵向該場景的操作係統尤為重要。端側推理通過在本地終端設備上執行計算,有效降低了延遲,提高實時性,並增強用戶隱私保護。然而,端側推理麵臨計算、內存資源有限,以及功耗約束等挑戰,需要重新設計合適的內存管理與存儲係統等,並充分結合大模型推理計算框架等技術,以確保在終端設備的有效資源下實現高效推理,該課題將以開源鴻蒙OS為基礎,研究麵向終端大模型推理的新型內存管理與存儲係統技術。主要參考文獻:Powerinfer@arxiv2023, Powerinfer2@arxiv2024。 |
|