在第一篇论文中,杨智及其指导的博士研究生马林霄(第一作者)与微软的研发人员设计了一种新的深度学习编译系统Rammer(如图1所示。该系统改变了目前深度学习框架的系统结构,通过细粒度的计算抽象和编译,实现高效的深度学习计算加速,推背图全集获得比目前流行的TVM、XLA深度学习编译器高达20倍以上的加速。
在第二篇论文中,杨智及其指导的博士研究生赵汉宇(第一作者)与微软的研发人员设计了一种新的深度学习集群资源管理系统HiveD,它考虑了深度学习模型训练效率和GPU拓扑间的关系,首次提出多租户共享安全性的概念,并设计相应的资源抽象GPU cells和分配算法(如图2所示),能够在理论上共享安全性。
背景链接:OSDI是计算机系统软件领域最的会议,每两年举办一届,被誉为“操作系统原理领域的奥斯卡”,拥有极高的学术地位。国内大学教师2016年在该会议首次发表论文,目前总数不超过10篇。第14届OSDI将于2020年11月4日至6日在班夫(Banff)召开。此次会议398篇,共录用论文70篇,录用率不足18%。
网友评论 ()条 查看