快捷搜索:  as  MTU2MjExNTkwMQ`

Hill认为中国的计算机体系结构研究绝对是第一流

2019年谋略机体系布局最高奖Eckert-Mauchly奖揭橥给威斯康辛大年夜学麦迪逊分校教授Mark D. Hill,表彰他对存储系统和并行谋略机的设计和评估作出的精彩供献。本文还带来了对Hill教授的专访,Hill觉得中国的谋略机体系布局钻研绝对是最高级、有创造性的。

Eckert-Mauchly 奖是谋略机体系布局领域最负盛名的奖项,以 1947 年出生的天下上第一台电子谋略机 ENIAC 的两位发现人 John Presper Eckert 和 John William Mauchly 的名字命名。

Eckert-Mauchly 奖始于1979年,由ACM和IEEE谋略机协会合营辅助,该奖项表彰对谋略机和数字系统体系布局的供献,奖金5000美元。历史获奖人中有六位终极得到了图灵奖,包括得到2017图灵奖的David Patterson。此外还有一批靠近图灵奖的大年夜神们,比如Gene Amdahl、Seymour Cray、Gordon Bell等。

2019年Eckert-Mauchly 奖揭橥给威斯康辛大年夜学麦迪逊分校教授Mark D. Hill,表彰他对存储系统和并行谋略机的设计和评估作出的精彩供献。作为天下领先的存储系统钻研职员,Hill在高速缓存、存储同等性模型、事务性存储和模拟等领域做出了创始性的供献。Hill与160多名配相助者的著作已被引用跨越20000次。

Mark D. Hill教授

Mark D. Hill 是当今谋略机体系布局学术圈内最有名的学者之一,他于 1981 年卒业于密歇根大年夜学安娜堡分校( University of Michigan, Ann Arbor),1983 年在体系布局大年夜师 Alan Jay Smith 的指示下于加州大年夜学伯克利分校(University of California Berkeley)取得硕士学位,1987 年在 Alan Jay Smith 和另一位体系布局学术界泰斗 David Patterson 的指示下得到伯克利的博士学位。此后 Mark Hill 不停生动于学术界,在谋略机体系布局领域的许多问题上都做出了卓越供献,包括缓存同等性、TLB 设计,事务内存,确定性重演等, 此中有八篇论文入选 IEEE Micro 顶尖论文荟萃( IEEE Micro Top Picks),对 Mark Hill 的学术著作的总引用数跨越两万,他的另一项广为人知的供献是现在体系布局教科书上必须说起的 Cache 3C 模型。因为 Mark Hill 在内存懈弛存子系统上的精彩供献,他于 2000 年和 2004 年分手入选 IEEE Fellow 和 ACM Fellow。今朝 Mark Hill 是威斯康辛大年夜学麦迪逊分校(University of Wisconsin-Madison)的谋略机科学系系主任。

在20世纪80年代,Hill开拓了关于缓存掉效的“3C 模型”。“缓存掉效”(cache miss)是指谋略机的缓存中没有找到软件或硬件哀求处置惩罚的数据。cache miss会导致延迟,由于法度榜样或利用法度榜样必须在其他位置造访数据。Hill的3C模型将这些缓存掉效的环境分为“强制掉效”(Compulsory miss)、“容量掉效”(Capacity miss)和“冲突掉效”( Conflict miss)。这个模型很有影响力,由于它带来了一些紧张的立异,比如受害者缓存(victim caches)和流缓冲器(stream buffers),现在已经成为谋略机体系布局教科书中的标准观点。

许多人觉得Hill在缓存同等性模型方面的事情是他最紧张的供献。他与门生Sarita Adve一路,为DRF开拓了SC:一个应用顺序同等性(SC)的同等性模型,可以避免数据竞争(data rac++e free,或DRF)。Hill的SC for DRF模型对谋略机架构师孕育发生了重大年夜影响,分外是当多处置惩罚器变得无处不在的环境下,架构师不得不斟酌在架构和实现中应用哪种内存同等性模型时。在Hill为DRF开拓SC多年之后,它成为了Java和c++内存模型的根基,并且近来,SC for DRF模型与图形处置惩罚器(GPU)一路被用于理解异构处置惩罚器的内存同等性。

Hill的第三个主要供献是他在事务性内存方面的事情,这是一种最小化临界区壅闭的技巧。Hill与David Wood一路开拓了LogTM事务性内存系统,这是最早的、且被广泛引用的事务性内存措施之一。这个系统第一次使事务越过了它们的缓冲区懈弛存容量,使得法度榜样员可以更轻易地实现事务。

Hill(与David Wood等人)也对并行谋略机的评估做出了紧张供献。例如,威斯康辛州的风洞项目率先在并行机械上运行快速并行模拟。Hill还开拓了其他紧张的对象来评估内存系统和并行谋略机,包括Dinero缓存模拟器、GEMS full system模拟器和gem5,这些对象已经被钻研职员和实践者引用了3000多次。BadgerTrap是他最新开拓的对象之一,钻研虚拟内存行径。Hill对虚拟内存的实现也有紧张的影响。例如,他提出了“page reservation”的观点,现在在Linux中应用。

Hill将于6月22日至26日在亚利桑那州凤凰城举行的ACM/IEEE谋略机体系布局国际研讨会(ISCA)上正式得到该奖项。

专访Mark D. Hill教授:中国在进行绝对最高级的、有创造性的钻研

2017年ASPLOS(谋略机体系布局领域的一个顶级国际会议)时代,中科院谋略所先辈谋略机系统钻研中间黄博文同砚等一组人采访了Mark D. Hill教授,谈到中国的体系布局钻研、学术界与工业界的关系、学术钻研的品味、若何赞助中国的体系布局学术圈维持康健进步等问题。

新智元经授权转载如下:

访谈人物 - Mark D. Hill

关于中国的体系布局钻研以及 ASPLOS

采访小组:您如何看待 ASPLOS 与其他几个体系布局顶级学术会议 MICRO,HPCA,ISCA 的关系?

【编注:Architectural Supportfor Programming Languages and Operating Systems (ASPLOS), International Symposium on Microarchitecture (MICRO), High Performance Computer Architecture (HPCA), International Symposium on Computer Architecture (ISCA)】

Mark:ASPLOS 的意义是让体系布局连接操作系统和编程说话。20 年前,体系布局钻研社区有一段难以保持的经历,ISCA [1] 差点办不下去,做微布局的人不乐意去改指令集,而操作系统和编程说话钻研社区的人对不具备兼容性的设计都不买账,当时对 ASPLOS 的需求还不那么显着,然则后来摩尔定律变慢,能效就必须来自于跨层次的协作优化,现在 ASPLOS 的紧张性就大年夜大年夜高于 20 年前。

采访小组: 这是 ASPLOS 第一次在中国举办,海内有声音觉得这是中国进入体系布局学术圈核心竞技圈的一个标志,不知您若何看待?

Mark:首先,谋略机体系布局年会(ISCA)已经于 2008 年在北京举办过。以前这些年,中国在谋略机体系布局,甚至全部谋略机科学钻研上的进展确凿令人印象深刻。

采访小组:是的,几位中国大年夜陆的青年教授奉告我们 ISCA08 改变了他们这一代体系布局钻研职员,例如那一届 ISCA 过后,陈云霁师长教师就颁发了中国大年夜陆有史以来第一篇 HPCA 论文。现在已颠末去了十年,现在中国又有了第一篇 MICRO 最佳论文,ASPLOS 最佳论文 …

Mark:对,我感觉这里面很紧张的一点是,为了这样一篇论文,你必须有很好的 idea,然后必须用一种学术会议吸收的说话把它清晰地表达出来,包括环抱这个 idea 的故事。因为你们来自中国,你们在这方面会有劣势。中国的钻研职员降服了这种说话劣势,令人印象深刻。我自己很幸运,我写论文用的是自己的母语。

采访小组:除了说话之外,您如何看待中国的体系布局钻研质量? 您是否觉得中国的钻研质量已经能够与美国并驾齐驱,或者仍旧有所后进?

Mark:我感觉从钻研角度上来说,不能断言说全部美国有一个什么样的钻研水平,由于有的人钻研质量很高,也有的人钻研质量参差不齐,有的人钻研兴趣对照广,有的人则钻研面对照窄,我感觉这在中国也是一样的。现在的差别是,中国确凿在进行绝对最高级的、有创造性的钻研,而二十年前,中国的钻研更多的是做一些增量式的改进。某种程度上来说,中国的公司也是一样的,二十年前他们是快速跟随者,然则现在则是立异引导者。例如现在中国的手机已经不再跟随 iPhone,它们在很多必要本地化的方面远强于 iPhone。

关于学术界与工业界的关系,以及学术钻研的品味问题

采访小组:我们感觉自己是一个落后者,还必要做很多工作去追赶对付美国来说已经完成的成绩。例如说,威斯康辛大年夜学麦迪逊分校和工业界维持着有成效的相助关系,比如威斯康辛与 Intel,与 AMD 的相助,而在中国这种学术 - 工业相助才刚开始孵育,我们盼望能听听您的意见。

Mark:建立与工业界公司的关系确凿有艰苦。你可以想象,工业界的人异常繁忙,光阴宝贵,以是你拿出来的器械要对他们有代价,例如让他们提前打仗门生,能提出零丁赞助那个公司的 idea. 关键的一点是,不要去做跟公司的下一代产品太切近的器械,这会让工业界的人首要,并且因为无法获取公司内部的资本,大年夜学在这类事情中平日处于劣势。选择那些工业界还不乐意投入资本去做的器械是则是一件好事,例如,我们在本届会议上有一篇论文(当然是门生做的主要事情),关于非易掉性内存,把非易掉性内存挂在内存总线上。但这什么时刻会真的变成现实,工业界并不知道,他们以致不知道这会不会发生。而我们就可以开始钻研这些,由于我们并不必要抉择这些器械会鄙人一代、下下代、下下下代产品上应用,而工业界的人会很痛快看到我们在做这个,虽然他们现在并不乐意自己去做,但他们可以看到我们对一些办理规划的筹划,并对门生进行了办理这类问题所需的练习,这些门生之后就可以进入公司事情。

采访小组:我们现在跟工业界的公司有一些相助,例如赞助设计他们下一代处置惩罚器上的某个部件,并且有明确的机能要求……

Mark:工业界现在让你们去钻研这个问题?

采访小组成员:是的。

Mark:我感觉这更像是一种 “条约工”,切实着实有其代价,但与做一个公司的 “钻研伙伴” 是不一样的。有一些我以前发明对照好的要领是,可以送门生去工业界训练,门生不能从工业界带回谜底,由于公司对这有常识产权,然则门生可以从工业界发明潜在的问题,这便是好的钻研点。

采访小组:以是您的意见是,我们并不太得当去做这种需求急切的钻研,作为替代,我们应该去做超前几代产品的钻研?

Mark:是的,需求急切的钻研并不是大年夜学的长处,这完全取决于现有的工业界繁杂设计里面的各种细节,而这些信息都是你无法获取的。我就无法设计一个部件然后比 Intel 做的更好,他们在这个问题上懂得的比我多太多了。一个例子是,Abhishek [2] 在这届会议上有一篇论文,他察看到经由过程使用一些 TLB miss 的信息,去指示预取。这是异常好的钻研点,但假如工业界有人抉择采纳这个点子,我并不觉得他们会完全按照 Abhishek 的设计去做,由于工业界对设计的细节懂得更多。

采访小组:您刚才提到很紧张的一点,就算钻研成果被采纳,着末落地于产品的设计也很可能会与论文中的不合,那我们若何与工业界分享 credit?

Mark:这是对照难的一个问题,工业界并不老是爱好分享 credit,无论你拿到的 credit 是什么样的,这种 credit 只会在学术界中通畅。你的回报是获得了发现新设计的成绩感,练习了门生,假如没有获得工业界给予的 credit,我并不会是以掉眠。工业界的人并不长于给予 credit,以致无意偶尔会是以被告上法庭。然则这很难定论,被采用的 idea 很少是从零丁一个泉源完备地来的,会颠末改动,而且是别人的改动。我感觉 credit 有两种,一种是外在的,别人奉告你你干的很好,一种是内在的,你自己知道你很棒。我感觉内在的 credit 更紧张,你必须在这一点上成熟,有很多人想要的是外在的 credit。

采访小组:我们都很好奇,威斯康辛以前曾和 Intel 有过专利官司,现在也和苹果有专利官司,当您跟工业界有不同等的时刻,您会怎么办?

Mark:那个专利是 Guri Sohi 教授和他几个门生所有的。

Mark 的门生:实际上是 WARF 所有的,以是应该是全部威斯康辛大年夜学与外貌公司的诉讼,而非几个教授或者门生。

Mark:是的。这是对照难的一件工作。看上去,那些公司觉得这是一种更好的策略,就算偶有专利侵权,也倾向于选择诉讼而不乐意举行一次会晤见告然后付应用费。我盼望 Intel 和 Apple 在应用前能来打声呼唤,嘿我们用了你的专利,你应该享有 credit,然则他们抉择不去这样做。

采访小组:假如我们看以前这些年的谋略机学术界成长,确凿有一些成果推动了工业进步,例如多核,多线程,都是从学术圈出来的,然则现在这样的时机感到变少了,不知道您现在若何看待与工业界的关系?

Mark:你是说,以前我们有钻研成果进入工业界,然则现在我们能推进工业界的钻研不如曩昔那么多了?

采访小组:是的,现在工业界掌控了大年夜部分技巧和数据,能够在真实的大年夜规模数据上做实验,而黉舍只能去跟随工业界的事情,很难颁发好的事情、做好的钻研。

Mark:嗯,这里有两件事。一个是,现在大概有很棒的改变正在发生,然则我们并没有察觉它有多么棒,直到五年后,十年后。另一件事是,不要考试测验去做那种让 Intel 的高端芯片变得更好一点点的那种钻研,你很难做的比他们优化更好,应该去做那种异常不一样的、并且有赞助的 idea。

Mark 的门生:你知道 PhD 的含义吗?

采访小组:永远性脑损伤(Permanet Head Damage)? (笑)

Mark 的门生:我是说实际含义(笑),事实上它是从哲学开始的。

采访小组:是的,我知道。

Mark 的门生:你得做出哲学意义上的改变,才能够去做与工业界截然不合的事情,无意偶尔候是异常革命性的事情,才能在 10 年后,成为工业界标准。我觉得 Mark 在事务性内存上的事情就做到了这一点。

Mark:我记得另一个例子,有一篇 1994 年的论文,提出了页保留(page reservation)的观点,20 年后,它进入了 Linux。以是不要做优化型的事情,考试测验做与众不合的事情。例如不要去做让最高真个处置惩罚器的机能变得更好的事情,要考试测验去做让物联网处置惩罚器的功耗比其他设计更低的事情。这届会议上也有人颁发了用其他手段让指令集架构的特点更轻易证实的论文,这才更像是好的体系布局钻研,它可能不会被采纳,但也有可能变得世人皆知。这不是一个小的改变,这是一个对照大年夜的变更。关键是你要关注迁移改变点,迁移改变点是一系列小的渐进性改变带来的大年夜的变更。体系布局的迁移改变点会发生在当工艺发生变更的时刻,以及当顶层的利用发生变更的时刻。一个经典的例子是,上世纪 80 年代,最便宜的存储设备是大年夜型磁盘,小型存储设备都很贵,然后小我电脑忽然呈现了,对硬盘的需求呈现使得制造商们开始制造大年夜量硬盘,使得最便宜的存储设备变成了小型的硬盘,然后 David Patterson [3] 觉得,迁移改变点呈现了。这个迁移改变点意味着什么呢?在小型硬盘上可以存储数据,然则 PC 对付靠得住性要求不高,以是不太在乎单个硬盘的靠得住性,但假如在办事器上应用大年夜量的硬盘存储数据,靠得住性就很差了 [4],以是必须设计一套规划,让它们突破自身的劣势,变得靠得住起来,以是发现了磁盘阵列 RAID [5]。以是钻研的关键是,去留神这种迁移改变点,而不在于你的代码写得有多好,你必须去察看问题的内在。以本日来说,物联网,虚拟现实,这些领域在发生什么,可以考试测验从中去探求迁移改变点。

Mark 的门生:我感觉收集通讯的改变也是一个例子。在 1999 年之前没有什么收集通讯,由于收集险些不太存在,然后加州大年夜学伯克利分校的人出来做了很多事情。

Mark:另一个例子,以前的巨型机都很昂贵,必须分时应用。分时的系统你们可能都没有体验过,用起来异常苦楚,但假如你意识到,有一天机械会越来越便宜,便宜到每一小我都能买得起,这也是一个迁移改变点。有趣的是,现在的云办事就像是分时系统的回归,由于这种场景下云办事的分时应用对照高效。

采访小组:您觉得人工智能与体系布局的结合会是一个迁移改变点吗?

Mark:我感觉这此中切实着实有迁移改变点,然则我不知道详细会在哪里。我们之前有一项事情,是谋略机体系布局钻研合营体颁发的 21 世纪谋略机体系布局白皮书 ……

采访小组:是的,我们都读过。

Mark:对,之后我们又有了一篇新文章,叫做 2030 年的谋略机体系布局。它此中就提到,机械进修是一个异常紧张的利用。可以看看现在谷歌的事情,有两个很显着的趋势,(编注:此中一个是机械进修),另一个是云谋略。云谋略正在改变指令集架构层面,假如在 20 年前,你要让别人安装你的软件,就必然得是 x86,现在在云中供给办事的话,大年夜家就不再关心是不是 x86 了,由于人们已经不再在指令集架构层面去交互,而是在更高的层面,例如 API 层面。以是体系布局与 AI 的结合,人工智能与云谋略的结合,抽象层次的前进,我小我感觉都是很令人振奋的领域。然则我小我不会做比机械进修更激进的工作了,由于现在有很多人已经在做体系布局与 AI 的结合,去年的 ISCA 有三个 session 全是这个主题的论文。不要去做这种每小我都在做的领域。

Mark 的门生:国际卷积神经收集年会(笑)。[6]

Mark:就像买股票,应该去买慢牛走势的,等它爆发的时刻再脱手卖掉落,而不是在股价起飞的时刻去追高。现在冲进一小我很多的热门钻研领域就像是股市里追高。应该去探求那些现在不热门的,然则会是未来趋势的领域。有一句话,应该去考试测验写一个钻研点上的第一篇论文,最佳论文,或者着末一篇论文。

采访小组:现在有这样一个趋势,对付体系布局领域的应届卒业生来说,市场上有大年夜致上三种事情可以选,一种是去做金融,高频买卖营业之类,薪水很高;另一种是去做机械进修,使用体系布局领域的常识和技能去做机械进修利用的调优,也是薪水很高;对拍照符体系布局传统的事情,例如去传统的芯片设计公司做芯片,薪水就对照一样平常。您觉得这样的趋势会对体系布局的钻研带来负面影响吗?

Mark:我感觉,让门生去做高频买卖营业之类的工作并没有什么不好,不会有什么危害。但对付小我来说,我有一个保举,叫做 “十年测试”。你十年今后想成为什么样的人?十年后对你来说什么是紧张的?假如你想挣钱,那就去做高频买卖营业,假如你想去教书育人,并且不在乎较低的薪水,那就去做。紧张的是,做自己爱好的工作。假如是做自己爱好的工作,你才会干得更好并且加倍勤劳。现在可能很多卒业生会去做机械进修,然则更好的选择应该是,做自己感兴趣的。机械进修可能不错,然则假如去非热门领域,竞争者也少。

若何赞助中国的体系布局学术圈维持康健进步

采访小组:现在中国的体系布局学术圈只有大年夜概顶尖的 5-6 所黉舍和钻研机构,然则美国大年夜概能席卷 top50 的大年夜学,在这些大年夜学里都能够找到很好的教授和门生,以及跟工业界的相助关系,然则在中国,这个范围缩减到了只有 5-6 所黉舍 ……

Mark:中国的体系布局只限于前 5-6 所黉舍?

采访小组:基础上是的,搜索以前多年 ASPLOS,ISCA 的颁发记录,会发明只有这些黉舍能够有论文。

Mark:这可能是由于这些黉舍足够好,可以超过说话障碍。你的意思是说其他黉舍基础不做体系布局钻研?

采访小组:是的,其他黉舍以致可能没有这样一个零丁的体系布局子偏向。

Mark:对付美国来说,对体系布局的兴趣可以追溯到上世纪 40 年代。设计硬件生来便是谋略机科学的一个组成部分,每一台建造的机械都有不合的指令集,直到有人留意到法度榜样员们不停无法适应,然后指令集架构的观点在上世纪 60 年代呈现。到了上世纪末的时刻,就呈现了很多层次,有人做芯片,有人做系统,有人做利用,有人做界面,这些人都可以在各自的层面上展开相助,这不错。现在跟着 denard scaling 和摩尔定律的变慢和遣散,很多的能效前进时机来自于跨层次的相助,假如你不做体系布局,就会让自己陷入劣势。例如谷歌现在对机械进修很感兴趣,他们做了什么?体系布局的器械,TPU。现在已经无法做到每隔两年通用 CPU 的能效大年夜幅度前进了,以是你就必要一个办理规划,在低得多的能耗下去做谋略。按我的理解,TPU 上呈现了很多 8 比特的整数操作,假如在通用 CPU 上做这样的操作就很不划算,然则现在你必须去关注这样的器械了。这样的改进在十年前不紧张,然则现在则必须去压榨,机能的前进部分地来自于能效的改善,有了机能你才能去做新的利用,比如英语 - 中文的实时翻译,这在曩昔便是荒唐的。歉仄我的回答不是很精练(笑)。

采访小组:您提到美国的体系布局成功的身分,例如有造谋略机、设计系统的传统,有来自工业界的真实需求,等等。那我们如何才能让中国的体系布局钻研也生长起来,您是否建议我们该把来自工业界的需求从新导向给那些尚处在圈外的黉舍?

Mark:这老是一个关于资本分配的难题,你怎么去分配给最顶尖的黉舍,top5,top10,top20 等等。不应该把钱都给顶尖的黉舍,应该把钱分散开,由于可能会有一些黉舍,冒出了不为人知的设法主见,但却是进步的关键,此外,无意偶尔也会有一些很好的门生身处一个非顶尖黉舍,出于各类各样的缘故原由,比如她的男同伙去了那个黉舍,等等,要在各个地方去培植人才,这很紧张。在美国我们也有同样的问题,真正的大年夜项目来自于美国国防高档钻研计划局(DARPA),然则他们倾向于与少数的大年夜黉舍,牛校相助,国家科学基金会(NSF)也主要把钱给 top5,top20,其他黉舍再分配剩下的。精准地分配很艰苦。

采访小组:在中国我们也有一个自然科学基金会,然则也有着这样一种模式,假如在这个圈子以外的黉舍想要进来,就得和圈内的牛校相助,比如清华。

Mark:我不太爱好这样一种必须跟大年夜的集团相助的系统,这会导致匀称化并且工作老是由全部社区来做。我有个问题,在美国,就算我有一个超级明星式的门生,他也不能在威斯康辛大年夜学找到教职,他必须去其他地方。中国有没有这样的传统,比如中国顶尖大年夜学卒业的博士生卒业后可以留在母校任教?

采访小组:可以留下任教。

Mark:我感觉中国可以做的最紧张的一件能让学术圈壮实的工作便是,禁止大年夜学雇佣自己的卒业生。

采访小组:为什么呢?

Mark:由于这样做可以进行 “异体受精”。你必须去其余地方,碰见不合的人,碰撞不合的设法主见,出生新的器械,用一种形象的说法,就像有性生殖比纯真的克隆要好。威斯康辛在体系布局领域干得很棒,我们的卒业生假如做得好的话,会被四散到各个地方,那些做得不敷好的门生,就不让卒业,以是关于这些人的器械就没有获得传播,这便是好的。

Mark 的门生:中国正在用另一种要领做这件事,他们送好的钻研生去美国,然后卒业回到中国任教。

Mark:这也是一种精确的要领。

您可能还会对下面的文章感兴趣: