登陆

章鱼足球彩票推荐-关于内存内核算,这家公司有新主意

admin 2020-02-14 173人围观 ,发现0个评论

来历:本文由大众号半导体职业调查(ID:icbank)翻译自「ANANDTECH」,作者Dr. Ian Cutress ,谢谢。

关于这个核算国际的一个要害的未来要素是移动数据。移动数据需求功率,以至于从内存中调用数据要比实践对其进行“核算”耗费更多的功率。这便是咱们有缓存的原因,但即便有缓存,也需求对CPU进行广泛的办理。关于简略的操作,如位搬运或和操作,方针是将核算才能搬运到主DRAM自身,这样它就不用来回络绎。今年在Hot Chips, UPMEM是榜首批展现新技能的公司之一。

关于任何现已完结任何方式的通用核算的人来说,经过算法推送一堆输入来取得成果,关于编写代码的人来说,一般有两个高档的心思阶段需求战胜:首先是让它作业,其次是优化它。算法需求发生正确的成果,越快越好 - 慢速正确的成果一般是无用的,而快速的过错的成果也是无用的。假如可以以更低的功率完结,那么也会削减开支。

In-Memory Processing或“Processing In-Memory”背面的主意是,当内存仍在DRAM中时,应该完结一些简略的整数或浮点运算 - 无需将其推送到CPU操作,然后将其发回。假如数据可以保存在那里并进行更新,则可以节省时间和功耗,而不会影响成果。或许,假如成果被发送回主存储器并且终究的XOR应用于存储器中的数据,则可以削减CPU上的核算。这可以开释主CPU中心来履行其他与核算相关的工作,或许假章鱼足球彩票推荐-关于内存内核算,这家公司有新主意如它是一个约束要素,则会削减有用内存带宽。

UPMEM所做的是在DRAM工艺节点上开发内置于DRAM芯片自身的数据处理单元(DPU)。每个DPU章鱼足球彩票推荐-关于内存内核算,这家公司有新主意可以拜访64 MB的DRAM,并且相当于该内存的1 GB / s带宽。DPU构建在一个洁净的32位ISA上,具有很多优化功用,例如0循环条件jmps,组合SHIFT + X指令(如SHIFT + ADD或SHIFT + SUB),根本逻辑指令,SHIFT和rotate指令。编程模型使得根据c言语的库可以处理一切常见问题,UPMEM估计大多数应用程序需求几百行代码,少数人组成的团队只需2-4周就可以更新软件。

UPMEM所报的大数字包含更好的TCO、更好的ROI,以及潜在的100亿美元方针商场。咱们会在恰当的时分评论这些。

(我个人更喜爱PIM-DIMM这个姓名)

UPMEM提出的是一种类似于DDR4 RDIMM的规范产品,每个64MB的内存都可以拜访它的一个DPU。DPU内置于DRAM自身,运用内存制作节点。例如,UPMEM正在宣扬它正在制作一个4 Gb DDR4-2400芯片,用于嵌入8个DPU 512 MB的模块, DPU以500 MHz运转。UPMEM方案将这4个Gb芯片中的16个放入单个DDR4 RDIMM模块中,供给8 GB模块,内置128个DPU。

方针是终究出产128 GB模块,一共2048个DPU。在DPU与其64 MB内存之间的有用1 GB / s带宽下,这意味着DPU与内存之间的有用带宽为2 TB / s。由于DPU的作业方式,这是必需的,这将在下面解说。

处理器和技能已取得专利,但UPMEM表明,他们正在与内存供货商合作开发20nm级工艺。添加DPU内核可以添加十分小的裸片面积,并且可以在2-3个金属层内启用,由于逻辑的密度小于前沿逻辑完成的密度。与抢先的CPU完成比较,咱们的主意是完成10倍的总能效和可扩展性。

现在,UPMEM为客户供给软件模仿和硬件FPGA验证模仿器 - 实践上,感兴趣的各方可以在AWS f1.16x大型实例上模仿UPMEM渠道。实践的PIM-DRAM模块样品将在第三季度向高端客户发货,跟着更多公司对此感兴趣并参加,咱们方案在下一年持续推行。UPMEM引证功能示例表明,他们现已看到基因组形式匹配的速度提高了22x-25x,数据库索引查找的吞吐量提高了18倍,推迟为本来的1/100,索引查找应用程序的TCO提高了14倍。

在本钱方面,UPMEM没有阐明方案以多少价格出售其技能,但与其他处理方案比较,UPMEM有望成为一个边沿本钱。在一次演示中,该公司表明,他们的处理方案可以用一个400美元的增强内存处理方案代替一个潜在的40000美元的服务器,并指出运用PIM在软件答应、数据中心空间和功耗/功率方面发生了连锁反应。

UPMEM供给了一些关于电力耗费的数据。在这张幻灯片中,该公司比较了两台服务器,一台带有pimm - dram,另一台没有。在这种情况下,“DRAM到处理器的64位操作数”召回需求在惯例服务器上运转3000个pJ,将数据从DRAM中取出,并传递到缓存中,而在PIM-DRAM上,只需将数据移动到DP章鱼足球彩票推荐-关于内存内核算,这家公司有新主意U上,相同的操章鱼足球彩票推荐-关于内存内核算,这家公司有新主意作只需求150个pJ的能量。DPU上的操作自身实践上需求2倍的功率(20 pJ与10 pJ比较),可是总的功率功率增益是170 pJ vs 3010 pJ,或许略低于20x。

这张幻灯片指出的一件或许令人困惑的工作是服务器的功耗——惯例服务器列出的功耗只要300W,可是PIM处理方案的功耗高达700W。这是由于在UPMEM的处理方案下,每个DRAM模块的功耗将会添加。

UPMEM提出的榜首个产品模块是前面说到的8 GB DDR4-2400模块,其间128个DPU各自掩盖64 MB香港股市内存并以500 MHz运转。关于单个4 Gb裸片(其间16个在8 GB模块中,18个用于RDIMM ECC),咱们依然处于1 cm2的惯例裸片尺度,但每个芯片所需的功率约为1.2瓦。

假如咱们研讨一切16/18芯片,咱们可以看到每个8GB的模块将是19.2-21.6瓦。关于DRAM来说,这是一个很大的功耗,并且实践上超过了DDR4插槽的额外规模。从这个视点来看,Intel的512GB Optane模块有一个18w的运转形式,服务器可以冷却到18w,可是也可以低到12w。UPMEM并没有阐明它是否可以经过下降DPU频率来下降每个模块的功率。

UPMEM的方针是用PIM-DRAM模块替换服务器中的DRAM模块。该公司表明,DDR4接口并不合适这类工作,但他们现已处理了这个问题。在一份简报中,该公司指出,现在至少需求为一个操作系统装置非PIM-DRAM。

**点击文末阅览原文,可阅览英文原文。

*免责声明:本文由作者原创。文章内容系作者个人观念,半导体职业调查转载仅为了传达一种不同的观念,不代表半导体职业调查对该观念附和或支撑,假如有任何贰言,欢迎联络半导体职业调查。

今天是《半导体职业调查》为您共享的第2043期内容,欢迎重视

半导体职业调查

半导体榜首笔直媒体

实时 专业 原创 深度

射频|台积电|制作|AMD|日韩芯片|博通|集成电路|晶圆

回复 投稿,看《怎么成为“半导体职业调查”的一员 》

回复 查找,还能轻松找到其他你感兴趣的文章!

请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP