性能接近国际巨头后,龙芯将迎来什么?


性能接近国际巨头后,龙芯将迎来什么?

文章插图

性能接近国际巨头后,龙芯将迎来什么?

文章插图
【文/科工力量专栏作者 铁流】
日前,龙芯发布了用于服务器市场的的3D5000系列芯片,引发关注 。
3D5000与3C5000属于同一代CPU , 是采用Chiplet技术把两片3C5000芯片互联和封装在一起,进而获得一片32核CPU,这种方式也被称为“胶水32核” 。就性能而言,龙芯3D5000的IPC接近AMD Zen2的水平 , 全芯片性能与同主频下的32核AMD Zen2架构CPU接近,对于大部分应用已经是够用了 。
在2023年,性能更强的龙芯6000系列CPU将要问世,龙芯在IPC上与英特尔、AMD的差距将会进一步缩?。?真正阻碍龙芯在市场上推广的要素将不再是CPU性能,而是软件生态 。
龙芯5000系列是自主CPU里程碑
2019年,龙芯3A4000四核处理器亮相 。龙芯3A4000是继3A3000之后的新一代处理器 。3A4000既升级了新内核GS464V , IPC大幅提升;又通过在原有28nm工艺上深入磨合优化,改进电路和物理设计方法,在制造工艺与3A3000相同的情况下 , 将性能提升了一倍 。就3A4000的IPC而言,已经从3A3000的7/G达到了9.8/G,AMD的Zen大致也就在10/G水平,龙芯3A4000的GS464V是一款可以与第一代Zen匹敌的内核 。
3A5000的内核是基于GS464V进行小改 , IPC为10.6/G,采用12nm工艺,主频为2.2G至2.5G,后期流片的有2.7G主频版本 , SPEC06定点成绩超过26(GCC,@2.5Ghz),这对于自主CPU而言已经是非常不错了 , 即便和引进的CPU相比 , 其定点和浮点性能仅次于海光,超过其他引进的X86和ARM CPU 。
龙芯3A5000与龙芯3C5000、3D5000属于同一代CPU,3C5000采用LoongArch指令集 , 16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当 , 并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上 。就SPEC2006测试来看,单核定点浮点Base分均大于10/G,单芯片分值超过200 。可满足通用计算、大型数据中心、云计算中心的计算需求 。该处理器通过芯片级安全机制可为等保2.0、可信计算、国密算法替代、网络安全漏洞防护等提供CPU级内生支持 。
3C5000最大特点是单核性能强,特别是unixbench这种看重单核和内存性能 , 多核加速比很低的测试,龙芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到这个成绩 。从公开的数据来看,3C5000的性能在信创市场足够用了,而且16核的核心是使其部署比较灵活 。
龙芯3D5000则是把两个3C5000封装到一起的胶水32核芯片,集成了64MB的L3 Cache,支持最多8个DDR4-3200 DRAM,可以通过HyperTransport接口构建至多四路处理器,因此单机可以支持多达128核 。在性能方面,龙芯3D5000单路和双路服务器的SPEC CPU2006 Base实测可以超过400分和800分,预计四路服务器的分值可以达到1600分 。可以说,龙芯3D5000主要针对一些对性能有更高要求的场景 , 只要软件生态跟得上,完全可以替换掉英特尔至强CPU 。

性能接近国际巨头后,龙芯将迎来什么?

文章插图


龙芯6000性能将再次飞跃
相对于一些技术引进CPU在引进海外技术后CPU IPC增长缓慢,性能提高基本依靠购买更好的EDA工具和买台积电更好的工艺 。龙芯一直致力于提升CPU微结构设计水平来提升CPU的性能,没有盲目去堆核心数量 。这种稳扎稳打的做法使龙芯在过去10年中IPC提升了3-4倍 , 在桌面CPU上成效立竿见影 。

相关经验推荐