excel|这里有一款非常优秀,而且很有上进心的SSD( 二 )


D7-P5520的PCB每面8颗NAND Flash芯片 , 共16颗 。 其中使用了两种不同容量的芯片 , 分别为10颗为4 die封装、6颗8 die封装 , 总共为4×10+8×6=88 die 。 每粒die在TLC模式下的容量为96 GB , 总的介质容量为8448 GB 。 这款D7-P5520的标称容量为7.68 TB , 保留空间约10% 。 用户也可以自行通过SST进行设置 , 增加OP空间 , 以进一步提升D7-P5520的耐久度和随机写入性能 。
缓存方面 , D7-P5520使用了5颗DDR4 3200规格DRAM , 单颗容量16Gbit(4G×4bit) , 5颗构成10 GB容量 。 对于常规IU的SSD , 大致遵循1GB NAND Flash容量对应1MB DRAM做FTL缓存的配置 。
性能再创新高——常规测试
我们以宝德PR2715W3服务器为基础构建了D7-P5520的测试平台 。 具体配置为:
宝德PR2715W3服务器
处理器:
双路英特尔至强金牌5318Y处理器
(2.10 GHz/ 36MB/24C/48T/165W)
内 存:
32×32GB/DDR4/2933MHz/ECC/REG
系 统:
CentOS Stream release 8
(内核 5.4.197-1.el8.elrepo.x86_64)
Windows Server 2019
这台服务器配置了双路英特尔至强金牌5318Y处理器 , 每处理器拥有24核48线程、可提供64通道PCIe 4.0 , 搭配1TB DDR4 3200内存(处理器支持的实际运行频率为2933MHz) , 可以充分发挥新一代SSD的性能 。

基本性能:稳中有升
我们首先看一看经过几代发展 , 步入“成熟期”的PCIe 4.0接口硬盘的最大吞吐量能达到什么水平 。 在128KB块大小的顺序读取测试中 , D7-P5520毫无意外地突破7GB/s大关 , 达到7.46GB/s , 基本上可以认为达到PCIe 4.0 x4接口带宽的极限了 。 顺序写性能也超过Solidigm的标称值 , 达到4.47GB/s 。


接下来的随机性能测试中 , D7-P5520的随机读取性能毫不意外地突破百万IOPS大关 , 在CentOS Stream release 8操作系统下 , FIO测试工具展现了高达115万IOPS的水平 。 从我们记录的30分钟测试的散点图中 , D7-P5520的随机读性能波动非常的小 , 稳稳地保持在110万IOPS以上 , 延迟基本上均在230微秒以内 。 可以说 , 满负荷的、纯粹的随机读测试对于D7-P5520已经不构成压力了 。 在Windows Server 2019操作系统中 , IOmeter测得的4KB随机读IOPS也稳定在110万以上 。

D7-P5520的随机写入性能也颇为亮眼 , 我们录得的测试成绩为22万IOPS , 这与标称值吻合 。 从散点图可以看到 , 随机写入的延迟波动相对随机读取要大 , 说明写入对于SSD响应能力的影响很大 。 这种影响在后面混合读写测试中会有更充分的体现 。

混合负载:贴近实战
前面的4组数据(100%顺序读取、100%顺序写入、100%随机读取、100%随机写入)也被统称为“四角测试” , 体现的是SSD在4种极端(理想)状态下的性能 。 为了跑满设备吞吐量 , 还会使用很深的队列(QD256 , 甚至512) 。 但是 , 多数的真实应用中 , 是不会出现这么纯粹的读取或者写入情况 , 基本上都是读取为主 , 少量写入 。 在这里我们引用Solidigm统计的企业和云工作负载情况供大家参考 。

从统计数据可以看到 , 在典型的几种云应用场景中 , 除了CDN的读取占绝大多数(95%)、传输以大数据块为主 , 其他几大云工作负载均为小数据块、读写比例大致为7:3 。 这几种云负载的IO模式均为随机为主 。

【excel|这里有一款非常优秀,而且很有上进心的SSD】企业工作负载方面 , HPC、通用、数据库、决策支持系统、人工智能为主要的工作负载 , 其中前三种的读写混合比例大致在7:3~9:1的水平 。
值得一提的是 , 在上面的统计数据中 , 我们还发现:典型企业、云工作负载 , 绝大多数负载的队列深度小于32 。 根据我们的测试经验 , 较浅的队列下 , SSD的IOPS会降低 。 换句话说是:在浅队列(真实世界中偶发的请求)下 , SSD的响应延迟会明显一些 。

相关经验推荐