还在纠结QLC?Solidigm 61.44TB SSD交出了一份漂亮答卷

快科技   2023-08-10 05:43:00

说起SSD,你最关心的是哪方面?容量大小?价格高低?性能快慢?寿命长短?

相信很多用户,尤其是懂技术、有追求的用户,还会非常在意NAND闪存颗粒的类型:


(资料图片)

SLC早已几乎销声匿迹,MLC可以说是最理想的但也看不到了,TLC已经都能接受并极大化普及,QLC一直让很多人质疑其可靠性和寿命,PLC就更别说了……给人一代不如一代的感觉。

事实上,从来没有差劲的产品和技术,只有合适不合适的产品和技术,就看怎么去做、用在哪里了。

最近,SK海力士收购Intel NAND闪存业务重组而来的Solidigm,再次玩了一把大的,推出了全新的D5-P5336 SSD,不但做到了PCIe SSD产品有史以来的最大容量61.44TB,还把QLC推向了新的高度。

可以说,D5-P5336巧妙地利用了QLC闪存的特性,充分发挥优势、规避劣势,将自己放在了最合适的位置上,真正发挥产品和技术的价值。

PS:存储公司Nimbus Data有一款200TB SSD,用的是SATA/SAS接口,3.5英寸形态,过于庞大。

2021年12月正式组建成立以来,Solidigm已经逐步打造了完整的产品线,从数据中心到消费级都有不同等级的产品,面向不同的工作负载需求而针对性设计、优化,让用户可以找到最适合自己的产品。

其中,消费端有主流的P41 Plus、高端的P44 Pro,均支持PCIe 4.0,同时也正在规划打造PCIe 5.0产品。

数据中心端,2022年4月发布了D7-P5620、D7-5520,是其首款PCIe 4.0 SSD,采用144层TLC闪存,容量最大15.36TB,可提供超高的性能、耐用性,缺点是成本和价格偏高,适合大型企业和大型数据中心。

2023年5月带来了D5-P5430,192层QLC闪存,最大容量翻番到30.72TB,提供相当高的耐用性,而且成本不高,综合而言已经足以替代TLC,不过在4K随机写入性能上有所牺牲。

最新的D5-P5336,定位相对更低一些,更确切地说是以较低的成本,满足读取密集型的工作负载需求。

顺带解释一下Solidigm企业级SSD的命名规则,都是Da-Xbcde的方式。

其中,D代表企业级和数据中心定位(Datacenter),a代表产品定位(7高性能NVMe/5性价比NVMe/3 SATA),X代表接口形态(P PCIe/S SATA/D双接口),b代表主控代数,c代表寿命等级(越大越长),d代表闪存代数,e代表其他特性(0普通/1低功耗/2高性能/6大容量/8 PCIe x8 AIC)。

所以,D5-P5336就代表高性价比企业级NVMe PCIe SSD,第五代主控,寿命普通,第三代QLC闪存,大容量。

D5-P5430、D5-5336都使用了QLC闪存,它们可都是企业级产品,而企业客户、企业应用环境是最在意长久稳定性的,这足以让我们重新认识QLC闪存。

在很多人的认知里,QLC闪存性能、耐用性、可靠性等指标都不够理想,但这是相对而言的,如今的QLC,尤其是Solidigm的QLC,完全没有大家想象的那么弱。

读取性能方面,Solidigm QLC并没有损失,PCIe 4.0 x4带宽中可以轻松跑到7GB/s,和标准的TLC不相上下。

写入性能方面,QLC确实不如TLC,但也没有差得离谱,无论4K IU还是16K IU都是如此,Solidigm QLC大约相当于TLC 80%左右。

负载延迟方面,Solidigm QLC并没有大大增加,事实上相比很多入门级TLC还要更好。

耐用性方面,Solidigm QLC也没有急剧下降,擦写次数不低于3000,甚至可以做到5000,和一般的TLC很接近甚至更好一些。

故障率方面,Solidigm QLC也没有更高,达到了业界领先TLC的同等水平。

Solidigm D5-P5336提供了丰富的形态接口和容量选择,相对于上代D5-P5316范围更广,向下探至7.68TB、向上扩至61.44TB。

一是U.2接口,厚度15mm,容量7.68TB、15.36TB、30.72TB、61.44TB。

二是E3.S接口,厚度7.5mm,容量7.68TB、15.36TB、30.72TB。

三是E1.L接口,厚度9.5mm,容量15.36TB、30.72TB、61.44TB。

其中,E1.L规格的首先出货,首批最大容量30.72TB。U.2今年晚些时候跟进,E1.L也加入61.44TB。E3.S则在明年到来。

其中,中国客户更偏向于U.2形态,美国客户则更青睐E1.L、E3.S,容量密度和散热都会更好一些。

E1.L、E3.S也是大势所趋,尤其是后者,相信在PCIe 5.0时代会大大增加,未来到了PCIe 6.0时代有望成为市场主流。

这是D5-P5336的规格概览,在多个角度上都达到了与TLC产品相当的水平。

性能方面,明显是偏向读取密集型的,更擅长读而非写,其中128KB/QD128顺序读取速度7GB/s、4KB/QD256随机读取性能100.5万IOPS,基本上吃满了PCIe 4.0的带宽,而顺序写入、随机写入分别只有3.3GB/s、4.3万IOPS。

耐用性方面,7.68TB、15.36TB、30.72TB、61.44TB四种容量版本的最大写入量分别为5.9PBW、14.1PBW、31.5PBW、65.2PBW,5年质保期内的平均每天全盘写入次数分别为0.42、0.51、0.56、0.58,相比于TLC产品常见的0.33-0.38次每日全盘写入明显高了一个档次。

可靠性方面,平均故障间隔时间达200万小时,UBER(不可校正比特错误率)达到了每1017比特读取不超过1个扇区,还可以在40℃下断电保留数据3个月,这些都和TLC基本差不多。

数据中心特性方面,支持NVMe 1.4c(为PRQ2提供NVMe 2.0)、全新的TRIM架构,以及一些OCP 2.0功能,比如延迟监测、FW历史日志、NSSR、格式化进度提示、NUSE等等。

为了满足读取密集型工作负载,D5-P5336使用的是16KB IU格式,只有上代P5136 64K IU的四分之一,并针对16KB以上大小的数据做了优化,凡是大于16KB IU的数据都可以直接写入

这样不但可以提升大数据的顺序读写性能,也能降低成本、提升性价比。

对于较小的数据,包括512B、4KB、8KB,如果直接写入,会触发内部的“读改写”,严重损伤使用寿命,所以Solidigm提供了“写入修正”(write shaping)功能,可减少“读取-修改-写入”的反复流程对性能、寿命造成影响。

所以说,对于QLC闪存来说,IU 16KB起才有意义。

顺带一提,D7-P5520使用的是4K IU,因为它是TLC,要满足混合读写的负载需求,得处理大量小文件。

事实上,如今的企业级工作负载,总体是偏向读取密集型的,换言之读取行为居多,写入偏少。

比如说大数据分析、CDN网络分发、HPC高性能计算,处理的都是128KB以及更高大的数据块,大规模基础设施、人工智能、机器学习的相关数据一般也不小于32KB,这些都非常适合交给QLC产品。

D5-P5336,就是为此设计而来。

邮件、在线交易以及虚拟化等需要处理大量小数据的工作负载,就不太适合D5-P5336这样的产品了。

这是D5-P5336和几款友商TLC产品的对比,可以看出其读取性能持平甚至更高,耐用性、容量也都更胜一筹。

只是写入慢一些,尤其是随机写入,这是QLC的天然弱项,没啥可说的,这也正是为啥它更适合读取密集型负载。

另外,在同等容量下,D5-P5336对比竞品,在读取密集型应用中的性能都是同等水平,而且还具有更大容量的优势。

正因为QLC更高的存储密度,D5-P5336在同样的服务器空间内,可以提供大得多的存储空间,甚至可以在1U服务器内塞入32块硬盘,达到约2PB。

无论是TLC SSD还是传统HDD,在存储空间方面,都完全不是D5-P5336的对手,这正是QLC最大的价值之一。

最后,对于数据中心产品来说,质量和可靠性是永远排在第一位的,Solidigm在这方面也有着突出的优势。

Solidigm 2018年开始就在研究QLC,如今已经演化到了第四代,经验相当丰富。

比如说静默数据损坏(SDC)问题,Solidigm在美国做了相当于超过600万年时间的模拟测试,没有任何数据损坏。

比如失效率承诺不超过0.44%,实际表现比这个数值更低,在行业内处于领先地位。

比如数据准确性的OLI检查,有强大的完整数据保护路径,可以覆盖99% SRAM单元。

所以,对于QLC,还有什么好担心的呢?

哦对了,你可能会问了,下一代PLC怎么样了?

其实早在整整一年前,Solidigm就全球率先展示了PLC SSD,并透露将首先用于数据中心产品。

PLC闪存可以在每个单元内存储5比特数据,容量密度相比QLC增加25%,SSD容量将再次实现飞跃。

Solidigm PLC闪存继续采用浮动栅极技术,可以提供强大的电荷隔离、更优秀的电压阈值分布,使其可以向更多的比特/单元拓展,是达成PLC的关键支撑,而且可以直接现有的QLC生产线上投产,无论技术升级还是量产都更顺利,成本也可以得到更有效的控制。

不过无论是Solidigm还是其他厂商,目前对于PLC都比较谨慎,技术储备已经有了,但并不急于使之落地,原因就在需要首先把QLC做到极致,尤其是把整个生态系统做好,才可以一步一步向前推进。

在Solidigm看来,PLC SSD需要做到64TB、128TB左右的容量才更有实用价值,这样只需要1000次左右的PE就可以满足了。

当然,随着容量的增大,各种风险也会随之增加,更需要谨慎处理。