不间断运行的服务器系统通常使用RDIMM(带寄存器的双线内存模块)以满足电脑密集运行的严酷条件。本文ATP ELECTRONICS将介绍RDIMM是什么、为什么常用于高要求的应用,以及为什么较广的温度范围越来越成为必需。
为何RCD是RDIMM的关键组成部分?
RCD(寄存器时钟驱动器)芯片,也可以直接称之为register(寄存器),是RDIMM的关键组成部分。它的主要功能是,将来自CPU的指令(instruction)或命令(command),在发送到内存模块之前接收。RCD在CPU和DIMM之间起到了调停的作用:数据信号在RCD中停留一个时钟周期,然后在下一个时钟周期的上升沿从RCD转至DIMM。结果就是要花费更长CPU周期的指令,但这一缓冲器降低了CPU内存的压力,并帮助降低对信号完整性的影响。
RCD的主要目的是即使在工作量很大的情况下也能保持相同的内存速度。相对于游戏等速度驱动的应用,企业系统及服务器应用需要持续稳定的表现,也需要DDR4内存条上的RCD使较高的能力和额外的可靠性特征成为可能。
下图说明了CPU是如何首先与各个模块的RCD通信,RCD又反过来与DRAM(动态随机存取存储器)上的内存芯片通信。
1. 来自CPU的指令(instruction)或命令(command)先被RCD接收
2. 然后RCD与DRAM模块上的内存芯片通信
ATP的宽温RDIMM配I-Temp RCD:在极端冷热条件下保证可靠性
在恶劣环境和极端气温中运行的系统安装DRAM模块并不少见,在这些环境中,气温在日间和夜间起伏不定,天气状况也变化多端。
从陆地到海洋、航空甚至外太空,高要求计算环境中的运用需要耐用、可靠、持久的内存。对这些需求来说,额定支持温度为0°C到85°C的常用商业级DRAM也许不足以应对挑战。当这些内存模块出现故障时,在远程地点更换这些模块所需的时间、劳动力和成本会扰乱运行并对业务产生不利影响。
随着工业物联网(IIoT)、人工智能物联网(AIoT)和5G开放无线接入网/分布单元(O-RAN/DU)的边缘计算变得更加普遍,有能力适应更广温度范围的存储器变得比以往任何时候都更加必要。
ATP认识到,大多数边缘计算应用是全天候运行的,而且往往是在具有挑战性的环境中运行。为了在商业级DRAM无法满足的严峻环境中提供更好的耐久性和冗余性,ATP提供了具有工业温度等级RCD的DDR4宽温RDIMM。
下表比较了商业级RDIMM和带有I-Temp RCD的宽温RDIMM,后者即使在零度以下的温度也能提供稳定性和可靠性。
- 通过更严格的加强测试,宽温IC是ATP以更低的成本达到工业级性能的最佳解决方案。
- ATE: 自动测试设备
- TDBI: 老化测试
ATP可靠性测试:
像所有ATP DRAM模块一样,ATP带有I-Temp RCD的宽温DDR4模块经过了严格的100%模块级测试,以确保最大程度的可靠性。
- 使用自动测试设备进行的功能测试(ATE)。ATE检测与DIMM组装有关的组件缺陷和结构缺陷,并甄别边际时间和信号完整性(SI)敏感度。ATE提供各种参数设置的电气测试模式,如连续热循环下的边际电压、信号频率、时钟、命令时序和数据时序。ATE测试系统可以准确定位单个有缺陷的IC或DRAM PC板,从而为新产品开发和大规模生产阶段提供效率更高的故障分析方法。
- 通过TDBI进行系统级故障检测和预防。通过加速测试方法,如老化测试(TDBI),ATP大大降低了故障率,并确保模块上只有稳健的DRAM芯片,以此延长产品的使用寿命。在一个99.99%有效的设备上,即使只有0.01%的错误也会增加模块层次的故障率,并导致实际使用中的故障,TDBI检测并遴选出高达0.01%的错误,以确保DRAM模块的可靠性。TDBI测试可以根据客户的标准,在指定时间内使用各种温度、功率循环、电压及其他压力条件进行定制。
ATP TDBI结合温度、负载、速度和时间,对内存模块进行压力测试,使薄弱的模块暴露出来。
主要规格:
(Ta = Ambient Temperature; Tc = Case Temperature)
结论:
采用IIoT、AIoT和5G O-RAN/DU的情形越来越多,已经催生了更多密集和亟需使用内存的应用,其中许多应用预计将在极端温度等恶劣条件下全天候运行。商业级DDR4 RDIMMs可能无法胜任此类任务,考虑到运行困难或中断以及耗时的更换,在严酷的场景中使用它们可能意味着更大开支。
ATP出品的带有I-Temp RCD的宽温DDR4 RDIMM提供了最佳的解决方案,特别是对于那些在极低和极高温度下,要求表现可靠、持久、始终如一的应用。在30多年的制造专业技术和一流的可靠性测试的支持下,这些坚固而可靠的内存模块可以承受最棘手的环境。
更多信息,请访问ATP网站或联系ATP代表。