任何电源故障,无论它只是一个小故障、浪涌或完全断电,都可能潜在地损坏存储设备和损坏数据,除非有一个有效的电源失效保护(PLP)机制。
随着越来越多的固态硬盘被部署到企业和工业环境中,必须要有一种有效的断电保护技术来避免意外断电可能带来的危害。
例如,在一个典型的数据中心中,可以部署数百个SSD。在电源故障的情况下,驱动器可能会损坏,导致大量停机,因为驱动器需要重新格式化和重新安装操作系统;数据丢失会对业务运作产生不利影响,并影响客户关系。此外,损坏的驱动器需要更换,这将导致更高的运营成本。
不安全的关闭如何影响SSD
当主机想要将数据写入SSD时,如果SSD具有DRAM缓存,则在将数据刷新到非易失性闪存以进行安全保护之前,数据会最初存储在临时缓冲区(易失性存储器)中; 否则,数据将直接存储到NAND闪存(非易失性存储器),即使在断电时也可以安全地存储在其中。
在正常系统关闭期间,主机首先向SSD警告系统正在关闭。 然后,SSD准备断电,将数据从易失性存储刷新到非易失性闪存,然后向主机发送信号,表明驱动器已准备好断电。
该过程完成了两项重要的工作:首先,确保在断电之前安全地存储了数据; 其次,映射表已更新。 映射表跟踪与物理闪存页面有关的逻辑块地址,并指出数据在闪存驱动器上的存储位置。
图1.在正常的系统关闭中,数据被刷新到NAND闪存中,并且SSD向主机发出信号,表明驱动器已准备好断电
当电源在关闭通知完成之前终止时,就会发生不安全的关闭。这会阻止临时缓冲区中的数据被移动(“刷新”)到非易失性NAND上,从而导致数据损坏或丢失,或导致存储设备不可用。不安全关机的例子包括意外断电、意外从计算机删除SSD、在电源仍在开启时拔下存储设备的插头,或电池断电。
SSD特别容易发生断电事件。 与HDD不同,SSD没有机械部件,因此每个组件都是电子的。 SSD的内部数据管理涉及许多在后台发生的操作,每次电源故障都可能导致这些操作的不正常中断,从而可能影响驱动器性能。
微控制器:提供下一代断电保护
电源失效保护(PLP)机制已经应用在大多数SSD上,特别是那些为高性能应用设计的。这种工业级存储设备通常广泛部署在恶劣的环境中,全天候运行,要求设备性能不受影响。
典型的PLP解决方案包括使用电池和超级电容器提供了备份电源,断电时控制器和闪存可以完成写入功能。
ATP电子公司是最早设计和发布较小尺寸固态硬盘(例如带有板载PLP阵列的M.2 2242)的公司之一,它采用了微控制器单元(MCU),在行业中为下一代Serial ATA 和NVMe SSDs提供了无与伦比的PLP保护等级。
MCU如何增强PLP机制
全新设计的PLP阵列集成到了ATP PowerProtector 4中,它利用新的电源管理IC(PMIC)和新的可编程固件MCU,使PLP阵列能够在各种温度,电源故障和电源状态下智能运行。
图2.具有PMIC和固件可编程MCU的ATP新型PLP阵列
- MCU通过I2C接口智能地监测毛刺掉电情况,并检查电容器的健康状态。
- 如果发生意外的断电情况,则聚合物钽电容器可为数据高速缓存刷新提供足够的维持电源。
- MCU可以持续检测电源故障情况; 例如,对于2.5英寸固态硬盘,如果输入电压连续几个毫秒下降到小于4.0 V(去毛刺后),MCU将通知控制器开始缓存刷新,同时,电容器将被激活, 为缓存刷新提供支持。
图3.在最新的ATP NVMe SSD上实现的基于MCU的设计
特性和优点
- 输入过压保护。输入电压是指提供给电路的电压。SSD通常有一个允许输入电压的特定范围——例如,ATP的2.5英寸SSD的输入电压上限为16伏,而其他SSD产品的输入电压上限为7伏。当输入电压高于规定值时,会对元件造成不可逆的损坏。
下一代ATP SSD具有在外部输入电压和内部SSD电路之间切换的功能。 此开关由MCU控制。 由于MCU实时监视输入电压,一旦检测到输入电压高于指定的最大容差额定值,它会通过向保护开关发送信号来切断输入电压来保护SSD。
- 浪涌电流抑制。浪涌电流是指系统在开启时汲取的大电流。 此初始电流,也称为接通浪涌电流或输入浪涌电流,以对电容器,电感器和变压器充电。 上电浪涌电流过高时,可能会损坏电路和组件。 最新的ATP SATA和NVMe SSDs基于MCU的设计可通过启用软启动机制来最大程度地减小浪涌电流对SSD的影响,从而确保浪涌电流不会超过指定的阈值。
- 输入电源噪声去毛刺。输入电源噪声是指电源不稳定,导致不希望的周期性纹波和尖峰的情况。
MCU通过一种判断机制来帮助消除噪声干扰,该机制可以检测何时功率下降到某个值以下,从而正确地识别出功率损耗或简单的电源不稳定。 如果没有MCU,电源不稳定可能会被误认为是电源故障,从而错误地触发缓存刷新,并有可能导致SSD“挂起”或冻结。
- 快速电源开关控制。电源开关控制是管理电源关闭和下次电源打开之间的时序的机制。 MCU设计可确保更快,更高效的电源开/关控制。下表说明了采用基于MCU的控制的SSD与未使用SSD的SSD相比的优势:
没有MCU的SSD |
有MCU的SSD |
PLP电容器需要在上电之前放电/复位 |
立即启动电源,不管PLP电容器上的残留电压 |
如果关机状态非常短:
|
如果关机状态非常短:
|
表1.具有/不具有MCU的SSD电源开关
使用基于MCU的PLP,可以确保快速的电源开/关控制,而不会由于未正确重置控制器而导致未检测到驱动器的潜在风险。
- PLP电容器过压保护
聚合物钽电容器是ATP PLP技术的重要组成部分。 通过提供保持电源,它们可以确保将DRAM高速缓存中的数据刷新到NAND闪存中以进行安全维护,并且在发生断电事件时完成最后的写入命令。
过度充电会损坏电容器,从而损害其保护功能。 MCU实时监控电容器电压,并在检测到电压过高后立即禁用充电。 这保证了PLP电容足以在断电事件期间完成高速缓存刷新。 它还可以防止PLP电容器过早老化。
总结与结论
ATP PowerProtector 4集成了基于MCU的设计,可为ATP的下一代SATA和NVMe SSD提供增强的电源管理和PLP功能。 通过结合硬件和固件解决方案,基于MCU的设计可保护数据以及存储设备,以实现更高级别的完整性和可靠性。 根据客户要求,可以定制增强功能,从而可以根据独特的需求,特定于应用程序的需求或用例量身定制PLP功能。
下表总结了与每个功能相对应的好处。
增强驱动保护 |
|
更好的数据完整性 |
|
快速电源开关控制 |
|
精确控制电源开关时序 |
|
订制选项 |
|
表2.汇总表显示了每种MCU功能和优势如何为ATP的最新固态驱动器和模块提供增强的PLP功能。
采用基于MCU的新设计的下一代ATP SSD包括mSATA,2.5英寸SSD,M.2 2242/2280和NVMe模块。 固态硬盘支持I-Temp和C-Temp,还支持RAID引擎和端到端数据路径保护功能。 ATP的“工业”解决方案经过严格的测试和验证,可满足关键任务应用程序的高可靠性,高性能和高耐用性要求,以提供最佳的总拥有成本(TCO)价值。
想要了解更多,请访问ATP网站或联系ATP代表/经销商。