利用微控制器提供智能SSD电源管理和PLP能力-ATP的电源失效保护机制,为下一代存储提供有效保障

利用微控制器提供智能SSD电源管理和PLP能力-ATP的电源失效保护机制,为下一代存储提供有效保障

任何电源故障,无论它只是一个小故障、浪涌或完全断电,都可能潜在地损坏存储设备和损坏数据,除非有一个有效的电源失效保护(PLP)机制。

随着越来越多的固态硬盘被部署到企业和工业环境中,必须要有一种有效的断电保护技术来避免意外断电可能带来的危害。

例如,在一个典型的数据中心中,可以部署数百个SSD。在电源故障的情况下,驱动器可能会损坏,导致大量停机,因为驱动器需要重新格式化和重新安装操作系统;数据丢失会对业务运作产生不利影响,并影响客户关系。此外,损坏的驱动器需要更换,这将导致更高的运营成本。

不安全的关闭如何影响SSD

当主机想要将数据写入SSD时,如果SSD具有DRAM缓存,则在将数据刷新到非易失性闪存以进行安全保护之前,数据会最初存储在临时缓冲区(易失性存储器)中; 否则,数据将直接存储到NAND闪存(非易失性存储器),即使在断电时也可以安全地存储在其中。

在正常系统关闭期间,主机首先向SSD警告系统正在关闭。 然后,SSD准备断电,将数据从易失性存储刷新到非易失性闪存,然后向主机发送信号,表明驱动器已准备好断电。

该过程完成了两项重要的工作:首先,确保在断电之前安全地存储了数据; 其次,映射表已更新。 映射表跟踪与物理闪存页面有关的逻辑块地址,并指出数据在闪存驱动器上的存储位置。

 

图1.在正常的系统关闭中,数据被刷新到NAND闪存中,并且SSD向主机发出信号,表明驱动器已准备好断电

 

当电源在关闭通知完成之前终止时,就会发生不安全的关闭。这会阻止临时缓冲区中的数据被移动(“刷新”)到非易失性NAND上,从而导致数据损坏或丢失,或导致存储设备不可用。不安全关机的例子包括意外断电、意外从计算机删除SSD、在电源仍在开启时拔下存储设备的插头,或电池断电。

 

SSD特别容易发生断电事件。 与HDD不同,SSD没有机械部件,因此每个组件都是电子的。 SSD的内部数据管理涉及许多在后台发生的操作,每次电源故障都可能导致这些操作的不正常中断,从而可能影响驱动器性能。

 

微控制器:提供下一代断电保护​

 

电源失效保护(PLP)机制已经应用在大多数SSD上,特别是那些为高性能应用设计的。这种工业级存储设备通常广泛部署在恶劣的环境中,全天候运行,要求设备性能不受影响。

典型的PLP解决方案包括使用电池和超级电容器提供了备份电源,断电时控制器和闪存可以完成写入功能。

ATP电子公司是最早设计和发布较小尺寸固态硬盘(例如带有板载PLP阵列的M.2 2242)的公司之一,它采用了微控制器单元(MCU),在行业中为下一代Serial ATA 和NVMe SSDs提供了无与伦比的PLP保护等级。

As a founding member of Micron Technology’s Industrial Quotient (IQ) Partner Program, ATP collaborates closely with Micron to unleash unprecedented PLP capabilities that ensure higher reliability and longer lifecycle to meet and even exceed the rigid requirements of various industries’ mission-critical applications.

The latest SSDs with MCU-based design adhere to the five tenets of Micron’s IQ Matters Program, embodying ruggedized product enhancements, rigid design and testing processes, extensive and rigorous quality testing, extended lifecycle support, and application-specific optimization experience.

“A lot more goes into a true industrial SSD than just a meticulous validation process on the SSD itself.  NAND flash performance characteristics change as it endures various different states of usage pattern and related wear,” according to Peter Huang, ATP’s Embedded SSD Business Unit head. “In addition, for an industrial SSD you have to add in various factors of temperature profile.  Although a general knowledge base and experience can be built up, a thorough NAND characterization is required for each different NAND flash type and generation.  With this challenge, ATP takes a significant resource into NAND flash characterization, an undertaking not possible without the close collaboration with Micron.”

 

MCU如何增强PLP机制​

 

全新设计的PLP阵列集成到了ATP PowerProtector 4中,它利用新的电源管理IC(PMIC)和新的可编程固件MCU,使PLP阵列能够在各种温度,电源故障和电源状态下智能运行。

图2.具有PMIC和固件可编程MCU的ATP新型PLP阵列

 

  • MCU通过I2C接口智能地监测毛刺掉电情况,并检查电容器的健康状态。
  • 如果发生意外的断电情况,则聚合物钽电容器可为数据高速缓存刷新提供足够的维持电源。
  • MCU可以持续检测电源故障情况; 例如,对于2.5英寸固态硬盘,如果输入电压连续几个毫秒下降到小于4.0 V(去毛刺后),MCU将通知控制器开始缓存刷新,同时,电容器将被激活, 为缓存刷新提供支持。

图3.在最新的ATP NVMe SSD上实现的基于MCU的设计

 

特性和优点

 

  • 输入过压保护。输入电压是指提供给电路的电压。SSD通常有一个允许输入电压的特定范围——例如,ATP的2.5英寸SSD的输入电压上限为16伏,而其他SSD产品的输入电压上限为7伏。当输入电压高于规定值时,会对元件造成不可逆的损坏。

下一代ATP SSD具有在外部输入电压和内部SSD电路之间切换的功能。 此开关由MCU控制。 由于MCU实时监视输入电压,一旦检测到输入电压高于指定的最大容差额定值,它会通过向保护开关发送信号来切断输入电压来保护SSD。

  • 浪涌电流抑制。浪涌电流是指系统在开启时汲取的大电流。 此初始电流,也称为接通浪涌电流或输入浪涌电流,以对电容器,电感器和变压器充电。 上电浪涌电流过高时,可能会损坏电路和组件。 

最新的ATP SATA和NVMe SSDs基于MCU的设计可通过启用软启动机制来最大程度地减小浪涌电流对SSD的影响,从而确保浪涌电流不会超过指定的阈值。

  • 输入电源噪声去毛刺。输入电源噪声是指电源不稳定,导致不希望的周期性纹波和尖峰的情况。

MCU通过一种判断机制来帮助消除噪声干扰,该机制可以检测何时功率下降到某个值以下,从而正确地识别出功率损耗或简单的电源不稳定。 如果没有MCU,电源不稳定可能会被误认为是电源故障,从而错误地触发缓存刷新,并有可能导致SSD“挂起”或冻结。

  • 快速电源开关控制。电源开关控制是管理电源关闭和下次电源打开之间的时序的机制。 MCU设计可确保更快,更高效的电源开/关控制。

下表说明了采用基于MCU的控制的SSD与未使用SSD的SSD相比的优势:

 

没有MCU的SSD​

有MCU的SSD

 

PLP电容器需要在上电之前放电/复位

 

立即启动电源,不管PLP电容器上的残留电压

如果关机状态非常短:

  • PLP可能没有完全放电
  • 控制器复位可能失败
  • SSD可能不能被识别,不能重新启动

如果关机状态非常短:

  • PLP不需要完全放电
  • 单片机复位控制器
  • SSD可以被识别并将正确重启

 

表1.具有/不具有MCU的SSD电源开关

 

 

使用基于MCU的PLP,可以确保快速的电源开/关控制,而不会由于未正确重置控制器而导致未检测到驱动器的潜在风险。

 

  • PLP电容器过压保护

聚合物钽电容器是ATP PLP技术的重要组成部分。 通过提供保持电源,它们可以确保将DRAM高速缓存中的数据刷新到NAND闪存中以进行安全维护,并且在发生断电事件时完成最后的写入命令。

过度充电会损坏电容器,从而损害其保护功能。 MCU实时监控电容器电压,并在检测到电压过高后立即禁用充电。 这保证了PLP电容足以在断电事件期间完成高速缓存刷新。 它还可以防止PLP电容器过早老化。

 

 

Summary: Fusion of Strengths Translate to Breakthrough

 

The PLP capability unleashed by the ATP MCU design requires the ATP/Micron NAND collaboration in order to endure power stability and data integrity to the NAND flash across the SSDs’ performance/life spectrum. Firmware and MCU tuning is required and reflected on the NAND characterization between each NAND generation, NAND configuration, and device density.

The MCU-based PLP for ATP SSDs is a breakthrough made possible by the unwavering commitment to provide “Industrial Only” memory and storage solutions. ATP’s nearly 30 years of manufacturing expertise and the valuable partnership with Micron demonstrate not only enduring collaborations but also shared goals of increasing the “Industrial Quotient” for the customers’ ultimate benefit -- the best total cost of ownership (TCO) value.

 

总结与结论

 

ATP PowerProtector 4集成了基于MCU的设计,可为ATP的下一代SATA和NVMe SSD提供增强的电源管理和PLP功能。 通过结合硬件和固件解决方案,基于MCU的设计可保护数据以及存储设备,以实现更高级别的完整性和可靠性。 根据客户要求,可以定制增强功能,从而可以根据独特的需求,特定于应用程序的需求或用例量身定制PLP功能。

下表总结了与每个功能相对应的好处。

 

增强驱动保护

 

  • 上电浪涌电流抑制
  • 过压保护

更好的数据完整性

  • 输入电源造生去毛刺的充电/过电保护
  •  PLP电容器充电不足/过充电保护

快速电源开关控制

 

  • 减少从关闭电源到重新启动SSD所需的时间

精确控制电源开关时序

 

  • 防止SSD过电/断电时出现潜在问题

订制选项

 

  • PLP可以根据客户要求或特定应用需求量身订制

 

表2.汇总表显示了每种MCU功能和优势如何为ATP的最新固态驱动器和模块提供增强的PLP功能。

 

 

采用基于MCU的新设计的下一代ATP SSD包括mSATA,2.5英寸SSD,M.2 2242/2280和NVMe模块。 固态硬盘支持I-Temp和C-Temp,还支持RAID引擎和端到端数据路径保护功能。 ATP的“工业”解决方案经过严格的测试和验证,可满足关键任务应用程序的高可靠性,高性能和高耐用性要求,以提供最佳的总拥有成本(TCO)价值。 想要了解更多,请访问ATP网站或联系ATP代表/经销商。

 

For more information: www.micron.com/IQ

联系我们