SSD信頼性評価
- 不揮発性メモリのデータシートから読み取れない実力評価が可能
- 不揮発性メモリの評価環境構築、試験実施から物理的不具合解析までワンストップにて対応
- JESD219A規格(Enterprise endurance workload)に準拠した評価に対応
SSD(Solid State Drive)信頼性評価事例
SSDの信頼性課題
- 不揮発性メモリのトンネル酸化膜劣化(電子移動の摩耗により記憶機能に寿命がある)
- 不揮発性メモリのフローティングゲート内の保持電子滅失(データ化け)
- SSD内コントールICによるデータ再配置に伴うスピード低下
- SSD内周辺回路の影響による動作不良(電源回路、ファームウェアバグ等)
不揮発性メモリの断面構造
SSD(Solid State Drive)信頼性評価
自社で開発したSSD評価環境の有効性を確認する為、市販されている4社のSSDについて、read/write耐性試験、データ保持耐性試験、S.M.A.R.T.(※1)情報の有効性評価を実施した。
- 試験項目
- 試験試料
試料の機能・性能・寿命
- ※1:S.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)障害の早期発見・故障の予測などを目的として HDD/SSD に搭載されている機能を指す。
- ※2:TBW(Tera Byte Written)SSDの寿命までに何テラ・バイトのデータを書込みできるかを示した書換え保証値
- ※3:IOPS(Input/Output Per Second)ハードディスクなどの記憶装置の性能指標の一つで、ある条件の元で1秒間に読込み・書込みできる回数
提供保守情報S.M.A.R.T.
常温read/write耐性試験(故障発生まで)
- 各社とも、書換え保証値内では、正常に動作した
- その後の故障に至るフェーズ1⇒2⇒3 の推移は、メーカー間の差が大きい
- C社は一定回数後に読出しエラーが発生したので、試験を中止した(故障に至る状況より、各社のデバイスの仕様に対する考え方の相違が見られる。)
常温read/write耐性試験方法
- SSD全域へ100回書込みごとにデータを読み出して読出しチェックを実施。
- 書き込み100回ごとにS.M.A.R.T.情報を読み出してエラーの有無を確認。
- 上記の1.と2の情報により不良の有無を確認。
- SSDへのアクセスはシーケンシャル。データはAA/55 チェッカーパターン。
書換え性能劣化のプロセス
- :SSD内部でエラー発生無し
- :SSD内部でNAND Flashの劣化を警告する領域(ECCエラー検出と修正)
- :SSD内部でNAND Flashの故障が発生していることを警告する領域(Bad ブロックの発生、予備領域への置き換え)
高温データ保持耐性試験
- 複数の試料に読出し不能状態に陥るものが散見される (ECC修正エラー発生と推定)
- A社、D社は最初のコンペアチェックでフェーズ2になったが、その後、暫く安定して動作した
高温データ保持耐性試験方法
- SSD全域へメーカー保証書込み容量(※4)を書込み後、高温環境下で放置。
- 高温放置によりデータ抜けが発生しないか10時間ごとに室温に戻し、通電後コンペアチェックを実施する。
- コンペアチェック前後に、累積過熱時間、読出し時間、S.M.A.R.T.情報を記録する。
- ※4: A社 ---72TBW、B社,D社 ---150TBW、C社 ---TBWの値は公表されていない。(72TBWを書込み試験投入)
データ保持能力劣化のプロセス
- :SSD内部でエラー発生無し(正常読出し)
- :SSD内部でNAND Flashの劣化を警告する領域(ECCエラー検出と修正)
- :SSD内部でNAND Flashの故障が発生していることを警告する領域(Bad ブロックの発生、予備領域への置き換え)
S.M.A.R.T. 情報の有効性評価(常温read/write耐性試験)
- 書込み回数増に伴って、フェーズ2のエラーが発生(ECC(※5)で回復)した。
- 書込み時間に異常な増加と、RRER発生がほぼ同時期に発生した⇒故障の始まり
- 詳細にみると、SSDが先に異常な動きをし(書込み時間の急増)、その後RRER(※6)が発生し、以降RRERの量に応じて書込み時間が増大し、最終的には故障に至っている
- この例からは、RRERの発生が極めて危険な兆候であると推定する。
- ※5:ECC: Error Correction CodeのことでS.M.A.R.T.情報の一部
- ※6:RRER: Raw Read Error RateのことでS.M.A.R.T.情報の一部
- ※7:HER: Hard ECC RecoveredのことでS.M.A.R.T.情報の一部
S.M.A.R.T. 情報の有効性評価(高温データ保持耐性試験)
- リテンション試験開始時点で、アクセスが非常に長時間化している。
- その後の読出し時間の推移、エラーの発生状況はメーカごとに異なるので、採用デバイスの特性を理解することが重要である。
- S.M.A.R.T.情報はメーカーにより提供項目が異なり(提供保守情報S.M.A.R.T.を参照)
また、この例ではHER(※7)の発生傾向がメーカーにより大きく異っている。
このような状況から、各社各モデル個別の保守ガイドラインが必要と考えられる。
SSD(Solid State Drive)信頼性評価のまとめ
SSD 4社の評価結果
- 各社のSSD特性を明確に評価可能
- 自社で開発したSSD評価環境の有効性を確認する為、市販されている4社のSSDについて、read/write耐性試験、データ保持耐性試験、各試験におけるS.M.A.R.T. 情報の有効性評価を実施した結果、各社のSSD特性を明確に評価可能である。
- 最適なSSDを選定する為には
- 最適なSSDを選定する為には、対象SSDの実力を把握すると同時に、コントロールICの性能、メーカーの信頼性・性能に関する考え方を理解することが重要である。
- S.M.A.R.T.情報の活用方法
- S.M.A.R.T.情報の活用方法は、採用機器の特性を十分把握したうえで判断
- フレキシブルな対応
- 本評価手法は、お客様のアプリケーション、要求に応じた最適な評価に、柔軟に可能である。
JESD219A規格に準拠した評価に対応
JESD219A規格に準拠した評価に対応いたします。当社で評価した結果、メーカー間で大きな差が見られ、大幅に試験時間が短縮される場合があることが確認されました。詳細な評価事例ををご希望の方は、コンテンツ名をクリックすると入力フォームが開きますので、必要事項をご記入いただくとダウンロードいただけます。
- デバイス/モジュールの信頼性評価、電気的特性測定・評価のお問い合わせ先
- WEBからのお問い合わせ:お問い合わせフォームはこちら
電話:03-5920-2366