デバイス/モジュールの信頼性評価、電気的特性測定・評価

SSD信頼性評価

  • 不揮発性メモリのデータシートから読み取れない実力評価が可能
  • 不揮発性メモリの評価環境構築、試験実施から物理的不具合解析までワンストップにて対応
  • JESD219A規格(Enterprise endurance workload)に準拠した評価に対応

SSD(Solid State Drive)信頼性評価事例

SSDの信頼性課題

  • 不揮発性メモリのトンネル酸化膜劣化(電子移動の摩耗により記憶機能に寿命がある)
  • 不揮発性メモリのフローティングゲート内の保持電子滅失(データ化け)
  • SSD内コントールICによるデータ再配置に伴うスピード低下
  • SSD内周辺回路の影響による動作不良(電源回路、ファームウェアバグ等)

不揮発性メモリの断面構造不揮発性メモリの断面構造

SSD(Solid State Drive)信頼性評価

自社で開発したSSD評価環境の有効性を確認する為、市販されている4社のSSDについて、read/write耐性試験、データ保持耐性試験、S.M.A.R.T.(※1)情報の有効性評価を実施した。

試験項目
試験試料
  • 4社のSSD(128GB)

試料の機能・性能・寿命

試料の機能・性能・寿命 TBWとは IOPSとは

  • ※1:S.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)障害の早期発見・故障の予測などを目的として HDD/SSD に搭載されている機能を指す。
  • ※2:TBW(Tera Byte Written)SSDの寿命までに何テラ・バイトのデータを書込みできるかを示した書換え保証値
  • ※3:IOPS(Input/Output Per Second)ハードディスクなどの記憶装置の性能指標の一つで、ある条件の元で1秒間に読込み・書込みできる回数

提供保守情報S.M.A.R.T.

提供保守情報S.M.A.R.T.

常温read/write耐性試験(故障発生まで)

  • 各社とも、書換え保証値内では、正常に動作した
  • その後の故障に至るフェーズ1⇒2⇒3 の推移は、メーカー間の差が大きい
  • C社は一定回数後に読出しエラーが発生したので、試験を中止した(故障に至る状況より、各社のデバイスの仕様に対する考え方の相違が見られる。)

常温read/write耐性試験方法

  1. SSD全域へ100回書込みごとにデータを読み出して読出しチェックを実施。
  2. 書き込み100回ごとにS.M.A.R.T.情報を読み出してエラーの有無を確認。
  3. 上記の1.と2の情報により不良の有無を確認。
  4. SSDへのアクセスはシーケンシャル。データはAA/55 チェッカーパターン。

書換え性能劣化のプロセス

フェーズ2
:SSD内部でエラー発生無し
フェーズ1
:SSD内部でNAND Flashの劣化を警告する領域(ECCエラー検出と修正)
フェーズ3
:SSD内部でNAND Flashの故障が発生していることを警告する領域(Bad ブロックの発生、予備領域への置き換え)

全域書換え回数

高温データ保持耐性試験

  • 複数の試料に読出し不能状態に陥るものが散見される (ECC修正エラー発生と推定)
  • A社、D社は最初のコンペアチェックでフェーズ2になったが、その後、暫く安定して動作した

高温データ保持耐性試験方法

  1. SSD全域へメーカー保証書込み容量(※4)を書込み後、高温環境下で放置。
  2. 高温放置によりデータ抜けが発生しないか10時間ごとに室温に戻し、通電後コンペアチェックを実施する。
  3. コンペアチェック前後に、累積過熱時間、読出し時間、S.M.A.R.T.情報を記録する。
  • ※4: A社 ---72TBW、B社,D社 ---150TBW、C社 ---TBWの値は公表されていない。(72TBWを書込み試験投入)

データ保持能力劣化のプロセス

フェーズ2
:SSD内部でエラー発生無し(正常読出し)
フェーズ1
:SSD内部でNAND Flashの劣化を警告する領域(ECCエラー検出と修正)
フェーズ3
:SSD内部でNAND Flashの故障が発生していることを警告する領域(Bad ブロックの発生、予備領域への置き換え)

高温放置累積時間

S.M.A.R.T. 情報の有効性評価(常温read/write耐性試験)

  • 書込み回数増に伴って、フェーズ2のエラーが発生(ECC(※5)で回復)した。
  • 書込み時間に異常な増加と、RRER発生がほぼ同時期に発生した⇒故障の始まり
  • 詳細にみると、SSDが先に異常な動きをし(書込み時間の急増)、その後RRER(※6)が発生し、以降RRERの量に応じて書込み時間が増大し、最終的には故障に至っている
  • この例からは、RRERの発生が極めて危険な兆候であると推定する。
  • ※5:ECC: Error Correction CodeのことでS.M.A.R.T.情報の一部
  • ※6:RRER: Raw Read Error RateのことでS.M.A.R.T.情報の一部
  • ※7:HER: Hard ECC RecoveredのことでS.M.A.R.T.情報の一部

全書き込み回数

S.M.A.R.T. 情報の有効性評価(高温データ保持耐性試験)

  • リテンション試験開始時点で、アクセスが非常に長時間化している。
  • その後の読出し時間の推移、エラーの発生状況はメーカごとに異なるので、採用デバイスの特性を理解することが重要である。
  • S.M.A.R.T.情報はメーカーにより提供項目が異なり(提供保守情報S.M.A.R.T.を参照
    また、この例ではHER(※7)の発生傾向がメーカーにより大きく異っている。
    このような状況から、各社各モデル個別の保守ガイドラインが必要と考えられる。

各社高温リテンション試験結果

SSD(Solid State Drive)信頼性評価のまとめ

SSD 4社の評価結果
SSD 4社の評価結果

各社のSSD特性を明確に評価可能
  • 自社で開発したSSD評価環境の有効性を確認する為、市販されている4社のSSDについて、read/write耐性試験、データ保持耐性試験、各試験におけるS.M.A.R.T. 情報の有効性評価を実施した結果、各社のSSD特性を明確に評価可能である。
最適なSSDを選定する為には
  • 最適なSSDを選定する為には、対象SSDの実力を把握すると同時に、コントロールICの性能、メーカーの信頼性・性能に関する考え方を理解することが重要である。
S.M.A.R.T.情報の活用方法
  • S.M.A.R.T.情報の活用方法は、採用機器の特性を十分把握したうえで判断
フレキシブルな対応
  • 本評価手法は、お客様のアプリケーション、要求に応じた最適な評価に、柔軟に可能である。

JESD219A規格に準拠した評価に対応

JESD219A規格に準拠した評価に対応いたします。当社で評価した結果、メーカー間で大きな差が見られ、大幅に試験時間が短縮される場合があることが確認されました。詳細な評価事例ををご希望の方は、コンテンツ名をクリックすると入力フォームが開きますので、必要事項をご記入いただくとダウンロードいただけます。

デバイス/モジュールの信頼性評価、電気的特性測定・評価のお問い合わせ先
WEBからのお問い合わせ:お問い合わせフォームはこちら
電話:03-5920-2366
Get Adobe Reader
PDFの閲覧にはAdobe Readerが必要です。Adobe社のサイトからダウンロードしてください。

Pickup Contents

      • YouTube

      お問い合わせ

      お問い合わせ