ibaraki univ. dept of electrical & electronic eng
DESCRIPTION
2009. 7. 6. 電子計算機工学. Ibaraki Univ. Dept of Electrical & Electronic Eng. Keiichi MIYAJIMA. 今後の予定. 7 月 6 日 コンピュータシステムの信頼性 7 月 13 日 まとめと期末試験について 7 月 27 日 期末試験. コンピュータシステムの信頼性. 信頼性と信頼度. 信頼性. 素子や機器などのアイテムが正しく機能しているかどうかを定性的に表す 言葉. 信頼度. アイテムが与えられた条件で、規定の期間中、要求された機能を満足する 確率. 信頼度の例). - PowerPoint PPT PresentationTRANSCRIPT
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Keiichi MIYAJIMA
2009. 7. 6
今後の予定今後の予定今後の予定今後の予定
7 月 6 日 コンピュータシステムの信頼性
7 月 13 日 まとめと期末試験について
7 月 27 日 期末試験
コンピュータシステムコンピュータシステムの信頼性の信頼性
信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性信頼性
素子や機器などのアイテムが正しく機能しているかどうかを定性的に表す言葉
アイテムが与えられた条件で、規定の期間中、要求された機能を満足する確率
総数 個の素子が時刻 まで正常に動作している素子数を とすると、信頼度 は
信頼度信頼度
信頼度の例) N t
)(tS )(tR
N
tStR
)()(
信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性と信頼度
アイテムが与えられた条件で、規定の期間までに、故障する確率
時刻 までに故障した素子数を とすると、不信頼度 は
不信頼度不信頼度
不信頼度の例)t )(tQ
)(tF
N
tQtF
)()(
信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性と信頼度
時刻 までに残っている素子数 のうち、単位時間に故障する確率
故障率故障率t
)(t)(tS
dt
tdQ
tSt
)(
)(
1)(
ここで、 は時刻 まで正常であった素子が、時刻 で故障する確率
tdttdQ /)(tt
信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性と信頼度故障率のバスタブ曲線バスタブ曲線 dt
tdQ
tSt
)(
)(
1)(
故障率の時間変化
故障率
時 間
初期故障初期故障 偶発故障偶発故障 摩耗故障摩耗故障
信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性と信頼度偶発故障期間の信頼度 dt
tdQ
tS
)(
)(
1
この期間における故障率を (一定)とすると、
N
tQ
N
tQN
N
tStR
)(1
)()()(
dt
tdQ
Ndt
tdR )(1)(
両辺を で微分すると、t
dt
tdRN
dt
tdQ )()(
信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性と信頼度偶発故障期間の信頼度 dt
tdQ
tS
)(
)(
1
dt
tdRN
dt
tdQ )()( 代入
dt
tdR
tRdt
tdR
tS
N )(
)(
1)(
)(
右辺の を左辺に移すと、
dt
)(
)(
tR
tdRdt
信頼性と信頼度信頼性と信頼度信頼性と信頼度信頼性と信頼度偶発故障期間の信頼度 dt
tdQ
tS
)(
)(
1
)(
)(
tR
tdRdt
における信頼度を1とすると、
0t
)(
10)(
)(
1tRttdR
tRdt
)(
10 )(log tRe
t tRt 1log)(log ee tRt
)(log tRt etetR )(
平均故障寿命と平均故障間平均故障寿命と平均故障間隔隔平均故障寿命と平均故障間平均故障寿命と平均故障間隔隔
非修理アイテムの故障寿命の平均値平均故障寿命 平均故障寿命 (mean time to failure: MTTF)
平均故障間隔 平均故障間隔 (mean time between failure: MTBF)故障と故障の間の平均時間間隔 (故障率の逆数)MTBF
1
)(00
dtedttR t
例)
あるプロセッサが ゲートから構成され、1ゲートあたりの故障が平均 時間に1回発生すると仮定
6101010
プロセッサの故障率4
106 10
10
110 個数/時間
よって MTBF は 時間
410
保全度と平均修理時間保全度と平均修理時間保全度と平均修理時間保全度と平均修理時間
与えられた時間内に故障の検出・修理を完了する確率保全度 保全度 (maintainability)
平均修理時間 平均修理時間 (mean time to repair: MTTR)修理に要する平均時間この時間が短ければ短いほど修理が速い
アベイラビリテアベイラビリティィアベイラビリテアベイラビリティィ
コンピュータシステムが特定の瞬間に機能を維持している確率。(稼働率ともいう)
(availability: Av)
MTBF+MTTRAv=
アップタイム+ダウンタイム
アップタイム = MTBF
信頼度と保全度を総合したシステムの広義の信頼性を表す尺度
アベイラビリティの向上には MTTR (平均修理時間)を小さくすることが、コスト的に有利である場合が多い。
直列および並列システムの信頼直列および並列システムの信頼度度直列および並列システムの信頼直列および並列システムの信頼度度
どれか一つでも故障するとシステムダウンになる。
直列システム 直列システム (series system)
例)
信頼度 と信頼度 の2個のモジュールからなる直列システム全体の信頼度 は
モジュール1
モジュール2
モジュール3
モジュール4
1R 2R 3R 4R
98.01 R 98.02 RR
96.098.098.021 RRR
近年のコンピュータシステムはモジュール化されている
直列および並列システムの信頼直列および並列システムの信頼度度直列および並列システムの信頼直列および並列システムの信頼度度
全て故障しないとシステムダウンにならない。
並列システム 並列システム (parallel system)
例)
信頼度 と信頼度 の2個のモジュールからなる並列システム全体の信頼度 は
モジュール1
モジュール2
モジュール3
モジュール4
1R
2R
3R
4R
98.01 R 98.02 RR
直列および並列システムの信頼直列および並列システムの信頼度度直列および並列システムの信頼直列および並列システムの信頼度度
並列システム 並列システム (parallel system)
例)
信頼度 と信頼度 の2個のモジュールからなる並列システム全体の信頼度 は
98.01 R 98.02 R
R
モジュール1
モジュール2
モジュール3
モジュール4
1R
2R
3R
4R
2個のモジュールが2つとも故障する確率は )98.01)(98.01(
よって はR
9996.0)98.01)(98.01(1 R
直列および並列システムの信頼直列および並列システムの信頼度度直列および並列システムの信頼直列および並列システムの信頼度度
例題例題
1)
R
1R 2R
モジュール1
モジュール2
モジュール3
モジュール4
3R 4R
以下のシステムの全体の信頼度 はそれぞれいくらか?なお、各モジュールの信頼度は全て0.98とする。
2)
モジュール1
モジュール2
モジュール3
モジュール4
3R 4R
1R 2R
解答解答 1)
1R 2R
モジュール1
モジュール2
モジュール3
モジュール4
3R 4R
2)
モジュール1
モジュール2
モジュール3
モジュール4
3R 4R
1R 2R
1)
上側の信頼度は2個の直列なので 96.098.098.021 RRRU
下側も同様であるから、これが二つの並列システムを作っているので、 9984.0)96.01)(96.01(1 R
左側の側の並列システムの信頼度は
9996.0)98.01)(98.01(1 LR
これが二つ、直列に繋がっていると考えられるので、 9992.09996.09996.0 R
高信頼化システムの構成高信頼化システムの構成高信頼化システムの構成高信頼化システムの構成一般にコンピュータシステムでは、万一、故障が発生してもシステムダウンとならないことが要求される
故障が発生してもシステムが動作を維持できるフォールトトレラフォールトトレランスンス
(fault tolerance: 耐故障 )
代表的な耐故障システムの構成代表的な耐故障システムの構成例例代表的な耐故障システムの構成代表的な耐故障システムの構成例例デュプレックスシスデュプレックスシステムテム
( 待機冗長システム )
SW
CCU 1
CCU 2
CPU 1
CPU 2
MEM 1
MEM 2
FILE 1
FILE 2一方に故障が発生したら、すぐ
に予備のシステムに切り換える
代表的な耐故障システムの構成代表的な耐故障システムの構成例例代表的な耐故障システムの構成代表的な耐故障システムの構成例例デュアルシステムデュアルシステム(dual system)
CCU 1
CCU 2
CPU 1
CPU 2
MEM 1
MEM 2
FILE 1
FILE 2
クロスチェックにより、信頼性を向上
クロス チェック
代表的な耐故障システムの構成代表的な耐故障システムの構成例例代表的な耐故障システムの構成代表的な耐故障システムの構成例例
TMRTMR (triple modular redundancy)
CPU 1
CPU 2
MEM 1
MEM 2
CPU 3
MEM 3
VoterVoter
システムを三重化して多数決で決定
代表的な耐故障システムの構成代表的な耐故障システムの構成例例代表的な耐故障システムの構成代表的な耐故障システムの構成例例マルチプロセッサシステマルチプロセッサシステムム
(multi-processor system)
CCU
Channel 1
Channel 2
CPU 1
CPU 2
FILE 1
FILE 2多数の CPU を用いて処理を分担し実行する。高
信頼性と高処理効率を実現できるが、制御やプログラミングが難
MEM
本日のまと本日のまとめめ本日のまと本日のまとめめ「コンピュータシステムの信頼性」につい
て • 信頼性と信頼度• 平均故障寿命と平均故障間隔• 保全度とアベイラビリティ• 信頼度の計算法• 代表的な耐故障システム
本日の課題1本日の課題1本日の課題1本日の課題11.MTBF が 1500 時間、 MTTR が 500 時間で
あるコンピュータシステムの稼働率を 1.25倍に向上させたい。 MTTR をいくらにすればよいか? ( H15 年
春)2. 3 台のコンピュータが以下の図のように
接続されているとき、システム全体の信頼度はいくらか? なおコンピュータの信頼度は全て0.98とする。
A
B
C
本日の課題2本日の課題2本日の課題2本日の課題2
( H18 年秋、 H14 年秋、類題:H15秋)
3.信頼度0.9の装置を用いて、全体の信頼度 0.999以上の多重化システムを作りたい。この装置を最低何台並列に接続すればよいか?