jmpv4 ハンズオンセミナー - odngengen525/index1.files/jmpv4user.pdfweibull.jmpの解析2...
TRANSCRIPT
Motohisa HIRONO 2/81
はじめに
§ 今回の生存時間分析のデータでは, 主に工業製品での信頼性試験データを扱う
§ 例題は実験データ, 要因の水準(値)になっている
§ 要因は制御因子と加速因子
Motohisa HIRONO 3/81
生存時間分析とは
§ ある基準となる時刻から, 目的の反応が得られるまでの (生存)時間データ(Survival Time)を 対象とした解析手法の総称
§ 工業分野では信頼性データ解析と呼ばれる
Motohisa HIRONO 4/81
目的の反応とは
§ 観測する個体に対して1度だけ 非再起的に発生する事象(Event)§ 例)
l 死亡 癌や循環器系の臨床研究での患者の再発や死亡
l 故障 システムや機器の信頼性研究での故障
Motohisa HIRONO 5/81
Time
Start of Study
EndLost
Died
Time
Censor
Censor
Died
Start of Observation
DiedDied
Died
Died
生存時間データ1
Motohisa HIRONO 6/81
Start of Study End
Time
Censor
Censor
Died
Start of Observation
Died
Died
生存時間データ2
Motohisa HIRONO 7/81
生存時間分析の目的§ (目的の)の反応が,ある生存時間区間に
l 集中して発生するか
l 時間に依存しないでランダムに発生するか
l 生存している確率(信頼度)はいくらか
§ 制御因子や環境因子の影響により生存時間に違いはあるかl 設計パラメータの決定
l 加速性,比例ハザード性による予測
Motohisa HIRONO 8/81
§ 生存時間分析の基礎l 生存関数,ハザード関数,故障(死亡)の分類,
Weibull分布,打切りデータ,競合リスク
§ 生存時間の分析l カプラン・マイヤー法,確率プロット
§ 非線形回帰分析l 比例ハザードモデル,加速モデル(Weibull回帰)
反応論モデル
本ハンズオンの内容
Motohisa HIRONO 9/81
Survival Time Analysis
生存時間の分布のご利益注目する時点まで生存する確率(Proportion)と生存関数(Survival Function)の記述
製品の信頼性の記述,生存時間データの分布の仮定
•例)変圧器が5000時間まで生存する確率
•例)ベアリングの10%が故障するまでの時間
Motohisa HIRONO 10/81
生存時間データの分布§ 時間データである 非負である
§ 中には非常に長生きな個体がある 分布の裾が右に長い
§ 左右対称の単峯分布ではない 正規分布の理論が使い辛い
§ 対象によって生存時間の分布が異なる対数正規分布,指数分布,Weibull分布などノンパラ手法の活躍
Motohisa HIRONO 11/81
生存関数(Survival Function) 1
f(t)
t
故障 生存
密度関数 f(t)
生存関数S(t)とは時点tまで生存している個体の累積比率(Proportion)を表す関数
分布関数F(t)とは S(t)=1-F(t)
Motohisa HIRONO 13/81
ハザード関数の導入§ ハザード関数(hazard function)とは 時点tまで生存したという条件付きで, 時点tの瞬間にイベントが発生する 確率 (rate)を表す関数 h(t)=f(t)/S(t)
l 例)40歳死亡率 40歳で死亡するためには 40歳まで生きている必要があり, その条件の人の中で次の1年間で死亡する確率
Motohisa HIRONO 15/81
故障(死亡)の分類
§ ハザード関数は瞬間死亡率であるからハザード関数の傾向により3つに分類できるl 初期故障型;ハザード関数が単調減少
• 例)乳幼時期の死亡率
l 偶発故障型;ハザード関数が一定• 例)青壮年期の死亡率
l 磨耗故障型;ハザード関数が単調増加• 例)老年期の死亡率
Motohisa HIRONO 16/81
Weibull分布§ 工業では主にWeibull分布を仮定
( )1
expt t
f tβ ββ
α α α
− = • −
( ) ( )1 expt
S t F tβ
α
= − = −
( ) ( )( )
1f t th t
S t
ββα α
− = =
密度関数
生存関数
ハザード関数
Motohisa HIRONO 17/81
Weibull分布のパラメータ1ワイブル分布のパラメータはα,β,γの3つ通常は位置パラメータγを0と仮定する形状パラメータβと尺度パラメータαを推定する
形状パラメータは分布の形を決めるものでありワイブル分布では β <1 のとき 初期故障型 β =1 のとき 偶発故障型(指数分布) β >1 のとき 磨耗故障型に対応する
Motohisa HIRONO 18/81
Weibull分布のパラメータ2
尺度パラメータαは 累積の故障割合が63.2%に達するときの時点
注)形状パラメータの表記は JMPではβ(Beta) 日本の信頼性データ解析ではm 尺度パラメータの表記は JMPではα(Alpha) 日本の信頼性データ解析ではη
Motohisa HIRONO 19/81
§ データを読み込む§ Weibull分布の確認
l オーバーレイプロットを描く• 1)密度関数を描く
• 2)生存関数と分布関数を描く
• 3)3つのハザード関数を描く
ハンズオン1Weibull.JMPの解析
Motohisa HIRONO 20/81
変数の意味など
§ 変数 time が生存時間§ α=10000時間,β=2.5のWeibull分布
l time,f(t),F(t),S(t)
§ βの値を変えてみようl h1(t)…β=2.5l h2(t)…β=1.0l h3(t)…β=0.5l データ件数40件
ハザード関数はどう変わる
Motohisa HIRONO 25/81
ハンズオン1Weibull.JMPのまとめ
グラフより,ワイブル分布のハザード関数h(t)は形状パラメータβの値によって,
単調減少 β<1 一定 β=1 単調増加 β>1
することが分かる
Motohisa HIRONO 26/81
JMP Calculator
§ メニューのColsでColumn Info.を選ぶ§ Current Properties がFormulaを確認
§ Edit Formula をクリック§ 計算式を表示,編集§ 2つのリストボックスの役割を理解
l 左;現在登録されているCol Name
l 右;利用する関数群• クリックすると関数を表示
Motohisa HIRONO 27/81
Survival メニュー§ Survival Distribution
l ノンパラメトリックのKaplan-Meier法l 仮定した分布のパラメータを求める確率プロットl 右側打ち切り,グループの比較,競合リスク
§ Parametric Regression l 生存時間に分布を仮定した非線形回帰l 加速モデル
§ Proportional Hazardsl 生存時間に分布を仮定しないCox回帰l 比例ハザードモデル(セミパラメトリック)
§ Recurrence l 今回は対象外
Motohisa HIRONO 28/81
打ち切り(censor)データ§ 観測される個体について,正確な生存時
間が測定できるとは限らないので打ち切り(censor)が生じる場合がある
1.時間の原点(測定の開始時点)が不明確な場合
例)製品やシステムなどの信頼性研究では 納品時点は分かっても,実際のユーザーの 使用開始時点は正確には分からない
例)デバイスなどでは信頼性試験終了時点に, 故障していない個体がある
2.反応の発生時点が分からない場合
左側打ち切り左側打ち切り
右側打ち切り右側打ち切り
Motohisa HIRONO 29/81
Censor変数の意味
§ JMPでは,Censor変数にルールがあるl 0;
打ち切りのない完全なデータを意味する
l 1,2,…(0以外);
打ち切りが生じたデータ
Motohisa HIRONO 30/81
Weibull プロットの原理
両辺に対数をとると
再度,両辺に対数をとると
( ) ( )1 expt
S t F tβ
α
= − = −
( )logt
S tβ
α
= −
( )logt
S tβ
α − =
( ){ }log log logt
S t βα
− =
( ){ }log log log logS t tβ α β− = − +
Motohisa HIRONO 31/81
ハンズオン2Weibull.JMPの解析2
§ データを読み込む§ Weibullプロットの原理を理解する
l Columnを1つ追加するl JMP Calculatorを使い,-lnS(t)を計算するl AnalyzeのFit Y byX で,Xにtime,Yに-lnS(t)を
指定するl 縦軸と横軸を対数にするl プロットが直線になることを確認する
Motohisa HIRONO 33/81
ハンズオン3Wiring.JMPの解析
§ データを読み込む§ 一変量の解析,分布を確認する
l Survival Disuribution を使うl Survival プロットを描くl Weibullプロットを描くl Weibullプロットに参照線を追加するl Weibull分布のパラメータを推定するl 他の分布(対数正規分布,指数分布)を試す
Motohisa HIRONO 34/81
変数の意味など
§ 電子デバイス(Al配線)の加速寿命試験における寿命分布を推定する.
§ 変数の意味l Time(加速寿命試験による電子デバイスが故
障に至るまでの時間)
l Censor(打ち切り)
Motohisa HIRONO 35/81
操作3.1 打ち切り情報を無視した解析
1.Survival Distribution をクリックして
2.Timeをクリックして 3.Yをクリック
4.OKをクリック
Motohisa HIRONO 38/81
操作3.4 打ち切り情報を考慮した解析
1.Survival Distribution をクリックして
2.Timeをクリックして
3.Yをクリック
6.OKをクリック
4.Censorをクリックして 5.Censorをクリック
Motohisa HIRONO 39/81
操作3.5 信頼区間の追加
1.Show Confid Intervalを選択
2. Kaplan-Meier 法による平均値,標準偏差の推定値95%信頼区間が描画される
Motohisa HIRONO 40/81
操作3.6 Weibullプロットの実行
2.Weibull プロットを描画する
推定値の違いに注目
3.Save Estimatesを選択
1.Weibull Plot,Weibull Fit を選択
Motohisa HIRONO 42/81
ハンズオン3Wiring.JMPのまとめ
§ グラフの下にExtreme-value Parameter Estimates とWeibull Parameter Estimates が表示される§ 表には,ワイブル分布のパラメータの推定値の他に,
推定値の信頼水準95%の上下限値,および反応数が表示される§ Deltaはワイブルプロットの傾きでBeta=1/Delta § Lambdaはワイブルプロットの63.2%点でAlpha=eLambda
§ ワイブル分布の他にExponential PlotとLogNormalPlotができる
Motohisa HIRONO 43/81
1因子(質的変数)の解析§ 処理の違うグループ間の生存時間の比較§ Kaplan-Meier 法の実行
l グループ毎の生存関数の表示
l ノンパラメトリック検定• ログランク検定• 一般化Wilcoxon検定
§ パラメトリック検定l 生存時間分布の指定
l パラメトリックモデルの実行
Motohisa HIRONO 44/81
ノンパラメトリック検定
§ ログランク検定l 全ての時点で同じウエイトがかかる
§ 一般化Wilcoxon検定l ウエイトがその時点のリスク集合の大きさ
l tが小さい初期のウエイトが大きい
Motohisa HIRONO 46/81
ハンズオン4Rats.JMPの解析
§ データを読み込む§ 一因子(質的変数)の解析,処理の比較
l Survival Time Modelingを使う
l 2群のSurvival プロットを描く
l 2群の生存時間の違いを検定する
l 推定量を保存する
l 2群をまとめて生存時間を推定する
l 対数正規分布を仮定した検定を試す
Motohisa HIRONO 47/81
変数の意味など
§ 発癌剤の投与量を変えた2つのグループのラットの生存時間の比較
§ 解析に用いる変数l day (ラットの生存日数)
l Group (発癌剤の投与量の違い)l Censor (打ち切りの有無)
Motohisa HIRONO 48/81
操作4.1 役割の指定1.Survival Distribution をクリックして2.daysをクリックして 3.Yをクリック
8.OKをクリック
4.Censorをクリックして5.Censorをクリック
6.Groupをクリックして
7.Groupingをクリック
Motohisa HIRONO 51/81
ハンズオン4Rats.JMPのまとめ
§ Tests Between Groupsに表示されているように,2群の生存関数が等しいという帰無仮説の下での検定結果(Prob>ChiSq)から,いずれの検定でも5%で有意でないことが分かる.
§ ウインドウの左下隅にあるチェックボタンをクリックして,Show Combinedを選ぶと,2群を合併した生存関数がグラフに追加される.
§ グラフの軸をダブルクリックするとグラフにグリットを表示できるなどのオプション機能がある
Motohisa HIRONO 52/81
生存関数の推定値の出力(1)§ 左端のdaysには,時間の順に反応,打ち切りがあっ
た日が出力される.§ 2番目のSurvivalのカラムは,生存関数の推定値を
示しているl Survival=(At Risk - N Failed)/At Risk
§ 3番目のFailureのカラムは,累積のイベントの割合(分布関数)を示しており,Survival+Failure=1 という関係がある§ SurvStdErr(Survival Standard Error)のカラム
は,得られた生存関数の値を母集団に対する推定値と考えた場合の標準誤差を表示している
Motohisa HIRONO 53/81
生存関数の推定値の出力(2)§ N Failedのカラムは1番目のカラムの時点で発生
した反応の数である§ N Censoredのカラムは 1番目のカラムの時点で
打ち切りのあった数である§ 右端のAt Riskのカラムは,リスク集合の大きさ(ス
タート時の標本数から,その時点までの反応と打ち切りを受けた個体を除いた数)を示している§ Quantilesの表にある,MeanとStdDev(Standard
Deviation)は生存時間の平均の推定値と標準偏差の推定値である
Motohisa HIRONO 54/81
競合リスクモデル
§ イベント(故障,死亡)の原因が複数考えられる場合に発生原因別に解析したい
§ 得られたデータはイベントの生起時間のみ§ イベントは,原因A,B,C…でおきる§ 原因A,B,C,…は背反で生存時間に依
存しない
§ 原因Aでイベントがおきたとき, 原因B,C,…でイベントは起きない
Motohisa HIRONO 55/81
競合リスクモデルの解析の仕方
§ 着目した原因で故障,死亡が発生した場合はイベントが発生したと考える§ 着目した原因以外で故障,死亡が発生した場合
は,観測が打ち切られたと考えて打ち切りデータとして扱う§ 故障の原因が同じようなものは1つにまとめる(群
間の検定をおこなう)
Motohisa HIRONO 56/81
§ データを読み込む§ 競合リスクの解析
l Survival Time Modelingを使う
l Survival プロットを描く
l 競合リスクを調べるl Omitする原因を選ぶ
l 簡便法による当てはまりの評価
ハンズオン5Unit.JMPの解析
Motohisa HIRONO 57/81
変数の意味など§ 電送機器に用いられるプリント基板
の生存時間解析生存時間に依存しない2種類の原因のどちらかにより反応=故障が起きた場合の競合リスクモデルの解析
§ 変数l time (市場での生存時間)
• 基板が故障に至るまでの時間
l failure (故障の原因)• プリント基板の故障の原因は2つだけ
– Condenser コンデンサのショート– Relay リレーの接点溶接不具合
Motohisa HIRONO 58/81
操作5.1 役割の指定1.Survival Distribution をクリックして
4.OKをクリック2.timeをクリックして
3.Yをクリック
5.Competing Causesをクリック
6.Falureを選択
Motohisa HIRONO 60/81
操作5.3 Weibullプロット全体と競合モデルのWeibull直線が描画される
1.Omit Causesをクリック
2.Condenserをクリック3.OKをクリック
Motohisa HIRONO 62/81
ハンズオン5Unit.JMPのまとめ§ ポップアップメニューから,Competing Causes
を選ぶと競合リスクモデル下での各故障原因毎のワイブル分布のパラメータ推定が求まる§ 生存関数のプロットにワイブル分布による生存関
数が破線で表示される§ 原因コードでcondenserをOmit すると,condenserの
ショートによる故障は 打ち切りデータとしてワイブル分布に基づく生存関数が破線で表示される§ FailureをGrouping に指定した場合の解析とは同じ
にならないことに注意
Motohisa HIRONO 63/81
1因子(量的変数)の解析
§ 要因効果をしらべるl 製品の信頼性評価は実験研究が多い
• 設計パラメータを変更したことによる改善効果
• 環境要因の寿命加速性の確認• 加速試験が基本…反応論モデル
l 比例ハザードモデル• ハザード比が一定
l 加速モデル• 生存時間が加速する
Motohisa HIRONO 64/81
1変数の比例ハザードモデル
§ 個体のハザード関数に
を考える§ h0(t)はxが0である基準となるハザード関数
とする§ ハザードの比を取ると,共通のh0(t)が相殺
されるので,未知数はb1のみである
( ) ( ) ( )0 1expi ih t h t b x=
( )( )
( ) ( )( ) ( ) ( ){ }0 1
10 1
expexp
expi i
i jj j
h t h t b xb x x i j
h t h t b x= = − ≠
Motohisa HIRONO 65/81
反応論モデル
§ Arrhenius アレニウスモデル
§ θ℃則モデル
§ Eyring モデル
§ べき(n)乗モデル
( ){ } 50 1 1
ˆexp 1/ , 8.62 10aLife b b kT E b k −= + • = = ×
( ){ }0 1 1ˆexp ln 2 1/Life b b T b θ = + • =
( ){ }0 1 1ˆ/ exp 1/ aLife T b b kT E b= + =
( ){ }0 1 1ˆexp lnLife b b T n b= + • =
Motohisa HIRONO 66/81
§ 反応論モデルなどによる加速モデルのタイプを技術的に決める
§ 試験する水準数と水準値を決め試験実施§ 変数変換
l 温度は絶対温度の逆数を考える など
§ 生存時間の分布を想定§ 加速モデルで解析
加速モデルの解析の仕方
Motohisa HIRONO 67/81
ハンズオン6Creep.JMPの解析
§ データを読み込む§ 1因子(量的変数)の解析,加速モデルの実施
l Survival Time Modelingを使う
l 比例ハザードモデルの実行
l 生存時間の分布を想定l 加速モデル(Weibull回帰)を実行
l 考察
Motohisa HIRONO 68/81
変数の意味など
§ プラスチック材料のクリープ破壊による寿命モデルのパラメータを推定する.§ 変数の意味
l temp (試験環境の摂氏)l 1/T(試験環境の絶対温度の逆数)l time(生存時間)l Censor(打ち切りの有無)
§ 反応論モデルとして Life= exp(b0+b1/(273+temp)) =exp(b0+b1/T)
を仮定する
Motohisa HIRONO 69/81
操作6.1 役割の指定1.Proportional Hazards をクリックして2.timeをクリックして 3.Time to Event
をクリック
8.Run Modelをクリック
4.Censorをクリックして
5.Censorをクリック
6.1/Tをクリックして 7.Addをクリック
Motohisa HIRONO 70/81
操作6.2 比例ハザードモデル
比例ハザードモデルによる生存関数のグラフ
( )( )
( ){ }
75
65
exp 18303.289 0.002874 0.002959
4.74
h tRisk
h t=
= − −
=
℃
℃
温度が65℃から10℃上昇して75℃になったときのハザード比は
4.74倍のリスクに跳ね上がることが分かる
Motohisa HIRONO 71/81
操作6.3 役割の指定 21.Parametric Regression をクリックして2.timeをクリックして 3.Time to Event
をクリック
8.Weibullをクリック
4.Censorをクリックして
5.Censorをクリック
6.1/Tをクリックして 7.Addをクリック
9.Run Modelをクリック
Motohisa HIRONO 72/81
操作6.4 Weibull回帰の実行
1ˆ exp 23.42711 10266.8942T
α = − +
βの推定値 1.844
δ=1/β95%信頼区間に1を含まない(1未満)から,摩耗故障
Motohisa HIRONO 73/81
操作6.5 残差の検討1.データテーブルのColumnsで新たに2つのカラムを追加2.変数名を予測値,残差とする3.Formulaにして,計算式
予測値:
残差:
を作る4. Survival Distributionから,Yに残差,CensorにCensorを
指定後,Weibullプロットを行う5.α=1,β=1のWeibull分布にしたがっていることを確認する
1ˆ exp 23.42711 10266.8942T
α = − +
( ) ( )ln lnexp
timeres
− =
予測値
δ
Motohisa HIRONO 75/81
ハンズオン6Creep.JMPのまとめ§ 比例ハザードモデル
l パラメータ推定には分布に関する情報がないこと定数項がモデルに含まれない点に注意する
l Parameter Estimatesには,1/Tの回帰係数の推定値,標準誤差,95%の上下限値が表示される.
l RiskRatioは回帰係数の指数(exp(-16603.743))を計算したもので, リスク比を表すものである.l Baseline Survival at timeは,要因が平均値である場合の生存関数
のプロットを表示している.
§ 加速モデル(weibull回帰)l Parameter Estimatesでは比例ハザードモデルと符号が逆になってい
ることに注意(ハザードの単位は1/時間)
Motohisa HIRONO 76/81
多因子の解析;~複合加速モデル
§ 実際の試験では要因を複数考えることが多い
§ 説明変数が複数ある場合の解析§ 説明変数は量的でも質的でもよい§ Survival では,fit model(重回帰分析)のよ
うな変数選択機能はないことに注意
Motohisa HIRONO 77/81
ハンズオン7Reliable.JMPの解析
§ データを読み込む§ 多因子(複合加速モデル)の解析
l Survival を使う
l 生存時間の分布を想定
l 反応論モデルの想定l Waeibull回帰分析の実行
l 考察
Motohisa HIRONO 78/81
変数の意味など
§ 接着剤の寿命試験における寿命モデルのパラメータを推定する. 但し,時間分布として,ワイブル分布を指定する.
§ 変数の意味l Glue(接着剤の種類)----処理,Temp(摂氏)l 1/(kT)(試験環境の絶対温度とボルツマン常数の積の逆数),l RH(試験環境の相対湿度)l Day(生存日数)l Censor(打ち切りの有無)
Motohisa HIRONO 79/81
操作7.1 役割の指定1.Parametric Regression をクリックして2.Dayをクリックして 3.Time to Event
をクリック
8.Weibullをクリック
4.Censorをクリックして
5.Censorをクリック
6.glue,1/kT,RHをクリックして7.Addをクリック
9.Run Modelをクリック