論文輪読会 - a multi-level trend-renewal process for modeling systems with recurrence data
TRANSCRIPT
論文輪読会A Multi-level Trend-Renewal Process for Modeling Systems
with Recurrence Data
早川 敦士
生存時間解析の基礎的な話
生存時間分析
生存時間分析(survival analysis)は、イベント(event)が起きるまでの時間とイベントとの間の関係に焦点を当てる分析方法である。生存時間分析は、工学分野においては機械システムや製品の故障などを、医学分野においては疾患の病気の再発や死亡などを対象とした研究分野である。このような故障、破壊、倒産、再発、死亡などのイベントの生起のことを広義で死亡と呼ぶことにする。
https://www1.doshisha.ac.jp/~mjin/R/36/36.html より引用
3/38
打ち切り
左図はhttps://www1.doshisha.ac.jp/~mjin/R/36/36.html より引用
データを集める時に、全機械が故障するまで待っていると非常に時間がかかる。
壊れる前に観測が終了した機械→打ち切り
·
·
4/38
生存時間解析の登場人物たち
両者の関係
生存関数: 故障するまでの時間が を超える確率
ハザード関数: 時点まで生存したなかで、次の時点に死亡する、瞬間死亡率
を表している
· t
- S(t) = Pr(T > t) = f(t)dt∫ ∞t
· t
- h(t) = limΔt→0+Pr(t≤T<t+Δt|T≥t)
Δt
· S(t) = exp{− h(u)du}∫ ∞0
·h(t) = − (t)S
′
S(t) 5/38
寿命分布に利用されるワイブル分布
http://excelshogikan.com/qc/qc03/weibulldist.html より引用
·f(t) = exp{− }m
η( )t
η
m−1 ( )tη
m
6/38
なぜワイブル分布が便利?
形状パラメータ によって、問題解決の方法が異なる
紹介する論文のケースでは が1.3ぐらい
m
: 初期故障, 製造段階における問題
: 偶発故障, 指数分布と同じになる
: 摩耗故障, 疲労の蓄積による故障
· m < 1製造過程の見直しで故障を減らせる-
· m = 1故障予測する意味なし-
· m > 1故障予測する意味がある
素材や機械的な構造によって が変わる
-
- m
m 7/38
打ち切りを含む場合の尤度関数
について
· L = f(∏ni=1 ti)δi [1 − F( )]ti
1−δi
·L = ∏n
i=1 { exp{− }}mη
( )tη
m−1 ( )tη
m δi
⋅ {exp[− ]}( )tη
m 1−δ
δ
なら故障
なら打ち切り
· δ = 1· δ = 0
8/38
寿命分布における時間の考え方
寿命分布を考える際には、大きく2種類の時間の考え方がある
複数の累積使用量を考慮したものを時間と考えることもある
·
現実時間で何日間動いていたか
累積値でどれぐらい使用されたか
-
-
例: 車の場合(10km, 20km, 30km,…)
この累積値を対数変換した値を時間とする場合もある
-
-
·
例: - log( (t)) + log( (t))β1 x1 β2 x2
9/38
A Multi-level Trend-RenewalProcess for Modeling Systemswith Recurrence Data
やりたいこと
市場での故障よる交換eventを予測したい
サブシステムとコンポーネントの再発事象をモデリングする
·
·
11/38
概要
システム(機械)は、複数のサブシステムを持っていて、サブシステムは複数のコンポーネントで構成されている
修理可能なシステムは、長期に渡って様々なeventが起きる
·
システム: トラック
サブシステム: トラックのエンジン
コンポーネント: オイルポンプ
-
-
-
·
車なら、オイルポンプを修理したり、交換したり
複合機なら、紙詰まりをしたり、トナー切れをしたり、定着装置が壊れたり
-
-
12/38
概要
サブシステムとコンポーネントの修理eventについて考える
サブシステムは交換によって修理すると考える(subsystem event)
コンポーネントは交換によって修理すると考える(component envet)
·
·
·
13/38
データの外観
14/38
2 Repairable System Models
2.1 Existing Models
event intensity for the counting process
は の期間に起きるeventの数
は時点 までのevent history
cumulative event intensity function
· λ(t| ) =Ft− limΔt→0Pr{N(t)+Δt)−N(t)=1| }Ft−
Δt
· N(t) (0, t]· Ft− t
·
- Λ(t) = λ(u| )∫ t
0 Ft−1
16/38
2.1 Existing Models
RP(renewal process)
と表す
完全な修理を示す.(ユニット毎の交換など)
event time間の差は互いに独立で同一の分布に従う
はハザード関数
· RF(F)·
·
累積分布関数は- F
- − FTi+1 Ti ∼iid
· h(z)
は時点t以前の最後のevent time
- λ(t| ) = h[t − ]Ft− TN( )t−
- TN( )t− 17/38
2.1 Existing Models
NHPP(non homogeneous Poisson process, 非定常ポアソン過程)最小限の修理(大きなユニットにおける小さな部品の調整や交換)
intensity function
は定常ポアソン過程(HPP)で平均は1
·
· λ(t| ) = λ(t)Ft−
event historyに依らない-
· Λ( )Ti
· Λ( ) − Λ( ) exp(1)Ti+1 Ti ∼iid
18/38
2.1 Existing Models
TRP(trend newal process)TRPにNHPPとRPが含まれる·
· Λ( ) − Λ( ) FTi+1 Ti ∼iid
transformed event timeのgapはRP(F)にiid-
· λ(t| ) = h {Λ(t) − Λ[ ]} λ(t)Ft− TN( )t−
はtrend function- λ(t)
19/38
2.2 Notation for Data
観測期間 ,
は時点 までの交換イベント回数の累計
· (0, ]τi i = 1, . . .n· (t) = (t) + (t)Ni Nis Nic t
: 時点 までのsubsystem eventの回数
: 時点 までのcomponent eventの回数
- (t)Nis t
subsystemのevent time-
- 0 < <. . . < <tsi1 ts
i, ( )Nis τiτi
- (t)Nic t
- 0 < <. . . < <tsi1 ts
i, ( )Nic τiτi
20/38
2.2 Notation for Data
は時間依存共変量(time-dependent covariate, 例:累積使用量)
共変量過程 は時点 に記録されている
時点 までのreplace envet history
時点 までのsubsystem eventのhistory
· (t)Xi
· (t)Xi tik
, は観測時点の数- k = 1, . . . ,mi mi
· t
- = { (u), (u), (u) : 0 < u ≤ t}Ft Nic Nis Xi
· t
- = { (u), (u) : 0 < u ≤ t}F st Nis Xi
21/38
2.3 The Proposed Multi-level Trend-renewalProcess
2段階の修復可能なシステム について、 subsystemとcomponentのeventに対するintensity functionを次のようにモデリングする
i
Subsystem level
Component level
·
- (t| ; ) = { (t) − [ ] ; } (t; )λs∗i Ft− θs hs∗ Λ∗
i Λ∗i ts
i,Nis(t−)θs λ∗
i θs
·
- (t| ; ) = { (t| ) − [ | ] ; }λci Ft− θs hc Λs
i Ft− Λsi ti,Ni(t−) Ft−i,Ni(t−)
θc λsi
22/38
(1)について
subsystem level eventsのモデル
TRPモデル
, random effectはなし
パラメータ
はsubsystem replacement eventのモデルに使われる関数を表す
: subsystem-event processのrenewal distribution
はハザード関数
·
·
· TRP( , )F s∗ λ∗i
· θs
· ∗· F s∗
· (hs∗ )̇
23/38
(1)について
· (t) = (u; )duΛ∗i ∫ t
0 λ∗i θs
はbaseline intensity function
はtransformed functionの係数
とする
- (u; ) = exp{κg [ (t)]}λ∗i θs λ∗
b Xi
- λ∗b
- κ
- g[ (t)] = log[ (t)]Xi Xi
24/38
(2)について
MTRPモデル(TRPモデルの拡張), · MTRP( , , )F c F s λi
· (t| ; ) = { (t) − [ ]} (t; )λsi F s
t− θc hs Λi Λi tsi,Nis( )t−
λi θc
は次元 の未知パラメータ- θc p
25/38
(2)について
はcomponent eventsのintensityに影響をうけるsubsysytemeventsの効果
はcomponent intensify functionにおける共変量と未知の要員
の効果
· (hs )̇
· (t; )λi θc
26/38
(2)について
component eventsに対するintensity functionをシミュレーションで描いたもの
27/38
(2)について
random effectを入れると
· (t; ) = (t) exp{γ log[ (t)]}λi θc λb Xi
はreplace eventsが起きていない時のベースラインのintensitytrend function
- (t)λb
·
- (t; ) = (t) exp{γ log[ (t)] + }λi θc λb Xi wi
28/38
補足:
ノンパラメトリックな寿命分布が使われることもある
この論文の中では、ワイブル分布を仮定している。
(t)λb
カプラン・マイアー法
累積ハザード法
·
·
29/38
補足: カプラン・マイアー法
「21世紀の統計科学」 より引用
信頼度関数R(t) = 1 − F(t) 30/38
補足: 累積ハザード法
「21世紀の統計科学」 より引用
31/38
3 Parameter Estimation
3.1 The Likelihood Function
MCMCで推定
33/38
3.2 Estimation Procedure
Metropolis-within-Gibbs algorithm で推定する
MTRPモデルのfull joint distributionは
MTRPモデルにランダム効果を入れたものをHMTRPとして、推定方法の議論をする。
P( ,w, v|F) ∝ L( |F ,w)P(w|v)P(v)θc θc
はrandom effect,
は平均0, 分散共分散行列 _rの多変量正規分布
· v v ∼ Gamma( , )α1 α2
· w ∼ N(0, = I/v)∑r
· P(w|v) ∑
34/38
3.2 Estimation Procedure
参考A Compendium of Conjugate Priors http://www.leg.ufpr.br/lib/exe/fetch.php/projetos:mci:tabelasprioris.pdf 2.9.2のUnknown PrecisionParameter
はrandom effects の時のシステム の条件付き尤度
· | , v ∝ ( | , ) exp(− )wi θc Li θc Fτiwi v1/2
vw2i
2
· v|w, ∝ Gamma( + , + )θc n2 a1
ww′
2 a2
· |w, v ∝ L( |F ,w)θc θc
· v = 1/σ2r
· ( | , )Li θc Fτiwi wi i
35/38
3.2 Estimation Procedure
36/38
3.2 Estimation Procedure
37/38
まとめ
発表時間の都合で、後半を省略します。
TRP, RP, NHPPモデルを含む一般的な再発プロセスのモデルとして、MTPRモデル及びHMTPRを提案した。
A Metropolis-within-Gibbs algorithmでパラメータの推定をした
·
·
38/38