論文輪読会 - a multi-level trend-renewal process for modeling systems with recurrence data

論文輪読会A Multi-level Trend-Renewal Process for Modeling Systems

with Recurrence Data

早川　敦士

生存時間解析の基礎的な話

生存時間分析

生存時間分析(survival analysis)は、イベント(event)が起きるまでの時間とイベントとの間の関係に焦点を当てる分析方法である。生存時間分析は、工学分野においては機械システムや製品の故障などを、医学分野においては疾患の病気の再発や死亡などを対象とした研究分野である。このような故障、破壊、倒産、再発、死亡などのイベントの生起のことを広義で死亡と呼ぶことにする。

https://www1.doshisha.ac.jp/~mjin/R/36/36.html より引用

3/38

打ち切り

左図はhttps://www1.doshisha.ac.jp/~mjin/R/36/36.html より引用

データを集める時に、全機械が故障するまで待っていると非常に時間がかかる。

壊れる前に観測が終了した機械→打ち切り

·

·

4/38

生存時間解析の登場人物たち

両者の関係

生存関数: 故障するまでの時間がを超える確率

ハザード関数: 時点まで生存したなかで、次の時点に死亡する、瞬間死亡率

を表している

· t

- S(t) = Pr(T > t) = f(t)dt∫ ∞t

· t

- h(t) = limΔt→0+Pr(t≤T<t+Δt|T≥t)

Δt

· S(t) = exp{− h(u)du}∫ ∞0

·h(t) = − (t)S

′

S(t) 5/38

寿命分布に利用されるワイブル分布

http://excelshogikan.com/qc/qc03/weibulldist.html より引用

·f(t) = exp{− }m

η( )t

η

m−1 ( )tη

m

6/38

なぜワイブル分布が便利？

形状パラメータによって、問題解決の方法が異なる

紹介する論文のケースではが1.3ぐらい

m

: 初期故障, 製造段階における問題

: 偶発故障, 指数分布と同じになる

: 摩耗故障, 疲労の蓄積による故障

· m < 1製造過程の見直しで故障を減らせる-

· m = 1故障予測する意味なし-

· m > 1故障予測する意味がある

素材や機械的な構造によってが変わる

-

- m

m 7/38

打ち切りを含む場合の尤度関数

について

· L = f(∏ni=1 ti)δi [1 − F( )]ti

1−δi

·L = ∏n

i=1 { exp{− }}mη

( )tη

m−1 ( )tη

m δi

⋅ {exp[− ]}( )tη

m 1−δ

δ

なら故障

なら打ち切り

· δ = 1· δ = 0

8/38

寿命分布における時間の考え方

寿命分布を考える際には、大きく2種類の時間の考え方がある

複数の累積使用量を考慮したものを時間と考えることもある

·

現実時間で何日間動いていたか

累積値でどれぐらい使用されたか

-

-

例: 車の場合(10km, 20km, 30km,…)

この累積値を対数変換した値を時間とする場合もある

-

-

·

例: - log( (t)) + log( (t))β1 x1 β2 x2

9/38

A Multi-level Trend-RenewalProcess for Modeling Systemswith Recurrence Data

やりたいこと

市場での故障よる交換eventを予測したい

サブシステムとコンポーネントの再発事象をモデリングする

·

·

11/38

概要

システム(機械)は、複数のサブシステムを持っていて、サブシステムは複数のコンポーネントで構成されている

修理可能なシステムは、長期に渡って様々なeventが起きる

·

システム: トラック

サブシステム: トラックのエンジン

コンポーネント: オイルポンプ

-

-

-

·

車なら、オイルポンプを修理したり、交換したり

複合機なら、紙詰まりをしたり、トナー切れをしたり、定着装置が壊れたり

-

-

12/38

概要

サブシステムとコンポーネントの修理eventについて考える

サブシステムは交換によって修理すると考える(subsystem event)

コンポーネントは交換によって修理すると考える(component envet)

·

·

·

13/38

データの外観

14/38

2 Repairable System Models

2.1 Existing Models

event intensity for the counting process

はの期間に起きるeventの数

は時点までのevent history

cumulative event intensity function

· λ(t| ) =Ft− limΔt→0Pr{N(t)+Δt)−N(t)=1| }Ft−

Δt

· N(t) (0, t]· Ft− t

·

- Λ(t) = λ(u| )∫ t

0 Ft−1

16/38

2.1 Existing Models

RP(renewal process)

と表す

完全な修理を示す.(ユニット毎の交換など)

event time間の差は互いに独立で同一の分布に従う

はハザード関数

· RF(F)·

·

累積分布関数は- F

- − FTi+1 Ti ∼iid

· h(z)

は時点t以前の最後のevent time

- λ(t| ) = h[t − ]Ft− TN( )t−

- TN( )t− 17/38

2.1 Existing Models

NHPP(non homogeneous Poisson process, 非定常ポアソン過程)最小限の修理(大きなユニットにおける小さな部品の調整や交換)

intensity function

は定常ポアソン過程(HPP)で平均は1

·

· λ(t| ) = λ(t)Ft−

event historyに依らない-

· Λ( )Ti

· Λ( ) − Λ( ) exp(1)Ti+1 Ti ∼iid

18/38

2.1 Existing Models

TRP(trend newal process)TRPにNHPPとRPが含まれる·

· Λ( ) − Λ( ) FTi+1 Ti ∼iid

transformed event timeのgapはRP(F)にiid-

· λ(t| ) = h {Λ(t) − Λ[ ]} λ(t)Ft− TN( )t−

はtrend function- λ(t)

19/38

2.2 Notation for Data

観測期間 ,

は時点までの交換イベント回数の累計

· (0, ]τi i = 1, . . .n· (t) = (t) + (t)Ni Nis Nic t

: 時点までのsubsystem eventの回数

: 時点までのcomponent eventの回数

- (t)Nis t

subsystemのevent time-

- 0 < <. . . < <tsi1 ts

i, ( )Nis τiτi

- (t)Nic t

- 0 < <. . . < <tsi1 ts

i, ( )Nic τiτi

20/38

2.2 Notation for Data

は時間依存共変量(time-dependent covariate, 例：累積使用量)

共変量過程は時点に記録されている

時点までのreplace envet history

時点までのsubsystem eventのhistory

· (t)Xi

· (t)Xi tik

, は観測時点の数- k = 1, . . . ,mi mi

· t

- = { (u), (u), (u) : 0 < u ≤ t}Ft Nic Nis Xi

· t

- = { (u), (u) : 0 < u ≤ t}F st Nis Xi

21/38

2.3 The Proposed Multi-level Trend-renewalProcess

2段階の修復可能なシステムについて、 subsystemとcomponentのeventに対するintensity functionを次のようにモデリングする

i

Subsystem level

Component level

·

- (t| ; ) = { (t) − [ ] ; } (t; )λs∗i Ft− θs hs∗ Λ∗

i Λ∗i ts

i,Nis(t−)θs λ∗

i θs

·

- (t| ; ) = { (t| ) − [ | ] ; }λci Ft− θs hc Λs

i Ft− Λsi ti,Ni(t−) Ft−i,Ni(t−)

θc λsi

22/38

(1)について

subsystem level eventsのモデル

TRPモデル

, random effectはなし

パラメータ

はsubsystem replacement eventのモデルに使われる関数を表す

: subsystem-event processのrenewal distribution

はハザード関数

·

·

· TRP( , )F s∗ λ∗i

· θs

· ∗· F s∗

· (hs∗ )̇

23/38

(1)について

· (t) = (u; )duΛ∗i ∫ t

0 λ∗i θs

はbaseline intensity function

はtransformed functionの係数

とする

- (u; ) = exp{κg [ (t)]}λ∗i θs λ∗

b Xi

- λ∗b

- κ

- g[ (t)] = log[ (t)]Xi Xi

24/38

(2)について

MTRPモデル(TRPモデルの拡張), · MTRP( , , )F c F s λi

· (t| ; ) = { (t) − [ ]} (t; )λsi F s

t− θc hs Λi Λi tsi,Nis( )t−

λi θc

は次元の未知パラメータ- θc p

25/38

(2)について

はcomponent eventsのintensityに影響をうけるsubsysytemeventsの効果

はcomponent intensify functionにおける共変量と未知の要員

の効果

· (hs )̇

· (t; )λi θc

26/38

(2)について

component eventsに対するintensity functionをシミュレーションで描いたもの

27/38

(2)について

random effectを入れると

· (t; ) = (t) exp{γ log[ (t)]}λi θc λb Xi

はreplace eventsが起きていない時のベースラインのintensitytrend function

- (t)λb

·

- (t; ) = (t) exp{γ log[ (t)] + }λi θc λb Xi wi

28/38

補足:

ノンパラメトリックな寿命分布が使われることもある

この論文の中では、ワイブル分布を仮定している。

(t)λb

カプラン・マイアー法

累積ハザード法

·

·

29/38

補足: カプラン・マイアー法

「21世紀の統計科学」より引用

信頼度関数R(t) = 1 − F(t) 30/38

補足: 累積ハザード法

「21世紀の統計科学」より引用

31/38

3 Parameter Estimation

3.1 The Likelihood Function

MCMCで推定

33/38

3.2 Estimation Procedure

Metropolis-within-Gibbs algorithm で推定する

MTRPモデルのfull joint distributionは

MTRPモデルにランダム効果を入れたものをHMTRPとして、推定方法の議論をする。

P( ,w, v|F) ∝ L( |F ,w)P(w|v)P(v)θc θc

はrandom effect,

は平均0, 分散共分散行列 _rの多変量正規分布

· v v ∼ Gamma( , )α1 α2

· w ∼ N(0, = I/v)∑r

· P(w|v) ∑

34/38


参考A Compendium of Conjugate Priors http://www.leg.ufpr.br/lib/exe/fetch.php/projetos:mci:tabelasprioris.pdf 2.9.2のUnknown PrecisionParameter

はrandom effects の時のシステムの条件付き尤度

· | , v ∝ ( | , ) exp(− )wi θc Li θc Fτiwi v1/2

vw2i

2

· v|w, ∝ Gamma( + , + )θc n2 a1

ww′

2 a2

· |w, v ∝ L( |F ,w)θc θc

· v = 1/σ2r

· ( | , )Li θc Fτiwi wi i

35/38


36/38


37/38

まとめ

発表時間の都合で、後半を省略します。

TRP, RP, NHPPモデルを含む一般的な再発プロセスのモデルとして、MTPRモデル及びHMTPRを提案した。

A Metropolis-within-Gibbs algorithmでパラメータの推定をした

·

·

38/38

論文輪読会 - a multi-level trend-renewal process for modeling systems with recurrence data

Technology