130425 discrete choiceseminar_no.2
TRANSCRIPT
交通行動分析と離散選択モデル ー 第 2 回 ー
環境システム工学科 塩見 康博
1
2013年 4月 25日(木)
• 個人の選択行動を「ランダム効用理論」により記述
• 誤差項にガンベル分布を適用すると,選択肢 iの選択確率は選択肢に対する確定効用 Viのみで表現できる
• 選択確率は,選択肢の確定効用の相対関係に依存する
2
前回の復習
iii VU ε+=
P1
=exp(V
1)
exp(V1)+ exp(V
2)
誤差項ランダム効用 各定項
Pi=exp(V
i)
exp(Vj)∑
選択肢 2つの場合
選択肢 3つ以上の場合
• 効用の確定項を説明変数の線形和にすることの意義について
• 最尤推定法によるパラメータの推定方法について
• データセットの整理方法について
• 演習課題の説明(データ収集編)
3
本日の目標
4
● 例として ...大学までクルマで来ますか?電車で来ますか?
044332,21,1 θθθθθ ++++= xxxxV CarCarCar
2,21,1 RailRailRail xxV θθ +=
費用所要時間
共通変数 荷物ダミー選択肢固有変数
50歳代以上ダミー個人属性
定数項S
SS
S S
S SS
Sさんにとってのクルマ・電車の効用
31歳の Yさん:大きい荷物を抱えて嵯峨嵐山〜 BKCまで
電車の場合 ⇒ 所要時間 70分,料金 470 円(定期 + バス代) クルマの場合 ⇒ 所要時間 60分,料金 550 円(高速 + ガソリン代)
VCarY = θ
1×60+θ
2×550+θ
3×1+θ
4×0+θ
0
VRailY = θ
1×70+θ
2×470
5
● 例として ...大学までクルマで来ますか?電車で来ますか?31歳の Yさん:大きい荷物を抱えて嵯峨嵐山〜 BKCまで
電車の場合 ⇒ 所要時間 70分,料金 470 円(定期 + バス代) クルマの場合 ⇒ 所要時間 60分,料金 550 円(高速 + ガソリン代)
VCarY = θ
1×60 +θ
2×550 +θ
3×1+θ
4×0+θ
0
VRailY = θ
1×70 +θ
2×470
• 一般的には,所要時間が大きいほど好ましくない( = 効用が低い)– 所要時間に関するパラメータθ 1 [効用 /分 ]が負の値をとればこの傾向が表現されているといえる.
• 一般的には,費用が高いほど好ましくない( = 効用が低い)– 費用に関するパラメータθ 2 [効用 /円 ]が負の値をとればこの傾向が表現されているといえる.
費用所要時間
時間価値 = θ1/θ2 [円 /分 ]
効用を同じに保ちながら, 1 分の短縮に対して追加で支払
う金額として定義される
所要時間と費用がパラメータθ 1とθ 2で調整される形で効用が表現されている
• 最尤推定法(Maximum Likelihood Estimation)を用いる• 最も尤もらしい状態を推定する方法
6
パラメータ推定の方法
電車
選択結果
車
車…
→ PrailA
→ PcarB
→ PrailB
→ PcarZZ
→ PrailZZ
→ PcarA
推計値(が決まれば数値が決まる)
…
ZZさん電車の場合: 20分, 300円
車の場合: 20分, 250円
Aさん 電車の場合: 35分, 250
円
車の場合: 30分, 200円
Bさん 電車の場合: 10分, 120
円
車の場合: 15分, 100円
… …
7
あるパラメータのもとで、観測された実績値の状態が起こる確率は ...
L* = PCarA ×PRail
B PCarZZ
これが最大になるように、パラメータを決める
これを「尤度」というゆうど
Aさんは車を選択,Bさんは電車を選択…ZZさんは車を選択
一般的にあらわすと ...
L* = P11δ11 ×P21
δ21( ) × P12δ12 ×P22
δ22( ) P1nδ1n ×P2n
δ2n( )= Pin
δin( )i
∏n
∏ max
δin:個人 nが選択肢 iを選んだ場合 1 ,それ以外 0
8
あるパラメータのもとで、観測された実績値の状態が起こる確率は ...
L* = PCarA ×PRail
B PCarZZ
これを「尤度」という
これが最大になるように、パラメータを決めればよい(θ = 0,すなわち選択確率 1/2との比較)
一般的にあらわすと ...
L* = P11δ11 ×P21
δ21( ) × P12δ12 ×P22
δ22( ) P1nδ1n ×P2n
δ2n( )= Pin
δin( )i
∏n
∏ max
ゆうど
Aさんは車を選択,Bさんは電車を選択…ZZさんは車を選択
δin:個人 nが選択肢 iを選んだ場合 1 ,それ以外 0
選ばれる選択肢の選択確率は高く,選ばれていない選択肢の選択確率は低くなるように θを決める,ということ
9
両辺の対数をとると ...
( ) ( ) ( ){ }( )
( ){ }∑∑∑∑
⋅=
=
⋅⋅⋅⋅=
=
n iinin
n iin
nn
P
P
PPPPPP
LL
in
nn
ln
ln
ln
*ln2122122111
2122122111
δ
δ
δδδδδδ
max(対数尤度の最大化)
これは、に関して凸であることがわかっている
→ 偏微分して 0 となる点として L を最大にするの値を 求めることができる
=
∂∂∂∂∂∂
0
0
0
0
2
1
θ
θ
θ
L
L
L
勾配ベクトル:
10
● ニュートン・ラプソン法(非線形最適化のためのアルゴリズム)
k
L
θ∂∂
kθ
kθ
L
初期値 解
・ EXCELではソルバーで実装可能
・離散選択モデルを推定するプログラム・パッケージも利用可
- LIMDEP/NLOGIT
- BIOGEME (無料! )
⇒ 次回の課題
11
● モデルの検定
① 個々の説明変数の検定 → パラメータ k は 0 ではないか? → t 検定(回帰分析の場合と同じ考え方. 5%有意水準)
② モデル全体の説明力 → 的中率(推計結果と実績値があっているか?) → 尤度比(モデルによって、どれだけ尤度の値が 向上したか? 0.3でぼちぼち)
LL(0) L(θ) 0
モデルなしと同じ状態(二項選択の場合, 1/2 )
推計結果 完全に推計できた状態
)0(
)ˆ(12
L
L θρ −=尤度比:
12
● モデルの検定
① 個々の説明変数の検定 → パラメータ k は 0 ではないか? → t 検定(回帰分析の場合と同じ考え方)
② モデル全体の説明力 → 的中率(推計結果と実績値があっているか?) → 尤度比(モデルによって、どれだけ尤度の値が 向上したか?)
LL(0) L(θ) 0
モデルなしと同じ状態(二項選択の場合, 1/2 )
推計結果 完全に推計できた状態
)0(
)ˆ(12
L
L θρ −=尤度比:
◯ モデルの妥当性 推定されたパラメータの符号を確認する!Ex) 時間や料金のパラメータが「正」になる場合は,モデルかデータにおかしい点がないか疑うこと!!
044332,21,1 θθθθθ ++++= xxxxV CarCarCar
2,21,1 RailRailRail xxV θθ +=料金所要時間
本日のまとめ
• 効用関数のパラメータ推定方法の考え方を解説 (= 最尤推定法)
• 良いモデル = 推定されたパラメータを適切に解釈できること
• パラメータの有意性の検定 ⇒ t検定• モデルの説明力
– 的中率– 尤度比(等しい確率で選択すると仮定した場合から,尤度がどれだけ増えたか)
13
次回までの課題
• 仮想的な「選択状況」を想定したアンケートを実施( SP調査) ⇔ RP調査(実際の状況での行動を調査)
• 設問(3)〜(5)の仮想的な選択状況を完成させる• 網がけ部分は適宜変更する• 各自 3人以上の方にアンケートに回答してもらう(回答者 1名につきアンケート票 1枚( 5問の選択問題)に回答してもらう)
• アンケートの結果をエクセルファイルに 整理する ⇒ ゼミ時に USBメモリに入れ
て持参すること ※ データ整理の方法を考えてみて下さい. 14