o8 トピックモデルを用いた益城町仮設住宅聞き取り調査の自由...

1
トピックモデルを用いた益城町仮設住宅聞き取り調査の自由回答の基礎分析 熊本大学大学院 ○川野 倫輝 佐藤 嘉洋 円山 琢也 課題 一部の変量・単語を抽出して分析 単語の関係性を表すものが多い 網羅性・俯瞰性に欠ける 分析アプローチ 0 1つの文書が複数トピックから構成されると仮定 トピックの分布を用いた分析が可能 0 大量の文書集合から話題となっているトピックを 抽出する文書データの解析手法 背景・目的 課題と今後の展望 トピックモデルを用いた基礎分析 ① トピックの抽出結果 “自宅の解体”や”行政の対応”に関して 話をする時間が長い トピックあたりの対話時間の平均値 Topic 1:避難所期における生活 Topic 2:仮設内のバリアフリー環境 Topic 3:仮設の交通環境 Topic 4:家族の様子 Topic 5:行政の対応 第56回土木計画学研究発表会・秋大会 2017.11.03 @岩手大学 ② トピックあたりの対話時間の分析 まとめ ~30歳代、40歳代、50歳代 形態素解析 概要 益城町内の仮設住宅を対象とした訪問 聞き取り調査 目的 ‐住民が希望する災害公営住宅の戸数の把握 ‐不自由な点,不安の把握 実施期間 2016年6月30日~11月20日 調査実施戸数 1,196戸(81.4%) 益城町仮設聞き取り調査 自由回答 トピック抽出 LDAのグラフィカルモデル D:文書数 N:単語数 K:トピック数 w d,i :文書d i 番目の単語 z d,i w d,i に対応する潜在変数 θ d :文書d のトピック分布 ϕ d,v :トピックk における単語v の出現確率 α:ハイパーパラメータ β:ハイパーパラメータ Topic 6:仮設での騒音やプライバシー Topic 7:情報の提供・獲得手段 Topic 8:仮設後の住まい Topic 9:災害に強いまちづくり Topic 10:仮設外の要望 Topic 11:自宅の解体 Topic 12:今後の見通し Topic 13:仮設の用地不足 Topic 14:仮設周辺の整備要望 Topic 15:コミュニティ Topic 1 Topic 2 Topic 3 Topic 4 Topic 5 Topic 6 Topic 7 Topic 8 Topic 9 Topic 10 Topic 11 Topic 12 Topic 13 Topic 14 Topic 15 知り合い 段差 バス 自宅 行政 情報 住宅 災害 ペット 建てる 狭い ほしい コミュニティ 体育館 手すり 買い物 暮らす 騒音 入る 益城 車線 益城町 早い 立つ 置く 近く 田んぼ いる トイレ 実家 時間 部屋 掲示板 復興 まちづくり 拡幅 土地 見通し 部屋 街灯 みんな 地震 風呂 移動 入居 分かる 気持ち 県道 高齢者 公費 冷蔵庫 荷物 暗い 集まる バス停 息子 かかる 落ちる 避難所 防災 強い 楽しみ 解体 住む 駐車 ポスト 相談 避難所 言う 便 全壊 ゴミ 瓦礫 不満 情報提供 それ 熊本市 置ける いう 把握 総合 持つ 不便 夫婦 業者 作る 状態 道路 地盤 急ぐ 仮設住宅 スペース ない 仕事 玄関 運転 小屋 お金 処理 良い 基準 自営 道路 やる 仮設住宅 コンビニ 飯野 仮設 タクシー 出る 負担 宮園 2年後 若者 戻る 生活 団地 活動 車中泊 高い 交通 半壊 主人 ドア 回覧板 ない 体制 整備 再建 問題 付き合い 自転車 教育 年齢層別のトピックあたりの対話時間 60歳代、70歳代、80歳代~ 崩壊型ギブスサンプリング サンプリング回数:1000回 α=1.0 β=1.0 トピック数:15 記入率:1,087戸分(90.9%) 名詞・動詞・形容動詞 総語数:21,511語 異なり語数:3,591語 特徴量:tf-idfトピックあたりの対話時間の時系列変化 50歳代 “仮設外での要望” ~30歳代 “仮設後の住まい” 80歳代~ “避難所期における生活”&”仮設の 交通環境” トピックモデルを用いて、益城町仮説聞き取り調査の 自由回答から15個のトピック抽出した トピックあたりの対話時間に着目した分析から、 80歳代~では避難所期における生活や仮設の交 通環境に関するトピックがよく話され、 時間の経過によって減少するものに情報提供・獲得手 段とコミュニティに関するトピックがあることがわかった 他調査データとの比較による、より長期のトピック推移 の把握 自由回答分手法としてのトピックモデルの精度の検証 結論 Topic 1~Topic 5 Topic 6~Topic 10 Topic 11~Topic 15 減少傾向 “情報の提供・獲得手段”&”コミュニティ” 0 0.2 0.4 0.6 0.8 1 1.2 1.4 Topic 1 Topic 2 Topic 3 Topic 4 Topic 5 Topic 6 Topic 7 Topic 8 Topic 9 Topic 10 Topic 11 Topic 12 Topic 13 Topic 14 Topic 15 30歳代 (N=121) 40歳代 (N=81) 50歳代 (N=136) 0 0.5 1 1.5 2 2.5 3 Topic 1 Topic 2 Topic 3 Topic 4 Topic 5 Topic 6 Topic 7 Topic 8 Topic 9 Topic 10 Topic 11 Topic 12 Topic 13 Topic 14 Topic 15 60歳代 (N=306) 70歳代 (N=251) 80歳代~ (N=163) (分) 0 0.5 1 1.5 2 2.5 6,7891011Topic 1 Topic 2 Topic 3 Topic 4 Topic 5 0 0.5 1 1.5 2 6,7891011Topic 6 Topic 7 Topic 8 Topic 9 Topic 10 0 0.5 1 1.5 2 6,7891011Topic 11 Topic 12 Topic 13 Topic 14 Topic 15 0 1 2 3 4 5 6 Topic 1 Topic 2 Topic 3 Topic 4 Topic 5 Topic 6 Topic 7 Topic 8 Topic 9 Topic 10 Topic 11 Topic 12 Topic 13 Topic 14 Topic 15 トピック分布 トピック分布と対話時間から トピックあたりの 仮想的な対話時間を推定 トピックあた りの対話時間 トピックモデル(LDA)の概要 風呂 トイレ 周辺 ペット 暮らし 不満 物置 生活 プライバシー 建設 期間 一緒 スペース 収納 近所 以前 近所づきあい 玄関前 知る 周り 荷物 持つ 使う 困る 入れる 置ける 違う 移る 近く 欲しい 部屋 狭い 仮設住宅 良い 少ない 駐車場 遠い クーラー 暑い 短い 入居 感じる 少し もう少し にる 現在 でる まだ なる 悪い アリ 入る ない ない にくい -0.6 -0.4 -0.2 0.0 0.2 0.4 -0.4 -0.2 0.0 0.2 0.4 成分1 (0.0294, 37.35%) 成分2 (0.024, 30.51%) 子供 自分 復興 解体 ゴミ 復旧 早い 瓦礫 時間 暮らす 支援 近所 避難所 息子 対応 感じる 仮設団地 バス 再建 風呂 処理 益城 来る 建てる 災害 悪い 考える 暑い 団地 整備 知り合い コミュニティ 遅い 土地 買い物 住宅 道路 駐車場 高い 問題 ボランティア 付ける 作る 増やす 状況 必要 行う 玄関 心配 便 困る 多い 仕事 少ない バス停 益城町 不便 設置 移動販売 嬉しい 特に 仕方 地盤 通る カビ 思う 荷物 自宅 置く 情報 一人 病院 仮設住宅 世帯 出来る 調査 出る 役場 お金 高齢者 行ける 急ぐ 入れる 入居 テクノ 欲しい 近く 部屋 以前 102030歳代 4050歳代 6070歳代 8090歳代 女性 男性 対応分析 背景 背景 背景 背景 目的 (分) (分) (分) 従来のテキスト分析手法 (分) (分) (分) 共起ネットワーク トピックモデルを用いた自由回答文中の トピックの俯瞰的把握 各トピックあたりの対話時間に着目した分析 自宅の解体 行政の対応

Upload: others

Post on 13-Sep-2019

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: O8 トピックモデルを用いた益城町仮設住宅聞き取り調査の自由 …keikaku/archive/pdf/P48.pdf · トピックモデルを用いた益城町仮設住宅聞き取り調査の自由回答の基礎分析

トピックモデルを用いた益城町仮設住宅聞き取り調査の自由回答の基礎分析熊本大学大学院 ○川野 倫輝 佐藤 嘉洋 円山 琢也

課題⁃ 一部の変量・単語を抽出して分析⁃ 単語の関係性を表すものが多い

網羅性・俯瞰性に欠ける

▶ 分析アプローチ

0 1つの文書が複数トピックから構成されると仮定

トピックの分布を用いた分析が可能

0 大量の文書集合から話題となっているトピックを抽出する文書データの解析手法

▶ 背景・目的

課題と今後の展望

▶ トピックモデルを用いた基礎分析

① トピックの抽出結果

“自宅の解体”や”行政の対応”に関して話をする時間が長い

トピックあたりの対話時間の平均値

Topic 1:避難所期における生活Topic 2:仮設内のバリアフリー環境Topic 3:仮設の交通環境Topic 4:家族の様子Topic 5:行政の対応

第56回土木計画学研究発表会・秋大会2017.11.03 @岩手大学

② トピックあたりの対話時間の分析

▶ まとめ

▼~30歳代、40歳代、50歳代

形態素解析

概要 益城町内の仮設住宅を対象とした訪問聞き取り調査

目的‐住民が希望する災害公営住宅の戸数の把握‐不自由な点,不安の把握

実施期間 2016年6月30日~11月20日

調査実施戸数 1,196戸(81.4%)

益城町仮設聞き取り調査

自由回答

トピック抽出

▼LDAのグラフィカルモデル

D:文書数N:単語数K:トピック数wd,i:文書d のi番目の単語zd,i:wd,iに対応する潜在変数θd :文書d のトピック分布ϕd,v :トピックk における単語v

の出現確率α:ハイパーパラメータβ:ハイパーパラメータ

Topic 6:仮設での騒音やプライバシーTopic 7:情報の提供・獲得手段Topic 8:仮設後の住まいTopic 9:災害に強いまちづくりTopic 10:仮設外の要望

Topic 11:自宅の解体Topic 12:今後の見通しTopic 13:仮設の用地不足Topic 14:仮設周辺の整備要望Topic 15:コミュニティ

Topic 1 Topic 2 Topic 3 Topic 4 Topic 5 Topic 6 Topic 7 Topic 8 Topic 9 Topic 10 Topic 11 Topic 12 Topic 13 Topic 14 Topic 15

知り合い 段差 バス 自宅 行政 気 情報 住宅 災害 ペット 建てる 先 狭い ほしい コミュニティ

体育館 手すり 買い物 暮らす 何 騒音 入る 益城 車線 益城町 早い 立つ 置く 近く 田んぼいる トイレ 車 実家 時間 部屋 掲示板 復興 まちづくり 拡幅 土地 見通し 部屋 街灯 みんな地震 風呂 移動 入居 町 音 分かる 気持ち 県道 高齢者 公費 冷蔵庫 荷物 暗い 集まる娘 前 バス停 息子 かかる 落ちる 避難所 防災 強い 楽しみ 解体 住む 駐車 ポスト 相談避難所 言う 便 全壊 ゴミ 瓦礫 人 不満 情報提供 それ 家 熊本市 置ける いう 把握総合 持つ 不便 夫婦 業者 釘 作る 状態 道路 地盤 急ぐ 仮設住宅 スペース ない 誰仕事 玄関 運転 小屋 お金 処理 良い 基準 自営 道路 元 やる 仮設住宅 コンビニ 飯野仮設 冬 タクシー 出る 負担 宮園 町 2年後 町 若者 戻る 声 生活 団地 活動車中泊 高い 交通 半壊 主人 ドア 回覧板 ない 体制 整備 再建 問題 付き合い 自転車 教育

年齢層別のトピックあたりの対話時間

▼60歳代、70歳代、80歳代~

(%)

崩壊型ギブスサンプリングサンプリング回数:1000回

α=1.0 β=1.0トピック数:15

記入率:1,087戸分(90.9%)

名詞・動詞・形容動詞総語数:21,511語

異なり語数:3,591語特徴量:tf-idf値

トピックあたりの対話時間の時系列変化

50歳代 “仮設外での要望”

~30歳代 “仮設後の住まい”

80歳代~ “避難所期における生活”&”仮設の交通環境”

◆トピックモデルを用いて、益城町仮説聞き取り調査の自由回答から15個のトピック抽出した

◆トピックあたりの対話時間に着目した分析から、80歳代~では避難所期における生活や仮設の交通環境に関するトピックがよく話され、時間の経過によって減少するものに情報提供・獲得手段とコミュニティに関するトピックがあることがわかった

◆他調査データとの比較による、より長期のトピック推移の把握

◆自由回答分手法としてのトピックモデルの精度の検証

結論

▼Topic 1~Topic 5

▼Topic 6~Topic 10

▼Topic 11~Topic 15

(%)

減少傾向 “情報の提供・獲得手段”&”コミュニティ”

00.20.40.60.8

11.21.4

Topic 1

Topic 2

Topic 3

Topic 4

Topic 5

Topic 6

Topic 7

Topic 8Topic 9

Topic 10

Topic 11

Topic 12

Topic 13

Topic 14

Topic 15

~30歳代(N=121)

40歳代(N=81)

50歳代(N=136)

(%)

0

0.5

1

1.5

2

2.5

3Topic 1

Topic 2

Topic 3

Topic 4

Topic 5

Topic 6

Topic 7

Topic 8Topic 9

Topic 10

Topic 11

Topic 12

Topic 13

Topic 14

Topic 15

60歳代(N=306)

70歳代(N=251)

80歳代~(N=163)

(分)

(%)

0

0.5

1

1.5

2

2.5

6,7月 8月 9月 10月 11月

Topic 1 Topic 2 Topic 3 Topic 4 Topic 5

0

0.5

1

1.5

2

6,7月 8月 9月 10月 11月

Topic 6 Topic 7 Topic 8 Topic 9 Topic 10

0

0.5

1

1.5

2

6,7月 8月 9月 10月 11月

Topic 11 Topic 12 Topic 13 Topic 14 Topic 15

0 1 2 3 4 5 6

Topic 1

Topic 2

Topic 3

Topic 4

Topic 5

Topic 6

Topic 7

Topic 8

Topic 9

Topic 10

Topic 11

Topic 12

Topic 13

Topic 14

Topic 15

トピック分布

トピック分布と対話時間からトピックあたりの

仮想的な対話時間を推定トピックあたりの対話時間

▼トピックモデル(LDA)の概要

風呂

トイレ

周辺

ペット

暮らし

不満

物置

生活

プライバシー建設

期間

一緒

スペース収納

近所

以前

近所づきあい

玄関前

知る

周り

荷物

持つ

使う

困る入れる

置ける

違う

移る

近く

欲しい

部屋

狭い

仮設住宅

良い

少ない

駐車場

遠い

クーラー暑い

短い

入居

感じる

少し

もう少し

にる

現在

でる

まだ

なる

悪い

アリ

入る

ない

ない

にくい

-0.6 -0.4 -0.2 0.0 0.2 0.4

-0.4

-0.2

0.0

0.2

0.4

成分1 (0.0294, 37.35%)

成分

2 (0

.02

4, 3

0.5

1%

)

子供

自分

復興

解体

ゴミ内

復旧

早い

瓦礫

時間

暮らす

支援

近所

避難所

息子

対応

感じる

仮設団地

バス

再建

風呂

処理

益城

来る

建てる

災害

悪い

考える

暑い

団地

整備

知り合い

コミュニティ

遅い

土地

買い物

住宅

道路

駐車場

高い

問題

ボランティア

付ける

作る

増やす

状況

必要

行う

玄関心配

便

困る

多い

仕事 少ない

バス停

益城町

不便

設置

移動販売

嬉しい

特に仕方

地盤

通る

カビ

思う

荷物

自宅

置く

情報

一人病院

仮設住宅世帯

出来る 元

調査

出る役場

お金

高齢者

行ける

急ぐ

入れる

入居

テクノ欲しい

近く

部屋以前

10・20・30歳代 40・50歳代

60・70歳代

80・90歳代

女性

男性

対応分析

背景

背景背景

背景

目的

(分)

(分)

(分)

▼従来のテキスト分析手法

(分)

(分)

(分)

共起ネットワーク

トピックモデルを用いた自由回答文中のトピックの俯瞰的把握

各トピックあたりの対話時間に着目した分析自宅の解体

行政の対応