yamauchi b

Post on 11-Jul-2015

144 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

TRANSCRIPT

仮想ロボットにおける身体拡張に関する研究

Effects of Body Extension in Virtual Robots

北海道大学 工学部 情報工学コース

複雑系工学講座 調和系工学研究室 学部4年

山内翔

研究背景 ロボットにおける身体拡張

• ロボットにおいて身体拡張がどのような効果をもたらすか、

多くの研究がなされている

西出俊, 中川達裕, 尾形哲也, 谷淳, 高橋徹, 奥乃博, "二次リカレントニューラルネットワークを用いた 道具身体化モデルの構築", 日本ロボット学会第27 回学術講演会, 2009.

Mai Hikita, Sawa Fuke, Masaki Ogino and Minoru Asada,"Cross-modal body representation based on visual attention by saliency",Proc.IROS,pp.2041-2046,2008.

Cota Nabeshima, Yasuo Kuniyoshi and Max Lungarella, "Towards a Model for Tool- Body Assimilation and Adaptive Tool-Use", Proc.ICDL, pp288-293, 2007.

Rolf Pfeifer, Fumiya Iida, Gabriel Gomez,“Morphological computation for adaptive behavior and cognition”, International Congress Series 1291, 2006.

研究目的 ロボットにおける身体拡張と行動ルールの関係

• ロボットにおいて身体拡張はどのような効果をもたらすか – ロボット相撲をテーマに身体拡張の効果を調べる

車両ロボット

車両ロボット の

押し相撲ゲームを採用

多様な対戦相手の設定が可能

接触(身体構造)が影響

単純な移動のみに基づく戦略

全探索可能なパターン数

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

シミュレーション実験 シミュレーションを支える物理演算エンジン

・シミュレーション空間 ―物理法則が成立する空間を再現

物理演算エンジンの 導入

様々な物理演算エンジン Bullet Physics Library

―オープンソースであり、移植性も高い ―商用製品への利用実績多数 ―活発なコミュニティによる 迅速なアップデート

シミュレーション実験 実験で用いる車両ロボット

・車両ロボット ーDifferential Drive ー剛体の接続が可能

4 4

10

5

2.7

2.7

VL

VR

VL =VR

VL >VR

VL <VR

直進

VR = -VL,VR > 0

右折

左折

反時計回りの回転

Differential Drive

左右の車輪の速度差でコントロール

シミュレーション上での表示

シミュレーション実験 車両ロボットと剛体の接続

ブルドーザー

三角柱

2

20

2

2

30°

30°

10

10

10

0.1

10 5 5

5

6

8

8

剛体の接続

Body Ext.

Body :Ext. = 10 :3

重量比

ロボットの身体構造を変化させる

剛体の接続

表面積:168

表面積:300

表面積:164

シミュレーション実験 ロボットの行動ルール

4種の動作

回転

中央へ 停止

VL

VR

q

VL =VR

VL <VR

VL >VR

ì

íï

îïï

VL =VR

VL <VR

VL >VR

ì

íï

îïï

VR = -VL,VR > 0

VL =VR = 0

j

中央

p

16<q £ p

æ

èç

ö

ø÷

-p

16£q £

p

16

æ

èç

ö

ø÷

-p <q < -p

16

æ

èç

ö

ø÷

-p

16£j £

p

16

æ

èç

ö

ø÷

-p <j < -p

16

æ

èç

ö

ø÷

p

16<j £ p

æ

èç

ö

ø÷

相手の距離を3段階で評価

距離毎 の

動作を決定

ロボットの 行動ルール

(1)相手の方向(θ)及び相手の中央からの距離を3段階( ) (2)自分から見た中央の方向(φ)

攻撃

センサ

1R 2R 3R

321 ,, RRR

シミュレーション実験 ロボットの行動ルール例

1R

2R

3R 中央へ

攻撃 攻撃 回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

シミュレーション実験 ロボットの行動ルール例

1R

2R

3R 中央へ

攻撃 攻撃 回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

相手の 拡張部と

シミュレーション実験 ロボットの行動ルール例

1R

2R

3R 中央へ

攻撃 攻撃 回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

相手の 中央からの距離に応じて

行動が決まる

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

3段階の距離に応じた動作

4種類の拡張状態

34

25644

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

各組み合わせ毎の 勝率を分析する

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

こちら側の行動ルールは 固定

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

こちら側の行動ルールは 固定

この実験により どの拡張部が性能を上げるか議論する

シミュレーション実験 GAによる行動ルールの探索

個体数 50 世代数 200 ルーレット方式

2点交叉

相手として ランダムに拡張部・行動ルールが

決まる相手50体

トータル勝利数が適応度

GAの設定

拡張部ごとに 最も良い個体を

選ぶ

より良い行動ルールを探索

ランダムな50体

それぞれの 拡張部の 相手と競う

遺伝子型 近 中 遠 相手が中央からどの程度の

距離にいるか

という情報をもとにしたルールテーブルを表す

シミュレーション実験 GAによる行動ルールの探索

個体数 50 世代数 200 ルーレット方式

2点交叉

相手として ランダムに拡張部・行動ルールが

決まる相手50体

トータル勝利数が適応度

GAの設定

拡張部ごとに 最も良い個体を

選ぶ

より良い行動ルールを探索

ランダムな50体

それぞれの 拡張部の 相手と競う

遺伝子型 近 中 遠 相手が中央からどの程度の

距離にいるか

という情報をもとにしたルールテーブルを表す

以降これらをGAロボットと呼ぶ

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

これら二つの観点から勝敗の結果を考察する

シミュレーション実験 勝敗の結果

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

G A

ロボッ ト

すべての行動ルールパターン

勝率

シミュレーション実験 勝敗の結果

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

GAロボット側を 主軸に結果を考察

G A

ロボッ ト

シミュレーション実験 GAロボット側から見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

トータル 勝率

0.57421875

0.6328125

0.71484375

0.83984375

G A

ロボッ ト

シミュレーション実験 GAロボット側から見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

トータル 勝率

0.57421875

0.6328125

0.71484375

0.83984375

勝率の順序 > > >

G A

ロボッ ト

シミュレーション実験 GAロボット側からから見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

トータル 勝率

0.57421875

0.6328125

0.71484375

0.83984375

強さの順序 > > >

何も拡張されていない ロボットが最も勝率が高い、という

結果

G A

ロボッ ト

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

シミュレーション実験 GAロボット側からから見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

勝率を反転

G A

ロボッ ト

シミュレーション実験 すべての行動ルールパターン側から見た勝率

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

G A

ロボッ ト

シミュレーション実験 すべての行動ルールパターン側から見た勝率

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン すべての行動ルールパター

ン側を 主軸に結果を考察

G A

ロボッ ト

シミュレーション実験 すべての行動ルールパターン側から見た勝率

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

トータル 勝率

0.11328125 0.47265625 0.3828125 0.26953125

G A

ロボッ ト

シミュレーション実験 身体拡張と行動・行動ルールの関係

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

トータル 勝率

0.11328125 0.47265625 0.3828125 0.26953125

勝率の順序 > > >

G A

ロボッ ト

シミュレーション実験 身体拡張と行動・行動ルールの関係

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

トータル 勝率

0.11328125 0.47265625 0.3828125 0.26953125

勝率の順序 > > >

GAロボット側とは異なる結果

この見方は何を意味するか?

勝率を高める働きをする 拡張部が変化

G A

ロボッ ト

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

勝率の順序 > > >

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての

行動ルールパターン

今何を表すか

勝率の順序 > > >

なぜこの差が生まれるか?

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての

行動ルールパターン

今何を表すか

勝率の順序 > > >

なぜこの差が生まれるか?

軌道の分析

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての

行動ルールパターン

今何を表すか

勝率の順序 > > >

なぜこの差が生まれるか?

軌道の分析

接触時間の分析

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン

・移動の軌跡による分類

移動の軌跡を取得

クラスター1

クラスター2

クラスター3

クラスター4

K-means法により

4つのクラスターに分類

取りうる全パターンの 相手に対して取得

GAロボットの軌道

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン

・移動の軌跡による分類

移動の軌跡を取得

クラスター1

クラスター2

クラスター3

クラスター4

K-means法により

4つのクラスターに分類

取りうる全パターンの 相手に対して取得

ゲーム開始から終了までの

X座標とZ座標

GAロボットの軌道

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン

・移動の軌跡による分類

移動の軌跡を取得

クラスター1

クラスター2

クラスター3

クラスター4

K-means法により

4つのクラスターに分類

取りうる全パターンの 相手に対して取得

ゲーム開始から終了までの

X座標とZ座標

相手(GAロボット側)に ゲーム中どのような軌道を取らせたか、という データにどのような特徴が現れるか?

GAロボットの軌道

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

各クラスターに 満遍なく存在

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

各クラスターに 満遍なく存在

相手に様々な動きをさせている

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

分類されるクラスターに 偏りがある

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

分類されるクラスターに 偏りがある

相手に動きのパターンが 似通っている

拡張部別の身体利用の比較 拡張部別の身体利用

・部位別に相手との接触を計測

接触時間を計測

拡張部への接触

ボディへの接触 2パターンに分類

拡張部ごとに接触時間にどのような差異が現れるか? 拡張部がない場合との差は?

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部接触の時間は 表面積に比例しない

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部接触の時間は 表面積に比例しない

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部なしの場合との差から表面積あたりの増加率を求める

拡張部接触の時間は 表面積に比例しない

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部なしの場合との差から単位表面積あたりの増加率を求

める

ブルドーザー 三角柱 棒

単位表面積あたりの 増加率

+14.435% -6.217% -69.6337%

拡張部接触の時間は 表面積に比例しない

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部なしの場合との差から表面積あたりの増加率を求める

ブルドーザー 三角柱 棒

単位表面積あたりの 増加率

+14.435% -6.217% -69.6337%

拡張部接触の時間は 表面積に比例しない

増加率の大小関係が 拡張部なしを除いた 強さの順序に 一致する

まとめ

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

まとめ

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

> > >

強さの順序 > > >

強さの順序

まとめ

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

> > >

強さの順序 > > >

強さの順序

・拡張部には特定の行動ルールの勝率を向上させる働きをするものと 行動ルールに依らず平均的に勝率を向上させるものがあることを示した ・相手に様々な動きをさせる、身体を効率的に利用する、といった 要素によりこれらの性質が生まれていることを示した

top related