深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/b_fuchigami.pdf ·...

49
卒 業 論 文 深層学習によるホールスラスタの制御 淵上 太貴 所属教育分野 プラズマ理工学 山本 直嗣 准教授 森田太智 助教授 九州大学工学部エネルギー科学科 提出年月 平成28年2月

Upload: others

Post on 04-Jan-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

卒 業 論 文

題 目

深層学習によるホールスラスタの制御

氏 名 淵上 太貴

所属教育分野 プラズマ理工学

指 導 教 員 山本 直嗣 准教授

森田太智 助教授

九州大学工学部エネルギー科学科

提出年月 平成28年2月

Page 2: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

目次

第 1章 序論 ............................................................................................................................................. 1

1.1 研究背景 ........................................................................................................................................ 1

1.2 電気推進機 .................................................................................................................................... 1

1.3 本研究の目的 ................................................................................................................................ 3

第 2章 原理 ............................................................................................................................................. 4

2.1 ホールスラスタの原理 ................................................................................................................ 4

2.2 ホールスラスタの基本設計 ........................................................................................................ 6

2.3 ホールスラスタの制御 ................................................................................................................ 9

第 3章 ニューラルネットワークによる制御 ................................................................................... 10

3.1 ニューラルネットワークについて .......................................................................................... 10

3.2 ネットワークの形態 .................................................................................................................. 11

3.3 ユニットの出力 .......................................................................................................................... 12

3.4 活性化関数 .................................................................................................................................. 14

3.5 勾配法 .......................................................................................................................................... 15

3.6 誤差逆伝播法(バックプロパゲーション) .......................................................................... 16

3.7 誤差逆伝播法のアルゴリズム .................................................................................................. 17

第 4章 制御プログラム ....................................................................................................................... 22

4.1 LabVIEW ................................................................................................................................. 22

4.2 制御プログラム ........................................................................................................................ 22

第 5章 結果及び考察 ........................................................................................................................... 25

5.1 学習係数の決定 .......................................................................................................................... 25

5.2 ニューラルネットワークを用いたホールスラスタの制御 .................................................. 35

5.3 RAIJINの推力データを用いた結果 ........................................................................................ 41

Page 3: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

5.4 考察 ............................................................................................................................................. 44

第 6章 結論 .......................................................................................................................................... 45

参考文献 .................................................................................................................................................. 46

謝辞

Page 4: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴
Page 5: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

1

第1章 序論

1.1 研究背景

20世紀前半に人類が宇宙へ進出する構想が提言され、実現化を目指し宇宙開発が行わ

れるようになった。そしてロシア(旧ソ連)が世界初の人工衛星「スプートニク」の打

ち上げに成功して以来、アメリカとソ連の激しい宇宙開発競争が始まった(1)。当時冷戦

状態であったため、人工衛星や弾道ミサイルなど軍事的利用が目的であった。日本でも

1960年代に東京大学航空研究所(後の宇宙航空研究所)を中心にイオンエンジンの研究

が始まり、さまざまな型の電気推進ロケットが研究されるようになった(2)。70年代に入

ると国際協力の下で宇宙開発が行われるようになり多種多様な人工衛星が開発され打

ち上げられてきた。ロケットが実用化されて初めに行われたのは宇宙研究であるが、そ

の後衛星通信やリモートセンシングなどの宇宙ビジネスが現れた。当初は最小限の設備

を宇宙まで運ぶのがやっとであったが、現在では人工衛星の大型化が進められ、あるい

は小型機が頻繁に打ち上げられるようになった。またスペースシャトルや宇宙基地によ

り、有人長期ミッションが可能になっている。さらに最近では、国際協力のもとに宇宙

基地建設が進められるとともに、宇宙旅行や他天体の資源開発が話題に上がっている(3)。

これを可能にするためには推進機の寿命を長くする必要があり、そのために電気推進機

の制御が重要になってきている。

1.2 電気推進機

人工衛星の軌道制御や姿勢制御を行うために推進機が用いられている。推進機は大き

く分けて化学推進機と電気推進機とがある。電気推進機は、電気エネルギーによって推

進剤を電離させプラズマ化し加速させ、その反作用で推力を得る。電気推進機は化学推

進機と比較して得られる推力は小さいが、燃費を示す指標である比推力(Specific impulse:

Isp)は液体、固体等の化学推進機に比べて大きい(4)。すなわち、推力が小さいため電気推

進機は加速に時間がかかるが、消費する燃料は化学推進機と比較し非常に少なくて済む。

宇宙機の総重量のうち推進剤の占める割合を削減しペイロードの重量を大きくするこ

とができるため、電気推進機は長時間の運用が見込まれる惑星間航行や人工衛星の姿勢

制御の主推進機として適している。

電気推進機にはイオンスラスタやホールスラスタ、アークジェット、MPDスラスタな

ど様々なものがあり開発・研究されている。図 1.1 に代表的な各種推進機の推力密度と

比推力の関係を示す(2)。イオンスラスタは空間電荷制限電流則の影響を受けるため推力

密度は低く、推進機は大型のものになってしまう。アークジェットや MPD スラスタは

電流の集中による電極損耗があり、耐久性に不安がある。一方でホールスラスタは

Page 6: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

2

1000~3000 秒程度の比推力で 50%を超える推進効率を得ることができる。また、イオン

スラスタのような静電加速てきな点と加速領域が準中性に保たれるために空間電荷制

限電流則に影響されず高い推力密度を得ることができるという電磁加速的な点を持ち

合わせている。ホールスラスタはイオンスラスタと比較して 1桁以上も大きい推力密度

が得られる(2,5)。つまり、ホールスラスタはコンパクト化が可能で小型衛星に適している

といえる。また、ホールスラスタは比較的比推力の小さい範囲で推進効率が高いため、

推力電力比もイオンスラスタを上回っている。この他にも、イオンエンジンと比べてス

ラスタの構造が簡単で電源の数が少なくて済むため信頼性が高く、高電圧を必要としな

いため電源をコンパクトにできることなど多くの利点がある。以上により、ホールスラ

スタは次世代の宇宙推進機として現在多く用いられており、日欧米で競って研究開発が

進められている(2)。

図 1.1 各種電気推進機の推力密度と比推力(2)

(出典:栗木恭一, 荒川義博: 電気推進ロケット入門, 東京大学出版会, 2003, p21)

Page 7: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

3

1.3 本研究の目的

後述するように、ホールスラスタはホール電流を利用した推進機であり、その名前

の由来からもわかるように磁場の影響が大きい推進機である(6)。しかし最適な磁場強度、

磁場形状は作動条件や推進機の形状の損耗により時々刻々と変化してしまう。さらに変

化の仕方はそれぞれの推進機で、またその使われ方により変化するため、理論式どおり

には制御できず、現状では手動によって制御が行われている。しかし近い将来、更に多

くの人工衛星が打ち上げられることが予想され、その 1つ 1つの衛星を最適な環境で作

動させるために手動で制御するには多くの人員を必要とし、そのコストは莫大なものと

なってしまう。

そこで本研究では、推進剤流量や放電電圧、磁場といったパラメータによって目標

とする値が変化する推力、推進効率をニューラルネットワークで追随できるように制

御することを目的とする。

Page 8: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

4

第 2 章 原理

2.1 ホールスラスタの原理

図 2.1 にホールスラスタの概略図を示す。ホールスラスタは円環状のプラズマ加速チ

ャネルの上流にアノードが位置し、外部にカソードが位置している。加速チャネルの半

径方向に磁場、軸方向に電場がそれぞれ印加されていて、プラズマが軸方向に加速され

推力を得る。この加速チャネルの長さがイオンのサイクロトロン半径よりも短く、同時

に電子のサイクロトロン半径よりも長くなるように設計すると、イオンは磁場の影響を

ほとんど受けずに電場によって軸方向に加速されるが、電子は磁場にトラップされ円周

方向に E×B ドリフトする。この電子のドリフトによって生じる円周方向の電流はホー

ル電流と呼ばれている。このホール電流と外部磁場との干渉による電磁加速を主な加速

機構としていることがホールスラスタの名前の由来となっている。電子の動きを流体と

して考えると、ホール電流と磁場との相互作用によって生じるローレンツ力と電界によ

る静電力が釣り合って、加速チャネルの内部に強い電場が維持されると考えることがで

きる(4)。このローレンツ力の反作用は、ホール電流がスラスタの中心軸上に作る軸方向

の磁場とスラスタがもつ軸方向の磁場との反発力という形でスラスタに伝達されると

考えられる。

ホールスラスタは通常出口付近に電子源を有し、ここから供給される電子の一部はス

ラスタから抽出されたイオンビームの空間電荷の中和に使われる。残りの電子は加速チ

ャネル内をアノードに向かって拡散する。この電子の拡散によって加速チャネル内には

電子が常に供給され中性粒子との衝突によってプラズマを生成する。それと同時にチャ

ンネル内のプラズマが電気的に準中性に保たれる。

以上のような仕組みによりイオンエンジンとは異なり、電離加速領域に常に電子が存

在するため、推進機内部においてはほとんどの領域において準中性が保たれる。このた

め、空間電荷制限則を受けずに、高い電流密度を維持することができ結果として推力密

度は高くなる。

Page 9: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

5

図 2.1 ホールスラスタの概念図

Page 10: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

6

2.2 ホールスラスタの基本設計

ホールスラスタの加速チャネルで

𝜔e𝜏e ≫ 1 (1.1)

𝑟e ≪ 𝐿 ≪ 𝑟i (1.2)

𝐿 ≪ 𝜆m (1.3)

という条件を満たすように各パラメータを設定すると、電子のみが周方向

に E×B ドリフトしてホール電流が発生し、イオンは磁場の影響をほとんど受けずに印

加電場によって軸方向に加速されるような状態にできる。

ここで𝜔𝑒[Hz]は電子のサイクロトロン周波数、𝜏𝑒[sec]は電子の衝突時間、𝑟𝑒[m]と𝑟𝑖[m]

はそれぞれ電子とイオンのラーマー半径、L[m]は加速チャネル長、𝜆𝑚[m]はイオンの平

均自由行程である。

これらの条件によって、軸方向の電場を E、径方向の磁場を B、電子密度を𝑛𝑒とする

と、E×B ドリフトによって生じるホール電流密度 j は

j = e𝑛𝑒

𝐸

𝐵 (1.4)

となり、これによるローレンツ力Fhは

𝐹ℎ = 𝑗𝐵 = 𝑒𝑛𝑒𝐸 (1.5)

となる。つまり、ホールスラスタは電子の軸方向の動きを径方向の磁場により妨げ軸方

向に強い電解を維持することができ、そのために加速部のイオンを静電的に加速すると

いう結果になる。したがって、ホールスラスタはイオンスラスタのような静電加速型の

推進機の性質をもちながら、スラスタ自身は電子の軸方向の静電加速を打ち消すように

働くローレンツ力に起因して推力を得るという電磁加速型の推進機の側面を併せ持っ

ている(2)。

式(1.1)~(1.3)を満たすようにホールスラスタは設計されている。以下にそれぞれの式

を説明する。

1) 𝜔𝑒𝜏𝑒 ≫ 1

この式はチャネル内で電子が E×B ドリフトを行う条件である。𝜔𝑒𝜏𝑒はホールパラメ

ータと呼ばれており、電子が 1回衝突を起こすまでにどれだけ旋回運動するかを表して

いる。一般的なホールスラスタでは 200~300 程度となる(5)。電子のサイクロトロン周波

数𝜔𝑒と電子の衝突時間𝜏𝑒は次のように書ける(7)。

Page 11: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

7

𝜏𝑒 =1

𝜎e𝑛𝑣e (1.6)

𝜔e =𝑒𝐵

𝑚e (1.7)

σe[𝑚2]は電子の衝突断面積、𝑛[𝑚−3]は中性粒子密度、𝑣e [m/s]は電子の速度、eは電気素

量、𝐵[T]は磁場、𝑚e [kg]は電子の質量である。

また加速チャネル内の電子がボルツマン分布であると仮定すると電子の速度𝑣𝑒

は次式のように表される。

𝑣e = √2𝑘B𝑇e

𝑚e (1.8)

2) 𝑟𝑒 ≪ 𝐿 ≪ 𝑟𝑖

この式は、加速チャネル内で電子のみが磁場にトラップされ、イオンは磁場に捕らわ

れずに電場によってチャネル外へ排出される条件を表している。電子とイオンのラーマ

ー半径𝑟𝑒と𝑟𝑖はそれぞれ次の式で表される。

𝑟e =𝑚e𝑣e

𝑒𝐵 (1.9)

𝑟i =𝑚i𝑣i

𝑒𝐵 (1.10)

𝑚e[kg]、𝑚i[kg]はそれぞれ電子、イオンの質量、𝑣e[m/s]、𝑣i[m/s]はそれぞれ電子、イオ

ンの速度である。イオンの熱速度が電場による速度に比べて無視できるほど小さいと

仮定すると、イオンの速度𝑣𝑖は次式のように表される。

𝑣i = √2𝑒𝑉m

𝑚i (1.11)

ここで𝑉𝑚[V]はイオンの平均加速電圧である。また、𝑣eは式(1.8)より求まる。

よって、式(1.2)は次のように書き換えられる。

Page 12: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

8

√2𝑚e𝑘B𝑇e

𝑒≪ 𝐿𝐵 ≪ √

2𝑚i𝑉m

𝑒 (1.12)

3) L ≪ 𝜆m

この式はチャネル内でイオンが中性粒子と衝突せずに加速される条件である。イオン

の平均自由行程𝜆𝑚は

𝜆m =1

4√2

1

𝜎𝑖𝑛 (1.13)

と表される。

本研究では推進剤として比較的電離電圧が低くて且つ分子量の大きいキセノンを使用

する。式(1.1)、(1.11)、(1.3)にホールスラスタの代表的なパラメータを代入すると式(1.14)、

(1.15)、(1.16)を得る。

電子の衝突断面積𝜎e = 2.7 × 10−19[𝑚2]、中性粒子密度𝑛 = 5 × 1019[𝑚−3]、

キセノンイオン質量 𝑚i = 2.2 × 10−25[kg]、 電子質量 𝑚e = 9.1 × 10−31[kg]、

平均加速電圧 𝑉m = 300[V]、電子温度 𝑇e = 15[eV]= 1.74 × 105[K]、

イオンの衝突断面積𝜎𝑖 = 1.2 × 10−19[𝑚2]、ボルツマン定数 𝑘B = 1.38 × 10−23[J/K]、

電気素量 e = 1.6 × 10−19[C]、磁場 B = 40[mT]

𝜔e𝜏e = 227.5 (1.14)

1.31 × 10−5 ≪ 𝐿𝐵 ≪ 2.87 × 10−2[T・m] (1.15)

𝜆m = 2.95 × 10−2[𝑚] (1.16)

ここで L は 0.02~0.03m でありそのうち実際にプラズマが生成されるのは 0.005~0.01

である。このため、LBは 2× 10−4~4× 10−4[T・m]であるため(1.15)を満たしている。

Page 13: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

9

2.3 ホールスラスタの制御

ホールスラスタはホール電流を利用した推進機であり、加速チャンネル内に印加する

半径方向の磁場の特性がスラスタの作動特性に大きな影響を与える。この磁場強度や磁

場形状はコイルの内側電流や外側電流によって制御している。

ホールスラスタにおいて、イオンが加速チャンネルにぶつかり、加速チャンネルが損

耗していく。加速チャンネルが損耗することによって、加速チャンネル形状が変化し最

適な磁場強度や磁場形状が変わってしまう。つまり、安定作動させるための磁場強度、

磁場形状が時間的に変化してしまう。図 2.2は寿命初期(BOL:Beginning of Life)を模擬

した 20mN クラスのホールスラスタを使い、推進剤流量 1.02mg/s、アノード電圧 200V

としたときに放電電流を変動させて、最適値になればロックすることを繰り返した図で

ある。この図から確かに時間が経過するにつれて最適な磁場は変化していくことがわか

る(8)。

以上のように最適な磁場強度、磁場形状は作動条件や推進機の加速チャンネルの損耗

によって時々刻々と変化し、またそれぞれの個体で最適環境は変わってしまうので理論

式どおりの推力や推進効率とはいかず、適切な磁場強度や磁場形状を考慮するように制

御する必要があり、特別な配慮が必要となる。

図 2.2 コイル電流を変動させて、最適値でロックすることを繰り返した図

(出典:大須賀弘行:“宇宙電気推進機システムの制御に関する研究”,2012, p134)

Page 14: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

10

第 3 章 ニューラルネットワークによる制御

3.1 ニューラルネットワークについて

生物の脳の神経回路網の仕組みを模倣したモデルのことをニューラルネットワーク

と呼ぶ。ニューラルネットワークは画像認識、音声認識、パターン認識、株価の予測、

人工知能といった幅広い分野で応用・利用されている(9)。

ニューラルネットワークでは目標の出力を得るように調整していく必要がある。この

ことを学習という。学習は大きく「教師なし学習」と「教師付き学習」の二つに分けら

れる。

教師なし学習では、入力データだけ与え目標出力は与えずコンピュータ自身が自動で

調整する方法で、教師付き学習は入力データを与えた際に目標出力と学習で求めた出力

が一致するように調節していく方法のことである。

この学習能力がニューラルネットワークの重要な特徴の 1つである。学習能力を有す

るシステムにおいて、自ら機構を設計する必要がない。なぜならば、ニューラルネット

ワークではより高度な機能を自動形成することが可能であるからである。

また「並列性」も特筆に値する特徴である。コンピュータと人間の脳は、構成と情報

処理速度に大きな違いがある。コンピュータでは人間ではできない桁の大きく複雑な計

算を瞬時に行うことができる。しかし人間の顔を判断し、さらにはその微妙な表情の違

いを判別するという並列処理は難しい。ニューラルネットは超並列計算機の実現形態の

1 つである。他の超並列計算の手法に比べると構造が一様、単純であり、用途が限定さ

れるが、その並列動作を体系的に把握する理論体系が確立されている。膨大な数の計算

素子が相互作用を及ぼしあいながら情報処理を進めてゆく様子を、人間の脳の仕組みと

対比することができる(10)。この対比により、従来困難とされていた大規模な並列システ

ムの解析が、統計物理の手法を借りて行えるようになった。

このニューラルネットワークを用いて、人工衛星の誤作動・故障の原因である高エネ

ルギー電子の静止軌道の電子フラックス予測(11)などの研究もすでに行われている。さら

には先月ニューラルネットワークを用いた Googleの囲碁ソフト「AlphaGo」がプロ棋士

に勝利したというニュースもあり、注目が高まっている。

Page 15: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

11

3.2 ネットワークの形態

ニューラルネットワークの形態として主に順伝播型とリカレント型がある。順伝播型

は信号が入力側から出力側に一方向にのみ伝播するニューラルネットワークであり、図

3.1のような構造をしている。このネットワークでは、入力側の素子の値を指定すると、

そこから出力側に向けて素子の値は次々と決まる。

一方、素子を図 3.2 のようなリカレント型で接続すると、入力側の素子に出力側の素

子から信号がフィードバックしてくるため、入力側の素子の値を決める際に出力側の素

子の値も考慮しなければならない。また、同時に出力側の素子の値は入力側の素子の値

にも依存する。実際、入力に対してある時間遅れを経て出力が定まるためにこの循環の

輪を解くことができる(12)。

図 3.1 順伝播型

図 3.2 リカレント型

Page 16: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

12

3.3 ユニットの出力

ニューラルネットワークを構成する各ユニットは図 3.3 に示すように、複数の入力を

受け取り、1 つの出力を計算する。図 3.3 の場合、3 つの入力𝑥1、𝑥2、𝑥3を受け取るが、

このユニットが受け取る総入力 u は、

u = 𝑤1𝑥1 + 𝑤2𝑥2 + 𝑤3𝑥3 + b (3.1)

のように、各入力にそれぞれ異なる重み(weight)𝑤1、𝑤2、𝑤3を掛けたものをすべて加

算し、これにバイアス(bias)と呼ばれる一つの値 b を足したものになる。このユニッ

トの出力 y は、総入力 u に対する活性化関数と呼ばれる関数の出力である(13)。

y = f(𝑢) (3.2)

図 3.3 ユニット 1つの入出力

順伝播ネットワークでは図 3.4 のように、上記のようなユニットが層状に並べられ、

層間でのみそれらは結合を持つ。左の層のユニットの出力が右の層のユニットへと一方

向に伝わっていく。同図のネットワークでは、右のユニット(j=1,2,…,J)はそれぞれ、左

のユニット(i=1,2,…,I)からの出力𝑥1, 𝑥2,…, 𝑥𝐼を入力として受け取る。ユニット間の結合

は全部で j×i 本あり、その 1 つ 1つの結合に異なる重み𝑤𝑗𝑖が与えられる。よって第 1層

のユニットの出力から第 2層のユニットの出力が決まるまでの計算は次のように一般化

される。

𝑢𝑗 = ∑ 𝑤𝑗𝑖 + 𝑏𝑗

𝐼

𝑖=1

(3.3)

𝑦𝑗 = 𝑓(𝑢𝑗) (3.4)

ベクトル行列を用いて表現すると、これは

𝐮 = 𝐖𝐱 + 𝐛 (3.5)

𝐲 = 𝐟(𝒖) (3.6)

Page 17: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

13

のようになる。ただし、各ベクトルと行列は次のように定義している。

𝐮 = [

𝑢1

⋮𝑢𝐽

], 𝐱 = [

𝑥1

⋮𝑥𝐼

], 𝐛 = [

𝑏1

⋮𝑏𝐽

], 𝐲 = [

𝑦1

⋮𝑦𝐽

]

𝐖 = [

𝑤11 ⋯ 𝑤1𝐼

⋮ ⋱ ⋮𝑤𝐽1 ⋯ 𝑤𝐽𝐼

], 𝐟(𝒖) = [

𝑓(𝑢1)⋮

𝑓(𝑢𝐽)]

図 3.4 2層に並べられたネットワーク

Page 18: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

14

3.4 活性化関数

生体の細胞では、シナプスから次の神経細胞へ信号が伝わる(14)。その信号の出力を模

倣するためにニューラルネットワークではさまざまな関数が用いられており、その関数

のことを活性化関数と呼ぶ。この活性化関数によって学習の精度が変わってくる。

ユニットが持つ活性化関数には通常、単調増加する非線形関数が用いられる。しかし

ニューラルネットワークでは部分的に線形写像を用いる場合がある。そこで今回は図 3.5

に示すシグモイド関数、双曲線正接関数、恒等写像を用いて、どの活性化関数が精度が

高く、制御する際に適しているかを検討した。

図 3.5 活性化関数

(a) シグモイド関数 (b) 双曲線正接関数

(c) 恒等写像

Page 19: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

15

3.5 勾配法

出力層の活性化関数を選んだ上で、ネットワークの出力𝐲(𝒙𝑖)が訓練データ(あるいは

教師データ)の目標出力𝒅𝑖にできるだけ近くなるように考える。そこで近さの尺度とし

て二乗誤差

‖𝒅 − 𝒚(𝒙; 𝒘)‖2 (3.7)

を用いる。二乗誤差を訓練データの全サンプルn = 1, ⋯ , Nについて足し合わせたものを

1/2 した

E(𝒘) =1

2∑‖𝒅𝑛 − 𝒚(𝒙𝑛; 𝒘)‖2

𝑁

𝑛=1

(3.8)

を考えこれが最も小さくなるような wを求める。

学習の目標は、選んだE(𝒘)に対して最小値を与える w を求めることであるが、E(𝒘)

は一般に凸関数ではなく、大域的な最小解を直接得るのは通常不可能である。そこで関

数値を小さくする方向を、「勾配」を目安にして決定する勾配降下法を使ってE(𝒘)を小

さくしていく。勾配とは

∇E ≡𝜕𝐸

𝜕𝒘= [

𝜕𝐸

𝜕𝑤1⋯

𝜕𝐸

𝜕𝑤𝑀]

(3.9)

というベクトルである(ここで M は w の成分数を意味する)。勾配降下法は現在の w を

負の方向(−∇E)に少し動かし、これを何度も繰り返す。つまり現在の重みを𝒘𝑡、動か

したあとの重みを𝒘𝑡+1とすると

𝒘𝑡+1 = 𝒘𝑡 − 𝜀∇𝐸 (3.10)

のように更新していく。ここで𝜀は w の更新量の大きさを定める定数であり、学習係数

と呼ぶ。初期値𝒘(1)の初期値を適当に決めて、式(3.10)をt = 1,2, ⋯と繰り返し更新して

いくことで𝒘(1), 𝒘(2) ⋯を得る。こうして算出される𝒘(𝑡)は学習係数εが十分に小さけれ

ば、t が増加するにつれてE(𝒘(𝒕))を減少させる。したがって何度も更新すれば、極小点

に到達する。しかしE(𝒘)の形状や学習係数𝜀の大きさによってはE(𝒘)が増大することも

ある。また𝜀が小さすぎると、w の 1回の更新が小さくなるので、反復回数が増加して学

習にかかる時間が大きくなる(13)。なのでこの学習係数の決定が重要な問題で、学習の良

しあしを左右することになる。

Page 20: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

16

3.6 誤差逆伝播法(バックプロパゲーション)

3.5 節で述べた勾配降下法を実行するには、誤差関数E(𝒘)の勾配∇E = 𝜕𝐸(𝒘) 𝜕𝒘⁄ を計

算する必要がある。勾配のベクトルの各成分は、それぞれの層の結合重みと各ユニット

のバイアスでの誤差関数の微分𝜕𝐸 𝜕𝑤𝑗𝑖⁄ と𝜕𝐸 𝜕𝑏𝑗⁄ である。しかしこれらの微分の計算は

中間層、特に入力に近い深い層のパラメータほど計算が面倒になる。

1 つの入力𝒙𝑛に対する二乗誤差E𝑛 = 1 2⁄ ‖𝒚(𝒙𝑛) − 𝒅𝑛‖2を第 l 層の重み𝑤𝑗𝑖(𝑙)で微分す

る。まず

𝜕𝐸𝑛

𝜕𝑤𝑗𝑖(𝑙)

= (𝒚(𝒙𝑛) − 𝒅𝑛)⊺𝜕𝒚

𝜕𝑤𝑗𝑖(𝑙)

(3.11)

となる。さらに、右辺の微分𝜕𝒚 𝜕𝑤𝑗𝑖(𝑙)⁄ を求めなければならないが、これには関数𝐲(𝒙)の

なかで𝜕𝑤𝑗𝑖(𝑙)が

𝐲 = f(𝒖𝐿)

= f(𝑾(𝐿)𝒛(𝐿−1) + 𝒃(𝐿))

= f(𝑾(𝐿)f(𝑾(𝐿−1)𝒛(𝐿−2) + 𝒃𝐿−1) + 𝒃𝐿)

= f (𝑾(𝐿)f (𝑾(𝐿−1)f(⋯ f(𝑾(𝑙)𝒛(𝑙−1) + 𝒃𝑙) ⋯ )) + 𝒃(𝐿))

(3.12)

のように活性化関数の深い入れ子の中に現れるため、微分の連鎖規則を何度も繰り返す

必要がある。そのためプログラミングが複雑になり面倒になってしまう。

そこで誤差逆伝播法をという手法を用いる。まず図 3.6のようにいつも+1を出力する

第 0 番目のユニットを各層に導入し、バイアス𝑏𝑗をそのユニットと各ユニット j との結

合重み𝑤0𝑗(𝑙) = 𝑏𝑗

(𝑙)と考える。つまり l層のユニットへの入力は、𝑙 − 1層の第 0 ユニット

の出力が常に𝑧0(𝑙−1) = 1となることで

𝑢𝑗(𝑙) = ∑ 𝑤𝑗𝑖

(𝑙)

𝑛

𝑖=1

𝑧𝑖(𝑙−1) + 𝑏𝑗 = ∑ 𝑤𝑗𝑖

(𝑙)

𝑛

𝑖=0

𝑧𝑖(𝑙−1) (3.13)

のように簡潔に書くことができる(13)。

図 3.6 常に+1を出力するユニットを各層に配置したネットワーク

Page 21: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

17

3.7 誤差逆伝播法のアルゴリズム

誤差逆伝播法は逐次更新学習法の 1つであり、訓練データが与えられる毎に結合重み

を微小修正していく。図 3.7 のネットワークを用いてこの修正手続を説明する。訓練デ

ータが L 個あり、その l番目は入力(𝑥1(𝑙), 𝑥2

(𝑙), ⋯ 𝑥𝑁(𝑙))に対して、出力(𝑑1

(𝑙), 𝑑2(𝑙), ⋯ 𝑑𝑀

(𝑙))

を要求するものとする。1 つの訓練データを選択し 3.5 節で述べた、訓練データに対す

る誤差評価尺度である二乗誤差を小さくするように結合重みを修正していく。全部の訓

練データの誤差評価尺度が十分に小さくなるまで繰り返す。

図 3.7 には、入力層、中間層、出力層の 3 層からなる順伝播型ニューラルネットワー

クが示してある。まず入力層のそれぞれのノードにデータを選択して入力させる。そし

て次の層のそれぞれのユニットに対する結合重みを掛け合わせ、活性化関数を適用しそ

のユニットの出力を得る。

図 3.7 誤差逆伝播法で学習する順伝播型ネットワーク

1 つのユニットの出力 y は誤差逆伝播法の場合、図 3.6 に示すように常に+1 を出力す

るユニットがあるのでユニットの総入力を u とすると

u = ∑ 𝑤𝑛𝑥𝑛

𝑁

𝑛=0

(3.14)

y = f(u) (3.15)

Page 22: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

18

となる。このように動作する素子を組み合わせることで、図 3.7 のネットワークを構成

し、i番目のノードに入力𝑥𝑖を加える。入力ノードはi = 1,2, ⋯ Nの N 個あり、これらを同

時に入力させる。なお、このネットワークの結合重みすべてに、初期値として乱数を振

っておく。ここで初期値を 0としてしまうと、対称性のために勾配が 0となってしまい、

結合重みの更新が行われなくなってしまうので注意しなければならない。初期値を乱数

にすることで対称性を壊し、勾配が 0とならないようにする。

入力ノードに入力を与えたあと、j 番目の中間層のユニットは入力𝑥𝑖に結合重み𝑤𝑖𝑗(1)

を掛けてi = 0,1,2, ⋯ Nについて総和し

𝑢𝑗(1) = ∑ 𝑤𝑖𝑗

(1)

𝑁

𝑖=0

𝑥𝑖 (3.16)

を得る。これを活性化関数に通して、ユニットの出力

y𝑗(1) = f(𝑢𝑗

(1)) (3.17)

を得る。中間層のユニットがj = 1,2, ⋯ Kの K 個あるとき、これら全てに対して上の手続

きを行い出力を求める。

こうして中間層のユニットの出力を求めたあと、j番目の出力層のユニットは、中間層

のユニットの出力y𝑖(1)(i = 0,1,2, ⋯ K)をその入力として受け取り、これに結合重み𝑤𝑖𝑗

(2)

を掛けてその総和をとる

𝑢𝑗(2) = ∑ 𝑤𝑖𝑗

(2)

𝐾

𝑖=0

y𝑖(1) (3.18)

を得る。これを活性化関数に通して、ユニットの出力

y𝑗(2) = f(𝑢𝑗

(2)) (3.19)

を得る。出力層のユニットがj = 1,2, ⋯ Mの M 個あるとき、これら全てに対して上の手続

きを行い出力を求める。

y𝑗(2)は、出力層のユニットの出力であるが、これがこのネットワークの出力𝑐𝑗となる。

図 3.7の場合は便宜上、出力𝑐𝑗をy𝑗(2)と書き、入力𝑥𝑖もy𝑖

(0)と書くことにする。

上記のようにネットワークの出力𝑐𝑗(j = 1,2, ⋯ M)を求めたあと、これらを入力𝑥𝑖 (i =

1,2, ⋯ N)に対する理想の目標出力𝑑𝑗(j = 1,2, ⋯ M)と比較する。比較には記述してきた通

り二乗誤差

E = ∑|𝑐𝑖 − 𝑑𝑖|2

𝑀

𝑖=1

(3.20)

を用い、これが小さくなるように、ネットワーク内の結合重みを修正していく。

結合重みの修正方法を以下に示す。

Page 23: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

19

図 3.8 誤差逆伝播モードの信号の流れ

まず、結合重みの修正時(誤差逆伝播モード)のネットワークの信号の流れを図 3.8の

ように定める。ノード数、ユニット数、層数、結合重み数は出力の算出の際に用いた図

3.7 と変わらないが、ユニットの機能と信号が流れる方向が異なることに留意すべきで

ある。

誤差逆伝播モードにおけるユニットの機能を図 3.9に示す。

図 3.9 誤差逆伝播モードのユニットの機能

Page 24: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

20

ユニットの内部に図 3.7 で求めた自分の出力 y を保持しておく。図中の()内の値は、

保持されている値である。ユニットの右側から与えられる入力𝑧1, 𝑧2, ⋯ 𝑧𝑁に、ユニットの

右側の結合重み𝑤0, 𝑤1, 𝑤2 ⋯ 𝑤𝑁を掛けその総和をとる

g = ∑ 𝑤𝑛𝑧𝑛

𝑁

𝑛=1

(3.21)

を求めた後に保持されているy𝑗(𝑙) = f(𝑢𝑗

(𝑙))を用いて

z = 𝑓′(𝑢𝑗(𝑙)

)g (3.22)

を出力する。これが左側の層のユニットへの入力となる。ここでの𝑓′(𝑢𝑗(𝑙)

)は 3.6 節で述

べたように勾配を計算する際に出てくる微分である。

以上のように動作するユニットを図 3.8のように接続する。図 3.8 の右から図 3.7で求

めたネットワークの出力𝑐𝑖と目標出力𝑑𝑖との誤差𝑐𝑖 − 𝑑𝑖を入力として加える。この入力

に基づき各層で図 3.9 で示したユニットの機能が働き、ユニットの出力𝑧𝑖(𝑙)が右側の層

から次々と決まる。こうして誤差逆伝播モードで各層のユニットの出力𝑧𝑖(𝑙)を求めたあ

と、これと図 3.7で求めた各層のユニットの出力𝑦𝑗(𝑙)を用いて、次式を使って結合重みを

修正する

𝑤𝑖𝑗(𝑙+1) = 𝑤𝑖𝑗

(𝑙+1) − 𝜀𝑦𝑖(𝑙)𝑧𝑗

(𝑙+1) (3.23)

𝑤𝑖𝑗(𝑙+1)は、第 l 層の第 i ユニットと第𝑙 + 1層の第 j ユニットを結ぶ結合重みであるが、

その修正量が自分が接続している左側の層のユニットの出力値𝑦𝑖(𝑙)と、右側の層のユニ

ットの誤差逆伝播モードにおけるユニット出力𝑧𝑗(𝑙+1)の積によって決まる(12)。

以上のような結合重みの更新を何度も繰り返して二乗誤差を小さくしていく。そのフ

ローチャートを図 3.10に示す。

Page 25: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

21

図 3.10 逐次学習法のフローチャート

Page 26: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

22

第 4 章 制御プログラム

4.1 LabVIEW

「Laboratory Virtual Instrumentation Engineering Workbenc」の略をその名の由来とする

Lab VIEW は、ナショナルインスツルメンツ社の人々が創り上げた強力で柔軟なグラフ

ィカル環境である(15)。Lab VIEW で作成するプログラムはバーチャルインスツルメンツ

(仮想計測器)と呼ばれている。バーチャルインスツルメンツを用いると、データの

収録、解析、表示を全てパソコン上で行うことができるようになる。本研究におい

て、作成した試作プログラムはこの LabVIEW を用いて行った。

4.2 制御プログラム

今回の実験では、ホールスラスタの推力・推進効率の理想的な値を誤差逆伝播法によ

って追随するようなプログラムを作成した。作成した誤差逆伝播法のプログラムは、図

4.1 のように磁場を考慮しない場合の、推進剤流量と放電電圧を入力に与えて推力を出

力するプログラムと、図 4.2 のように磁場を入力として追加して推力と推進効率をそれ

ぞれ出力するというプログラムである。

このネットワークのなかで用いる活性化関数はシグモイド関数、双曲線正接関数、恒

等写像の 3つである。ネットワークの中間層のユニットの数は 5つで、中間層の層数は

2層、3層、4層のものを作成した。

まず 2 層、3 層、4 層の磁場を入力として与えていない場合と与えている場合のシグ

モイド関数、双曲線正接関数、恒等写像の目標出力との二乗誤差が最も小さくなるよう

な学習係数を求めた。そのときの学習として、入力の推進剤流量と放電電圧と磁場、そ

の時の理想的な推力や推進効率のペアを訓練データとして与え、目標出力に近づくよう

に結合重みを調整し学習させた。

最後に学習後、推進剤流量と放電電圧と磁場を入力させたときに、最適な学習係数を

用いて学習させた後の結合重みを用いてこの誤差逆伝播法のプログラムが学習を通し

て算出した推力や推進効率を得た。試作プログラムのフローチャートを図 4.3に示す。

Page 27: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

23

図 4.1 推進剤流量と放電電圧を入力し推進効率を出力するネットワーク

図 4.2 磁場を入力側に追加し推進効率を出力するネットワーク

Page 28: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

24

図 4.3 試作プログラムのフローチャート

Page 29: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

25

第 5 章 結果及び考察

5.1 学習係数の決定

学習係数は学習がうまくいくかを左右し、その決定が学習後の結合重みを用いた推力

や推進効率の算出の精度に大きく関わってくる。今回作成したのは、入力が推進剤流量

と放電電圧で出力を推力とした場合と、入力が推進剤流量と放電電圧、磁場で出力に推

力または推進効率とした場合の 2層、3層、4 層の誤差逆伝播法のプログラムであり、そ

れぞれ活性化関数にシグモイド関数、双曲線正接関数、恒等写像を採用した。層ごとに、

また活性化関数ごとに最適な学習係数が存在し、まずはそれを決定した。

学習係数の決定には、全ての活性化関数で学習後の二乗誤差が10−2以下で安定した結

合重みの更新回数 100 万回を固定し、それぞれ層数や活性化関数で最も二乗誤差が小さ

くなった学習係数をその層や活性化関数の最適な学習係数とした。図 5.1~5.9 にそれぞ

れの学習係数と二乗誤差の関係を示す。

図から入力が推進剤流量と放電電圧で出力が推力の場合でも入力が推進剤流量と放

電電圧と磁場で出力が推力または推進効率の場合でも、活性化関数がシグモイド関数の

ときは 2層、3層、4 層とも最適な学習係数はε = 0.5であり、双曲線正接関数のときは 2

層、3層、4層とも最適な学習係数はε = 0.08であることがわかる。しかし活性化関数が

恒等写像のときは 2 層、3 層ではε = 0.006であったが、4 層では入力が推進剤流量と放

電電圧で出力が推力の場合ε = 0.004以上になると、入力が推進剤流量と放電電圧と磁場

で出力が推力または推進効率の場合それぞれε = 0.005、ε = 0.007以上になると二乗誤差

が NaN(Not a Number)になりうまく出力されなかった。これは図 3.5 からもわかるよ

うに、シグモイド関数や双曲線正接関数はそれぞれ出力が[-1,1]の範囲に制約されていて、

勾配の値が過大に発散するようなことはないが、恒等写像は出力が[-1,1]の範囲に制約さ

れてはおらず、逆伝播計算は線形的であるため結合重み修正の際の線形的な計算におい

て、重みがあまりにも大きいと勾配が急速に大きくなり、重みが小さいと勾配が急速に

小さくなり消失してしまったためと考えられる。4 層以上になるとこの勾配消失の問題

が顕著に現れた。そのため 4層の恒等写像の場合、最適な学習係数は図からわかるよう

にε = 0.002となった。

Page 30: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

26

(a) 2層シグモイド関数

(b) 3層シグモイド関数

(c) 4層シグモイド関数

図 5.1 入力が推進剤流量と放電電圧で出力が推力の場合のシグモイド関数の

学習係数と二乗誤差の関係

Page 31: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

27

(a) 2層双曲線正接関数

(b) 3層双曲線正接関数

(c) 4層双曲線正接関数

図 5.2 入力が推進剤流量と放電電圧で出力が推力の場合の双曲線正接関数の

学習係数と二乗誤差の関係

Page 32: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

28

(a) 2層恒等写像

(b) 3層恒等写像

(c) 4層恒等写像

図 5.3 入力が推進剤流量と放電電圧で出力が推力の場合の恒等写像の

学習係数と二乗誤差の関係

Page 33: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

29

(a) 2層シグモイド関数

(b) 3層シグモイド関数

(c) 4層シグモイド関数

図 5.4 入力が推進剤流量と放電電圧と磁場で出力が推力の場合の

シグモイド関数の学習係数と二乗誤差の関係

Page 34: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

30

(a) 2層シグモイド関数

(b) 3層シグモイド関数

(c) 4層シグモイド関数

図 5.5 入力が推進剤流量と放電電圧と磁場で出力が推進効率の場合の

シグモイド関数の学習係数と二乗誤差の関係

Page 35: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

31

(a) 2層双曲線正接関数

(b) 3層双曲線正接関数

(c) 4層双曲線正接関数

図 5.6 入力が推進剤流量と放電電圧と磁場で出力が推力の場合の

双曲線正接関数の学習係数と二乗誤差の関係

Page 36: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

32

(a) 2層双曲線正接関数

(b) 3層双曲線正接関数

(c) 4層双曲線正接関数

図 5.7 入力が推進剤流量と放電電圧と磁場で出力が推進効率の場合の

双曲線正接関数の学習係数と二乗誤差の関係

Page 37: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

33

(a) 2層恒等写像

(b) 3層恒等写像

(c) 4層恒等写像

図 5.8 入力が推進剤流量と放電電圧と磁場で出力が推力の場合の

恒等写像の学習係数と二乗誤差の関係

Page 38: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

34

(a) 2層恒等写像

(b) 3層恒等写像

(c) 4層恒等写像

図 5.9 入力が推進剤流量と放電電圧と磁場で出力が推進効率の場合の

恒等写像の学習係数と二乗誤差の関係

Page 39: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

35

5.2 ニューラルネットワークを用いたホールスラスタの制御

今回の目的はホールスラスタを作動させたときの推力や推進効率の目標値が磁場な

どの影響で理論式で求めるものとは異なってしまうため、その理論式では追えない目標

の値をニューラルネットワークを用いて追随することである。そこで今回は入力が推進

剤流量と放電電圧で出力が推力の場合と、入力が推進剤流量と放電電圧と磁場で出力が

推力または推進効率の場合の 2層、3層、4層の誤差逆伝播法で、活性化関数にシグモイ

ド関数、双曲線正接関数、恒等写像を用いたものを比較した。訓練データのサンプル数

は 45組である。比較には、目標の推力や推進効率になるように修正した学習後の結合重

みを用いて実際にもう一度そのネットワークで推進剤流量や放電電圧、磁場を入力して

推力や推進効率を出力し、本当に目標の値に近づいたかどうかを調べた。その結果を図

5.10~5.12に示す。今回入力の学習後に入力する推進剤流量は 5mg/s と一定にして放電電

圧を変えていき、その出力である推力や推進効率が目標としている値とどれだけ誤差が

あるのかを調べた。図には目標の推力との誤差 5%の部分が示されている。

まず入力が推進剤流量と放電電圧で出力が推力の場合、シグモイド関数はほとんどの

値が目標の推力との誤差 5%以内に収まった。一方で双曲線正接関数と恒等写像は目標

の推力との誤差 5%以内に収まらない場合が多くが見られ、特に電圧の低い領域では目

標の推力との差が非常に大きくなった。一般に層数が増えると精度が上がるはずだがど

の活性化関数でも、2 層のときが一番精度が良かったり、4層のときに一番精度が悪いと

いったばらつきが多く見受けられた。

次に入力が推進剤流量と放電電圧と磁場で出力が推力の場合、シグモイド関数は入力

パラメータに磁場を追加したことで、追加しなかったときよりも精度が向上し、ほとん

どすべての値で目標の推力との差が誤差 5%以内に収まった。さらに層数が増えると目

標値に近づく場合が多くなった。一方双曲線正接関数と恒等写像は、入力パラメータを

増やせば精度があがるはずなのだが、精度の向上はあまり見られなかった。しかし、層

数が増えることで精度が上がっていったことが確認できた。

最後に入力が推進剤流量と放電電圧と磁場で出力が推進効率の場合、シグモイド関数

は出力が推力だったときと同様にほとんどの値で誤差が 5%以内になったが、層数と精

度が対応していないことが多かった。一方で恒等写像は放電電圧の低い領域以外は誤差

が 5%以内に収まったが層数での誤差の変化があまり見られなかった。双曲線正接関数

は電圧の低い領域で特に誤差との差がおおきくなり、層数と精度が対応していなかった。

Page 40: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

36

図 5.10 入力が推進剤流量と放電電圧で出力が推力の場合の目標の推力と学習後の

推力の比較 (a)シグモイド関数 (b)双曲線正接関数 (c)恒等写像

Page 41: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

37

図 5.11 入力が推進剤流量と放電電圧と磁場で出力が推力の場合の目標の推力と

学習後の推力の比較 (a)シグモイド関数 (b)双曲線正接関数 (c)恒等写像

Page 42: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

38

図 5.12 入力が推進剤流量と放電電圧と磁場で出力が推進効率の場合の目標の効率と

学習後の効率の比較 (a)シグモイド関数 (b)双曲線正接関数 (c)恒等写像

Page 43: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

39

5.3 RAIJINのデータを用いた結果

先の 5.2 節では多くても入力に、推進剤流量・放電電圧・磁場の 3 つを入れたネット

ワークであったが、この節では磁場をコイルの内側電流、コイルの外側電流、コイルの

トリム電流の 3つに分けて考え、合計で入力を 5つの、推力を出力する誤差逆伝播法の

ネットワークを考える。教師データとして RAIJIN プロジェクトで測定したものを用い

た。今回 5.2 節のときよりも教師データは増えており、入力数も 3 つから 5 つに増えて

いる。その場合について、放電電圧と磁場変化に対してそれぞれの活性化関数でどのよ

うに推力が変化していき、目標とする推力と比べてどれほど近いものになるかを検討す

る。

層数 4 層のネットワークを採用し、学習係数は 5.1 節で求めた、シグモイド関数に対

してε = 0.5、双曲線正接関数に対してε = 0.08、恒等写像に対してε = 0.002をそのまま

用いた。推進剤流量は 5mg/s と一定にして放電電圧と磁場(内側コイル電流)を変えて

いき、その出力である推力がどのようになるかを調べた。図 5.13は内側コイル電流と放

電電圧と目標とする推力の関係を表したものである。ニューラルネットワークでの学習

後の出力がの分布図がこの図と同じようになれば十分に目標値を再現できているとい

える。図 5.14の(a)~(c)はそれぞれの活性化関数の出力の分布図である。

図 5.13 で見られた推力が 60mN 以下の領域や 100mN ほどの領域が、ニューラルネッ

トワークでの学習後の推力での分布図ではあまり見られす、再現できていないことが確

認できた。図 5.14から 3つの活性化関数のなかではシグモイド関数が最も目標の推力分

布図に近いことがわかり、精度が一番高いことが確認できた。双曲線正接関数はすべて

の領域においてシグモイド関数に劣るものの、電圧の低い領域でも 5.2 節に比べるとそ

の精度は上がっており、教師データ数や入力数が増えることで精度が上がることを確認

することができた。しかし電圧 200V と一定としたときに磁場を上げていくと推力は下

がっていくはずであるが、双曲線正接関数では推力が下がっていかず、精度が悪かった。

恒等写像は電圧 300V 付近の推力の変化がさほど見られず、磁場を変化させたときの推

力が追随できていないことが分かった。また双曲線正接関数同様、電圧 200V と一定に

したときの磁場増加に伴う推力の減少が見られず精度がほかの 2つの活性化関数と比べ

て悪いことが分かった。教師データ数や入力数が増えて、多少の精度の向上は見られた

が、電圧の低い領域では依然として精度が悪く、5.2節でも述べたように多層にするとプ

ログラミングがうまく実行できなくなるため制御には向いていないことが分かった。

Page 44: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

40

図 5.13 内側コイル電流・放電電圧・推力の関係

Page 45: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

41

図 5.14 内側コイル電流・放電電圧・学習後の推力の関係

(a)シグモイド関数 (b)双曲線正接関数 (c) 恒等写像

Page 46: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

42

5.4 考察

5.2 節と 5.3 節からシグモイド関数がホールスラスタを制御する際には最も適してい

ること考えられる。層数を増やしたり教師データ数や入力数を増やすことで精度が向上

し、目標とする推力の値も十分再現できたので、この活性化関数を用いた制御が一番現

実的であるだろう。確かに双曲線関数も教師データ数や入力数を増やすことで精度の向

上が見られたが、図 5.14からもわかるように目標の推力の分布図と比べるとシグモイド

関数よりも精度が悪かった。恒等写像については、学習係数の決定の際にも 4 層になる

と二乗誤差が NaNになるようになり多層になるとプログラムが作動せず、その精度も電

圧の低い領域では目標の推力を再現できずホールスラスタの制御には適していないと

考えられる。

5.3 節において、推力が 60mN 以下の領域や 100mN ほどの領域が、ニューラルネット

ワークでの学習後の推力での分布図ではあまり見られす、再現できていなかった。これ

はこの領域における教師データの数が、データ数の多かった電圧 300V 付近と比べて少

なく正確に学習できておらず、その結果再現できなかったと考えられる。

Page 47: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

43

第 6 章 結論

本研究ではホールスラスタの推進剤流量や放電電圧、磁場といったパラメータによっ

て目標とする値が変化する推力、推進効率をニューラルネットワークで追随できるよう

に制御することを目的とした。以下の結論を示す。

・ 先行研究では LM 法を用いて入力にコイル電流、出力に放電電流振動を設定し、中

間層 2 層のネットワークで行っていたが、入力数を 2 つに増やすとプログラムが動

かなくなる、一度動かし最適値を見つけるのに 10 分から 20 分ほど時間を要してし

まっていた。しかし、今回誤差逆伝播法を用いることで入力数を 5 つ、中間層を 4

層まで増やすことができ、プログラムの作動時間も 5 分程度と短くすることができ

た。

・ ネットワークの活性化関数が精度に大きく関わってくることが確認でき、今回の場

合最も精度が高くなったのはシグモイド関数であった。

・ 層数を増やすと徐々にではあるが精度も上がっていくことが確認できた。また、入

力数やデータ数を増やすことでそれぞれの活性化関数で精度が上がったが、恒等写

像は電圧の低い領域では目標の推力を再現できず、関数の性質から層を増やすと制

御が困難になり、ホールスラスタの制御には向いていないことが分かった。

今回の研究ではパソコン上で、与えられたデータを用いて目標の推力と近づくようにし

ただけだが、今後はこのニューラルネットワークを実際に制御する際に組み込んで、ホ

ールスラスタを制御する必要がある。また精度をさらに向上するために中間層の層数や

ユニット数を増やす、ユニット間結合が双方向性を持つニューラルネットワークである

ボルツマンマシンなどを導入するなどして更なる精度の向上を図っていきたい。さらに、

深層学習では未知パラメータを入力した際に目標とする出力を得られるようにしたい

ので、さらにデータを増やすなどして、これに対応させていきたい。

Page 48: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

44

参考文献

(1) 宇宙情報センター http://spaceinfo.jaxa.jp/ja/cosmic_history.html 2016/1/16

(2) 栗木恭一,荒川義博: “電気推進ロケット入門”(東京大学出版会,2003).

(3) 高野忠,小川明,坂庭好一,小林英雄,外山昇,有本好徳: “宇宙通信および衛星放送”(コロ

ナ社,2001).

(4) 小紫公也,荒川義博:“ホールスラスタの性能とプラズマ加速過程”,日本航空宇宙学会

誌,第 40巻,第 465号,pp.46-53,(1992)

(5) 荒川義博, 小紫公也, 平川美晴: “ホール推進機”, 日本航空宇宙学会誌, Vol.46, No.530,

pp.146-153, (1998).

(6) 弓削政郎,白崎篤司,田原弘一:“ホールスラスタの推進効率および内部効率に与える

磁場特性”,日本航空宇宙学会論文集 Vol.55,No636,pp.8-16,(2007).

(7) 高村秀一:“プラズマ理工学入門”(森北出版株式会社,1997).

(8) 大須賀弘行:“宇宙電気推進機システムの制御に関する研究”(2012).

(9) 矢川元基:“ニューラルネットワーク”(培風館,1992).

(10) William W.Lytton:“From Computer to Brain”(Springer,2002).

(11) 中村祐輔,北村健太郎,徳光政弘,石田好輝,亘慎一: “ニューラルネットワークによる静

止軌道の電子フラックス予測”,宇宙航空研究開発機構特別資料,(JAXA-SP-09-

006,2009).

(12) 熊沢逸夫: “学習とニューラルネットワーク”,(森北出版株式会社,1998).

(13) 岡谷貴之:“深層学習”(講談社,2015).

(14) Pedro Ponce-Cruz, Fernando D. Ramírez-FigueroaPedro:“Intelligent control systems with

LabVIEW”(Springer,2010).

(15) Robert H.Bishop著; 長尾高弘, アスキーハイエンド書籍編集部訳:“LabVIEW2010プ

ログラミングガイド”(アスキー・メディアワークス,角川グループパブリッシン

グ,2011).

Page 49: 深層学習によるホールスラスタの制御art.aees.kyushu-u.ac.jp/publications/2015/B_fuchigami.pdf · 深層学習によるホールスラスタの制御 氏 ¡ 淵上 太貴

謝辞

初めに貴重な研究の場を与えてくださった山本直嗣准教授に深く感謝致します。また、

ミーティングの際に多くの知識や示唆を頂いた中島秀紀名誉教授、研究に関する議論を

通して様々な助言を頂いた森田太智助教授、研究室の紅一点であり明るく支えて下さっ

た馬渡隆子秘書に深く感謝致します。

研究室では流しそうめんをするために竹を切りに行ったり(終ぞ流しそうめんをする

には至らなかったのが心残りです)、毎週のようにサッカーやソフトボールに汗を流し

たり、その甲斐あってソフトボール大会で準優勝を果たしたり、大寒波の折にかまくら

を作ろうとしたり(これも完成には至らず残念です)と楽しい毎日を過ごすことができ

ました。このような充実した日々を与えて下さった李後毅氏、齋藤直哉氏、奥田雄氏、

牛尾康一氏、川島諒祐氏、高瀬紘平氏、中野和彦氏、山口敦氏、市丸智裕氏、飯島健介

氏、上野文輔氏、江川雄亮氏、枝本雅史氏、三浦智之氏に深く感謝致します。また、同

じ学部生として共に支えあった板谷佑太朗氏、岩本政隆氏、川原友太郎氏に深く感謝致

します。

最後に、大学受験の際も白髪まで増やして私のことを思いやってくれた母、私の身の

回りのことを案じ、こまめに連絡をくれ安心させてくれる父、悩みや相談を聞いてくれ

た兄弟に心のから感謝いたします。