株価予想

17
株価予想 2016-06-25 Masataka Nishimori

Upload: masataka-nishimori

Post on 08-Jan-2017

276 views

Category:

Technology


3 download

TRANSCRIPT

株価予想

2016-06-25Masataka Nishimori

Agenda

● 問題設定

● 先行事例紹介

● Deep Learningで予測

株価とは

株価とは、1株あたりの株の価格のことです。株式市場には株式会社が発行した分だけ株が存在し、投資

家の「需要(買い)」と「供給(売り)」の関係の中で価格が付けられています。

つまり、買いたい人よりも売りたい人が多ければ株価は下がり、売りたい人よりも買いたい人が多ければ株

価は上がるのです。

(株初心者に贈る株式投資入門より )

株価とは

株価とは、1株あたりの株の価格のことです。株式市場には株式会社が発行した分だけ株が存在し、投資

家の「需要(買い)」と「供給(売り)」の関係の中で価格が付けられています。

つまり、買いたい人よりも売りたい人が多ければ株価は下がり、売りたい人よりも買いたい人が多ければ株

価は上がるのです。

(株初心者に贈る株式投資入門より )

なんとか予測できるようにしたい!

問題設定

● 前日までの株価は既知

● 当日終値 < N日後終値(N=1,2,3,...)を予想

● 特定の銘柄ではなくS&P500など株価指数を予想する文献も多数[1,2,3]

NOTE: S&P500(エス アンド ピー ファイブハンドレッド、Standard & Poor's 500 Stock Index)は、アメリカ合衆

国の投資情報会社であるスタンダード・アンド・プアーズ社が算出しているアメリカの代表的な株価指数。ニュー

ヨーク証券取引所、NYSE MKT、NASDAQに上場している銘柄から代表的な500銘柄の株価を基に算出され

る、時価総額加重平均型株価指数(wikipediaより)

[1]. Ding, Xiao, et al. "Deep learning for event-driven stock prediction." Proceedings of the 24th International Joint Conference on Artificial Intelligence (ICJAI’15). 2015.[2]. Machine Learning with Financial Time Series Data on Google Cloud Platform[3]. Huang, Wei, Yoshiteru Nakamori, and Shou-Yang Wang. "Forecasting stock market movement direction with support vector machine." Computers & Operations Research 32.10 (2005): 2513-2522.

どれぐらいの正答率なの?

● 正答率

○ 約55% - 64%[1,2,3,4]○ びっくりするほど当たらないです.

● 実験

○ 終値の推移だけで予想すると55%ぐらい

○ テクニカル指標を特徴量に追加しても改善は見られず

● 傾向

○ 株価情報の外的情報を組み込めると正答率が上がりやすい

先行事例-1 (1/2)

● 問題設定○ S&P500(米)の前日終値 < 当日終値を予想

● 工夫○ 各株価指数の前日比の相関と取引時間の時間差を利用

○ 当日のDAX(独)やFTSE(英)の値動きとSP500(米)は似ていることを利用

● 特徴量○ 各株価指数の直近3日分の終値の前日比

● 手法○ 4層の全結合ニューラルネット

● 正答率

○ 72.2%!

[2]. Machine Learning with Financial Time Series Data on Google Cloud Platform

Machine Learning with Financial Time Series Data on Google Cloud Platform

先行事例-1 (2/2)

● 問題点○ おそらく買える間がない (上がるかどうか予想できない前日に S&P500を買う必要あり)

● 修正○ S&P500(米)の購入時点を前日終値から当日始値に変更

○ DAX(独)とFTSE(英)は当日終値ではなく当日始値に変更

● 正答率○ 56.17%(修正後)

[2]. Machine Learning with Financial Time Series Data on Google Cloud Platform

Machine Learning with Financial Time Series Data on Google Cloud Platform

先行事例2 (1/1)

● 問題設定○ S&P500の当日終値 < 翌日終値

● 工夫○ ニュース情報を利用

● 手法○ CNN(Deep Learningの一種)

● 正答率

○ 64.18%(state-of-the-art)

[1]. Ding, Xiao, et al. "Deep learning for event-driven stock prediction." Proceedings of the 24th International Joint Conference on Artificial Intelligence (ICJAI’15). 2015.

Deep Learning for event-driven stock prediction

提案 - CNNで株価予想

● 循環物色して次に上がりそうな銘柄を見つけられるか試してみる.

循環物色とは?

 株式投資に当たっては、投資家は常により良い投資対象銘柄を探し求め(物色し)、その対象は循環して

いくことが多々あります。物色対象は、上昇相場においては出遅れ銘柄が買いの対象になり、下落相場に

おいては下げ渋っている銘柄が売りの対象になります。また、上昇相場において、出遅れ銘柄あるいは出

遅れ業種が次々と買いの対象になったりします。このように投資対象銘柄が循環することを「循環物色」と

いいます。(マネー百科より)

循環物色とは?

 株式投資に当たっては、投資家は常により良い投資対象銘柄を探し求め(物色し)、その対象は循環して

いくことが多々あります。物色対象は、上昇相場においては出遅れ銘柄が買いの対象になり、下落相場に

おいては下げ渋っている銘柄が売りの対象になります。また、上昇相場において、出遅れ銘柄あるいは出

遅れ業種が次々と買いの対象になったりします。このように投資対象銘柄が循環することを「循環物色」と

いいます。(マネー百科より)

つまり「風が吹けば桶屋が儲かる」方式の銘柄があるらしい.

入力データ構造

● なんとかして循環物色するパターンを見つけたい.○ つまり銘柄同士の依存関係を解析させたい.

● 各種銘柄を画像のピクセルと考える.

● 各種特徴量をチャンネルとして追加.

特徴量- N日前の終値に対する

- 前日比- 移動平均- RSI- ...入力データ

銘柄A

銘柄B

CNN 銘柄Bの株価の変動を予測

出力データ銘柄の位置は固定で銘柄を敷き詰める.

なぜ敷き詰めるのか?

● 訓練データが大量に必要(数十万〜)○ 20年以上続く銘柄でも5,000件程度

● CNNの並進不変性を利用○ 24x24で並べてランダムに16x16に切り取って訓練データとする

特徴量- N日前の終値に対する

- 前日比- 移動平均- RSI- ...入力データ

銘柄A

銘柄B

CNN 銘柄Bの株価の変動を予測

出力データ銘柄の位置は固定で銘柄を敷き詰める.

実験結果

● 正答率○ 50 〜 55% (´・ω・`)

● 原因

○ ノイズが多すぎて循環物色するパターンを拾えていない.

● 改良できそうな箇所○ 敷き詰める銘柄の選び方

○ 相場よりも割安といった情報の特徴量への追加

結論

● 従来手法の方が精度良い

● 循環物色のパターンはノイズが多く解析が難しそう.

● 改良できそうな箇所

○ 特徴量をもうちょいまじめに考える.

○ 銘柄の並びをもっと考える.

● 精度が高くても,急落で利益が吹っ飛ぶこともあるので注意!

○ 例: LTCM,EU離脱

References

[1]. Ding, Xiao, et al. "Deep learning for event-driven stock prediction." Proceedings of the 24th International Joint Conference on Artificial Intelligence (ICJAI’15). 2015.金融ニュースを加味してCNNで予測.(state-of-the-art)

[2]. Machine Learning with Financial Time Series Data on Google Cloud Platform取引時間の差を利用したS&P500の変動予測

[3]. Huang, Wei, Yoshiteru Nakamori, and Shou-Yang Wang. "Forecasting stock market movement direction with support vector machine." Computers & Operations Research 32.10 (2005): 2513-2522. SVMで株価の動きを予測.

[4]. Madge, Saahil. "Predicting Stock Price Direction using Support Vector Machines."SVMを利用した株価予測