ブロックチェーンの技術を使用した、...

61
Q2 2018 ブロックチェーンの技術を使用した、 新たな AI クラウドコンピューティングサービス

Upload: others

Post on 22-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

Q2 2018

ブロックチェーンの技術を使用した、新たなAIクラウドコンピューティングサービス

Page 2: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

目次1. 理念と使命 .............................................................................4

2. 序論 ......................................................................................5

2.1AIgatha とは? ...............................................................6

2.2AIgatha のコアバリュー...................................................7

2.3AIgatha の目標 ...............................................................7

2.4 ビジネスニーズとソリューション .......................................9

2.4.1 デジタル通貨鉱業の現状.......................................10

2.4.2 ビッグデータの現状:科学への応用 ........................11

2.4.3 平行分散コンピューティングの課題 ........................12

2.4.4 クラウドコンピューティングに潜む脅威..................13

2.4.5 人工知能の限界 ...................................................14

2.5 技術概要.......................................................................15

2.6 スマートコントラクト .....................................................19

2.7 関連技術(Github,iMLOvシステム )................................19

2.8 私たちは世界に何をもたらすのか.....................................20

3. AIgatha テクノロジー ............................................................21

3.1 分散コンピューティングサービス(DistComp@Home).........22

3.2DistComp(API)..........................................................24

3.3AIプラットフォーム .......................................................25

3.4iMLOv予測結果グラフ ...................................................27

3.5iMLOvウェブサービスインターフェイス ...........................29

Page 3: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

4. 技術開発ロードマップ .............................................................30

4.1LUCA...........................................................................31

4.2Pangu..........................................................................33

4.3IChing.........................................................................37

4.4Xirang.........................................................................40

4.5 ユーザインタフェース .....................................................42

5. 過去の応用事例 .....................................................................45

5.1 タンパク質構造比較アルゴリズム .....................................46

5.2CPred..........................................................................48

5.3CirPred........................................................................50

5.4imSuper......................................................................52

付録 A:人工知能の応用事例 .......................................................54

例 1:タイタニックの生存予測.............................................55

例 2:乳癌ウィスコンシン(オリジナル)データセット .............56

例 3:心筋梗塞患者の死亡率 ...............................................57

付録 B:iMLOv ........................................................................58

Page 4: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

4

一つ一つの夢やアイデアを実現することで、世界が良くなる。私たちはそう信じている。

使命 MISSION人々の夢やアイデアを実現し、文明の進歩を促進するのは私たちの使命

である。私たちはブロックチェーン技術を用いて、分散処理ができるAIプラットフォームを開発した。アイデア自体を考え出した方だけではなく、計算資源を提供した方も、プラットフォームを開発した方も合理的な報酬と成果得られる。すなわち、このシステムで、相互利益をもたらせる協力関係を構築することができる。

理念 VISION私たちの目標は分散コンピューティングや人工知能分野の大手ブランド

となり、個人や企業に強力な技術サポートを提供することだ。

1. 理念と使命

Page 5: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

2.序

Page 6: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

6

2.1 AIgatha とは?「Algatha」 は映画『マイノリティ・リポート』(TheMinority

Report)のアガサ(AgathaLively)にちなんで名付けられた。『マイノリティ・リポート』の世界では、プリコグ(precog:precognitive、予言者)と呼ばれる殺人予知システムによって、あらゆる犯罪行為を防止することがてきる。この殺人予知システムは 3人の予知能力者たちで構成されたものであり、その予知結果に従い、予防的治安維持機能を遂行することができる。アガサはその中に一番能力が強い能力者であり、民衆にも愛されている。

「Algatha」チームには予知能力者がいないが、人工知能研究において経験豊富な開発者が集っている。人工知能の技術で映画のように犯罪を予知することもできるが、Algatha の目標はそれに限られない:Algatha は人工知能の技術であらゆる困難を乗り越え、素晴らしいアイデアを実現することをサポートしたい。

今現在、人工知能の発展と応用は専門的な知識や特定の高価なハードウェアに依存する。そのため、科学技術資源は少数の研究機関や財団に集中していて、不平等な分配が見られる。

素晴らしいアイデアの実現は膨大なデータ演算や高価なハードウェアなどで足を止めるべきではない。「Algatha」のプラットフォームを使用することで、どなたでも問題を解決するために研究開発することができる。「Algatha」で、人工知能はただのスローガンや、少数の人しか使えない専門的な技術から、日常生活でのあらゆる問題を解決できる素晴らしいツールに変わる。どなたでも「超能力者」になれる。

Page 7: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

7

2.2 AIgatha のコアバリューAIgatha のチームは、システム設計と開発理念について、以下の 3点を重視する:

資源の平等科学技術資源をより平等に分配することで、アイデアの実現は高価なハードウェアや計算資源の制約を受けなくなる。

個人を重視AIgatha はどなたでも簡単に使える分散コンピューティングAI プラットフォームである。専門の技術サポートなしで、迅速にアルゴリズムを開発することができる。解決したい問題を正確に分析し、結果を予測することもできる。初心者でもプロの相手と張り合える。

簡単かつ実用的AIgatha は簡単なシステム、シンプルなインターフェースと実用的な機能を重視する。

2.3 AIgatha の目標文明と技術の進歩には、創造的なアイデアが必要なのだ。しかし、労働の細分化と不平等な資源の分布により、アイデアを実現するための資源を取得することは複雑で大金がかかることになった。誰でもアイデアを生み出せるが、しかし、そのアイデアを実現し、ビジネスチャンスを掴めるのは最初に十分の資源を集められる人のみなのだ。一方、文明と地球市民意識の進歩に伴い、エネルギー、食料、気候、環境保護、疾患などの問題への関心が高まっていた。高い理想を持つ方の素晴らしいアイデアを実現するため、充分なリソースが必要なのだ。

Page 8: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

8

分散コンピューティングと人工知能技術こそがアイデアを実現できる重要な技術である。しかしながら、現在ではGoogle や Amazon や Facebookなどの数少ないのグローバル企業や専門の科学研究所にしか優れたコンピューティング能力を備えるハードウェアとソフトウェアを所持していない。個人や中小企業は資源不足のため、絶好のチャンスを逃すことしかできない。

私たちは誰でも自力で研究し、開発し、アイデアを実現することもできる世界を作りたい。人々の生活の質を向上させ、地球の文明の進歩を促進する助力になりたい。

AIgatha のチームはブロックチェーン技術で、誰でも簡単で効率的で安全に使用できる分散処理人工知能プラットフォームを構築することに専念している。このプラットフォームで、どなたでも簡単にアイデアを実現できる。なお、ブロックチェーン特有のリソース共有メカニズムで、誰でも様々な問題を解決することができる。また、創造的な問題解決策を持っていなくても、採掘者(マイナー)として計算資源を提供することができる。AIgathaのシステムで、マイナーたちは実際的な収益をもらえるだけではなく、世界の進歩に大きく貢献することができ、他には比べない達成感を味わえる。

AIgatha は DistComp@home という分散コンピューティングシステムと、iMLOv という人工知能プラットフォームで構成された。長年にわたり開発されたDistComp@home と iMLOv システムはすでに様々な科学研究分野で実用化されている。iSARST をはじめ、CPSARST、DS-SARST、CPred、CirPred、imSuper などの研究プログラムが例として挙げられる。AIgathaは長年培ってきた技術力をブロックチェーンの分野までに拡張し、個人の方に向けたサービスを提供する。蟻の思いも天に届く、一歩一歩地道に進むことで大きな進歩を遂げると私たちは心からそう信じている。

Page 9: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

9

2.4 ビジネス上のニーズや弱点現在、ブロックチェーンが話題となり、ブロックチェーンの開発応用も数

え切れないほどあった。しかし、ブロックチェーンに分散コンピューティングと人工知能を完璧に組み合わせて構成したAIgatha は前代未聞のシステムである。AIgatha は特有の技術で多様なビジネスニーズに、最適なソリューションを提供する。以下はビジネスニーズに対するソリューションについて紹介いたします。

Page 10: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

10

2.4.1 デジタル通貨鉱業の現状ビットコイン(英 :bitcoin)はサトシ・ナカモト(SatoshiNakamoto)

によって、ブロックチェイン技術に基づいた暗号通貨のことで、現実世界において最も知名度と価値を持つ暗号貨通である。コンピュータでコンピューティングをできれば、誰でもすぐに「ビットコイン・ネットワーク」に参加することができる。このような行動は「マイニング(採掘)」と呼ばれる。デジタル化された通貨を稼働させて、ブロックチェーンを維持する人はマイナーと呼ばれる。マイナー達は計算能力を提供することで、ビットコインのトランザクションが検証され、公開元帳に記録される。

現時点では、ビットコインマイニングにかかった消費電力は 162 カ国の単年度の総電力消費量を超えました。「BitcoinEnergyConsumptionIndex」の統計によると、12 月 19 日までの一年間に、ビットコインマイニングの総電力消費量は世界全体の電力消費量の 0.16%も占めて、35.14TkWhに達した。この数値は 320 万のアメリカ一般家庭の総電力消費量と同等とみなされる。ビットコインマイニング総電力消費量を一つの国のエネルギー消費量だと例えすると、この国のエネルギー消費量は世界で 59 番目に多い。さらに、ビットコインマイニングのエネルギー消費量の月平均成長率が 30%だと仮定すると、2020 年 2 月までのエネルギー消費量は現在の世界の総電力消費量 22383TkWhに超える。すなわち、このままでは世界は2020 年代初頭に電力供給危機に直面するのだ。

今まで、マイナーたちはブロックチェーンを維持するためだけで、大量の計算資源とエネルギーを消費したが、AIgatha はブロックチェーンに新たな価値を提供することで、マイナーと世界の架け橋を作れるのだ。

Page 11: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

11

2.4.2 ビッグデータの現状:科学への応用近年、科学技術の進歩により、ハードウェアデバイスの開発が進められ、グラフィックスプロセッサ(GPU)のエネルギー消費率と価格 /性能比がはるかに良くなった。そのため、一部の CPUは徐々にGPUに置き換えた。分子動力学のシミュレーションも高性能コンピューティングシステムの進歩により、大きな進歩を遂げた。しかし残念ながら、どの国でも、どの分野でも、世界有数の研究ユニットにしか、このような高性能コンピューティングシステムを所持していない。

10 数年前、カリフォルニア大学バークレー校(英語 :UniversityofCalifornia,Berkeley。以下、UCバークレー)コンピュータサイエンス学科はすでに BerkeleyOpenInfrastructureforNetworkComputing(バークレーオープンインフラストラクチャフォーネットワークコンピューティング。以下、BOINC)という分散コンピューティングシステムを設立した。その目的はアイドルコンピュータの計算資源を集まり、膨大な計算を分散し、科学的問題を効率よく解析するためだった。しかし、ボランティアには実質の収益をもたらさないため、10 年も経っても BOINC は高い計算能力をもっているとは言いがたい。

Page 12: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

12

一方、デジタル通貨の取引はマイナーたちに実質の収益をもたらすため、大勢のマイナーを集めたのだ。ビットコインを例にとると、その計算能力はなんと BOINC の 565 万倍もあるのだ。AIgatha はブロックチェーンに分散コンピューティングプラットフォームを設立することで、計算資源を各分野のビッグデータ分析や科学研究に移し、人類文明の進歩を促進できる。

分散コンピューティングシステムの開発には、自力開発が困難、開発コストが高い、高性能のハードウェアの購入が必要、計算資源が不足などの課題に直面している。

たとえば、個人や研究室には相応なプログラミングの腕を持たないと、ApacheHadoop や ApacheSpark などのソフトウェアスイートを使用しても、分散コンピューティングシステムを構築できない。金と時間をかかっても、技術的な壁を乗り越えがたい。更に、充分の計算能力を提供するため、大量のコンピュータや設備を購入できる資金も一難問である。中小企業では、技術的な壁を乗り越えたとしても、データ量や計算の複雑さが増す一方、設備のメンテナンスや交換、購入し続けるのも難しい。そのため、自力開発のリスクが高く、多額の資金が必要とするであろう。

2.4.3 平行分散コンピューティングの課題

Page 13: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

13

2.4.4 クラウドコンピューティングに潜む脅威近年、Amazon、Google、IBM、Microsoft などの企業はクラウド・コンピューティング産業で競合している。クラウドコンピューティングを使用するのは非常に便利だが、クラウド導入にはいくつの落とし穴がある。

情報漏洩社内の機密情報はサービスプロバイダに保存されたが、そのセキュリティシステムを把握できない。特許侵害、データの不正使用、盗用、複製などの、会社の利益を害することが発生しかねない。

依存関係外部企業の機器や設備、装置なのを利用し、IT システムを構築する場合に、ITリスク(Informationtechnologyrisk)の管理は困難である。なお、業務委託契約を解除した際に、旧システムからの移植も厄介な問題である。

サービス料金企業が市場競争力を維持し、より強化していくために、新しい機器や設備を購入することとソフトウェアを開発することが必要である。その建設・保守費等の費用にあてるため、クラウドコンピューティングのサービス料金も比較的高価となり、少量使用のユーザーには極めて不利である。

Page 14: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

14

近年では、人工知能が話題となり、様々な分野の企業や事業者も人工知能の重要性を認識した。しかし、人工知能を取り入れたハードウェア・ソフトウェアおよびサービスはまだ完璧とは言えない。ハードウェア開発の観点から、新興企業が人工知能アプリケーション用のカスタムチップを製作したり、特殊なハードウェアを設計したりしたい場合は、商品化するまでには数年もかかる。汎用チップを設計する場合は、チップの性能は大企業の産品より悪いため、大企業相手との競争には勝てない。ディープラーニング(DeepLearning)などのアルゴリズム開発で使用される場合には、大量の並列コンピューティングが必要なので、過多の電力を消費する傾向がある。

一方、ソフトウェア開発の観点から、充分の計算能力を確保するためにハードウェアや設備とプログラマが必要であり、技術的な壁を乗り越えがたい。個人または小規模のR&Dチームには過多な負担がかかる。クラウドサービスを使用する場合、マイクロソフトやGoogle などの大企業が提供した人工知能アプリケーションは通常、大企業向けの支援を提供しており、個人、ラボ、中小企業向けのカスタムサービスを提供していない。マイクロソフトの音声アシスタントCortana の開発責任者として 10年間勤めた杜奕瑾は、マイクロソフトやGoogle などの大企業は、10 億ドル規模以下の市場にサービスを提供しないと述べた。

そのため、AIgatha は資金面・技術面の支援が足りない、独自で人工知能アルゴリズムを開発したい方に、使いやすい人工知能サービスプラットフォームを提供する。どなたでも、ビッグデータ分析や予測を簡単に実行できるようになる。開発コストを大幅に節約し、経営で行う意思決定のスピードと正確性を大幅に上げられる。

私たちは市場の既存の問題を深く理解し、解決策として、新たなシステムアーキテクチャを提案する。

2.4.5 人工知能の限界

Page 15: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

15

2.5 技術概要AIgatha の各段階

第 1段階:LUCA と Pangu 同時に、ブロックチェーンに分散コンピューティング・プラットフォーム(DistComp@home)を設立する。ブロックチェーンにマイナーの情報とプロジェクトのタスクの割り当てを記録する。ユーザーは簡単な API を通じて、サービスプラットフォームにアクセスし、プロジェクトをサーバーにアップロードするができる。マイナーは計算資源を提供することで利益を得ることができる。

第 2段階:IChing。分散コンピューティングプラットフォームで人工知能サービスプラットフォーム(iMLOv)を構築し、ソフトウェア開発者とユーザーに提供する。ソフトウェア開発者はプラットフォームで開発したAI アルゴリズムのテストと販売ができる。ユーザーはプラットフォームで自分の問題に適したアルゴリズムを見つける。なお、どのアルゴリズムを使用しようかに迷ったとき、Algatha は共通のアルゴリズムで予測サービスを提供する

第 3段階:Xirang。プロジェクト向けアプリケーション。AIgatha チームは、分散コンピューティング人工知能プラットフォームを使用し、社会全体に持続的な利益をもたらすプロジェクトを進める。例えば、抗体構造予測システムを設立し、製薬会社や医療研究機関を提供することで、試行錯誤の回数を減少させ、製薬のためのコストと時間も減少させることができる。

Page 16: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

16

AIgatha システムアーキテクチャ:

AIgatha は、ブロックチェーン技術を用いて、分散処理ができるAI プラットフォームである。AIgatha は DistComp@Home という分散コンピューティングプラットフォームをブロックチェーンに介して、APIユーザーにアクセス権限を与える。ユーザーはアルゴリズムの開発やプロジェクトの計算やプロジェクトのデータをサーバーに供給することなどができる。

さらに、分散コンピューティングプラットフォームに、シンプルで使いやすい人工知能プラットフォーム(iMLOv)を構築する。iMLOv は十分なデータを収集し、計算することで、重要なパラメータを得られ、さらなる予測精度の向上を追求することができる。開発者は開発者用の iMLOv で人工知能アルゴリズムのテストや、人工知能アルゴリズムで多くの問題の解決策を見つけることができる。なお、このプラットフォームで開発した人工知能アルゴリズムを販売することもできる。なお、AIgatha チームは、人工知能プラットフォームに、抗体構造予測システムを設立することで、試行錯誤の回数を減少させ、製薬のためのコストと時間も減少させることができる。

Page 17: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

17

AIgatha のネットワークアーキテクチャ:

AIgatha ネットワークアーキテクチャには、ユーザー、マイナー、およびクロノス要塞(ChronosFortress)が含まれている。

AIgatha システムアーキテクチャは、3つ並列構造で構成される。一つ目はユーザとマイナーより構成されたアプリケーション層であり、二つ目はクロノス要塞サービス層であり、三つ目はブロックチェーンの記録層である。

ユーザーとマイナーは隣接するクロノス要塞でブロックチェーンにアクセスする。トランザクションといえば、一般では暗号通貨の所有権移転と取引のことを指すが、AIgatha では暗号通貨の所有権移転と取引の情報の代わりに、計算したいデータ情報を使用する。

ユーザーがクロノス要塞にプロジェクトをアップロードすると、クロノス要塞はすべての情報(プロジェクト番号、タスク番号、プロジェクトのクライアント情報、プロジェクトの説明、プロジェクトのファイルサイズ、アップロード日付)を記録する。プロジェクトが数個タスクに分割され、マイナーに分配される。タスクの行き先などの詳細情報もブロックチェーンに記載される。ユーザーとマイナーたちの行動はすべてブロックチェーンに記録されたのため、どのタスクがどのマイナーによって計算されたのか誰でも簡単に把握できる。

Page 18: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

18

ユーザー:AIgatha プラットフォームで分散処理のプロジェクトコードを作成できる。隣接するクロノス要塞にプロジェクトデータをアップロードすることもできる。

マイナー:コンピュータにアプリケーションをインストールし、インターネットに接続することで、近くのクロノス要塞に参加できる。コンピュータの情報を要塞にアップロードすることで、要塞から任務を受けことや、ブロックチェーンを維持することができる。

同じタスク情報を所有する要塞数が 2つ以下と判断した場合に、クロノス要塞は自身が持つデータを隣接するノードにバックアップする。これは、クロノス要塞のエラーによるデータの損傷の防止するために行われる。

情報を同期ノードを探知

クロノス要塞

Page 19: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

19

クロノス要塞:ユーザーとマイナーをブロックチェーンに接続するサーバー(ノード)である。タスク情報の更新、タスクの割り当て、プロジェクトの必要な総計算量の評価、マイニングの進行状況のモニターする、計算結果を統合、作業証明の検証、ブロックチェーンの履歴レコードを更新することなどができる。ユーザーデータの安全性とプライバシーを確保するために、将来、ユーザーがクロノス要塞にプロジェクトファイルをアップロードする前に、ユーザー端未でデータを暗号化し、安全に送受信できる転送パッケージを作成する。

詳細な内容はビジネスホワイトペーパー(AIgathabusinessoverview)をご参考ください。

スマートコントラクトのルールとソースコードの詳細は Githubウェブサイトに掲載されましたので、ご活用ください。なお、AIgatha の最新情報はコミュニティメンバーにお届けしますので、ぜひAIgatha コミュニティに登録してみてください。

2.6スマートコントラクト

DistComp@homeGithub のウェブサイト

現在、iMLOv システムはアカデミック・サーバーに設立したため、アクセスできません。AIgatha の技術とコアバリューについてもっとよく理解できるように、AIgatha はテスト用のAI 会話型プラットフォームを提供します。こちらをご覧ください。テストデータがある場合は、お気軽にチームにお問い合わせください。

2.7 関連技術 (Github, iMLOv システム )

Page 20: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

20

分散コンピューティンブロックチェーン

AIgatha は、分散コンピューティンブロックチェーンを個人単位で構築し、計算資源とAI ソリューションを提供する。個人をはじめ、研究ユニット、企業などのユーザーはAPI を使用して、アルゴリズムを簡単に開発できる。ハードウェアや設備に悩まされなくなり、問題解決にかかる時間も短縮できる。

さらに、ユーザーのプロジェクトの安全性を確保するために、ブロックチェーンのデータフローを公開する。マイナーはブロックチェーンを維持しながら、プロジェクトのコンピューティングをすることで、マイニングに付加価値を与える。

2.8 私たちは世界に何をもたらすのか

人工知能サービスプラットフォーム

私たちは人工知能の仕組みがわからないユーザーでも簡単に利用できる人工知能サービスプラットフォームを提供する。ユーザーは、シンプルなインターフェイスでデータをアップロードするだけで、サービスを通じてデータの重要な特徴値を見つけ、予測することができる。なお、人工知能サービスプラットフォームは、開発者にも開放されており、ユーザーは開発者自作のアルゴリズムを購入することで、より多様な解決策を選択することができる。

AIgatha の 各アプリケーション

抗体構造予測システムの開発を例として、AIgatha は既に抗体のアミノ酸配列の設計、抗体構造の予測などができるタンパク質骨格設計および構造予測システムを開発した。このシステムは、分子間結合能力を予測し、設計された抗体薬物が標的分子に対して高度に特異的であるかどうかを判断できる。

上記の技術で、私たちは人類抗体構造予測システムを立ち上がり、抗体薬物の開発を加速する。

Page 21: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

3.A

Igat

ha テ

クノ

ロジ

AIgatha は研究してきた特有の技術で、ブロックチェーンのアーキテクチャに分散コンピューティングと人工知能技術を完璧に組み合わせて活用できる。

Page 22: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

22

3.1 分散コンピューティングサービス (DistComp@Home)

分散コンピューティングサービスには、個人開発したものとネットワークサービスプロバイダによるクラウドコンピューティングの 2種類がある。個人開発の分散コンピューティングサービス(ApacheSpark など)を使用する場合、クラインアントをインストールするのも、システム上でプロジェクトの計算を実施するのも、ユーザーのハードウェアとソフトウェア知識および技術が必要とする。一方、Google、Amazon などのクラウドコンピューティングを使用する場合、クラウドシステムを自分のハードウェアに移植できないのは欠点である。

そのため、私たちはDistComp@Home というクロスプラットフォームの分散コンピューティング API を開発した。DistComp@Home で分散コンピューティングシステムのインストールやプロジェクトのプログラミング開発などを単純化できる。テキストベースのプログラミング言語さえわかれば、どなたでも使える。

また、私たちはミスト・コンピューティング(mistcomputing)と呼ばれる新しいクラウド・コンピューティング・アーキテクチャを開発した。既知のクラウド、フォグ、ミスト、スモッグコンピューティングと異なり、ミスト・コンピューティングはクラウドコンピューティングにおけるセキュリティ、プライバシー、派生依存性などの問題を解決した。ユーザーはブロックチェーン分散処理プラットフォームを使用するだけで、プライベートクラウド構築のコストと時間を削減できる。さらに、AIgathatechnology より提供した分散コンピューティングキット(サーバー、クライアントアプリケーション、ブロックチェーンと同じバージョンのユーザAPI のを含む)を使用するだけで、自宅のコンピュータにも接続できる。

Page 23: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

23

DistComp@Home ミストコンピューティングの基本構造と原理

DistComp@Home は タ ス ク ロ ガ ー(Tasklogger)、 サ ー バ ー(Servers)、ノード(Nodes)とクライアントAPI(ClientAPI)によって構築された。これらのサブシステムはAIgatha のブロックチェーン分散処理システムのブロックチェーン(Blockchain)、マスターノード(Masternodes)、マイナーノード(Minernodes)、クライアント API(ClientAPI)にそれぞれ対応している。ユーザーは API を介して分散コンピューティングのソースコードとデータをサーバーにアップロードすることができる。タスクはサーバーから各ノードに分配される。各ノードは計算結果をサーバーに返す。最後はサーバーで計算結果を組み合わせてユーザーに返す。この過程はすべてタスクロガーより管理、記録される。

DistComp@Home の応用事例

AIghtha チームはDistComp@Homeを使用し、タンパク質構造生物学の問題に関する科学計算システムを開発した。iSARST システムは 2009 年に設立した以来、世界最速のタンパク質構造比較のアルゴリズムとみられる。(5.1 章を参照 )CPred は 2012 年以来、世界で最も正確で高速な計算できるプロテインリング構造再編成位置解析システムである。(5.2 章を参照 ) 公開準備中の imSuper と CirPred は世界最速の二次構造予測ツールと循環置換タンパク質構造予測ツールである。(5.3、5.4 章を参照 )。

Page 24: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

24

3.2 DistComp アプリケーションプログラミングインタフェース(API)AIgatha 分散コンピューティングサービスにはグラフィックAPI とプレーンテキストモードAPI が付属している。シンプルなプロジェクト開発環境を提供し、簡単にプログラムできる。

PHP(PHP:HypertextPreprocessor)で 1 から 100 までの数値を 10個のグループに分け、各数値の 3乗を計算し、コンピュータ画面に表示するプログラムを作成したいとき、AIgathaDisCompAPI を利用しない場合は以下の通り:

複雑なネスト構造と分散コンピューティングのロジックをよく理解し、高いプログラミングスキルが必要とする。ただし、AIgatha の DisCompAPIを使用する場合はただ 2行のコードで、プログラミングの初心者でも簡単に作成できる:

Page 25: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

25

分散コンピューティングプログラムを単純化し、システム開発のコストと時間を大幅節約することができる。専門家や大企業ではなくでも、問題を解決し、ビジネスチャンスを掴め、収益をもたらすことができる。

3.3 AI プラットフォーム機械学習(machinelearning)はデータにもとづいて予測や判断を下すのに役立つ技術であり、ビッグデータ分析や人工知能分野における重要な技術でもある。

この高度情報化社会では、爆発的に増加するデータ(タンパク質構造データ、画像分析データ、化合物の同定・定性分析データ、公衆衛生データなど)をいかに活用するかのは生物学者と医学者の新たな課題となっている。機械学習によって、強力かつ効率的なものが開発できる。

しかし、ほとんどの機械学習ソフトウェアやシステムでは、ユーザーはシステムの操作やコマンド環境に精通し、プログラミングで入力と出力を処理し、アルゴリズムの詳細とパラメータ設定を理解しなければならないのだ。結果として、複雑な問題を解析するのは困難で、対策までたどり着けないことがほとんどである。そのため、私たちはプログラマーじゃなくでも、機械学習を簡単に使えるユーザーインターフェイスを作成した。

Page 26: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

26

誰でも機械学習を利用できると、すべての分野における興味深い発見をすることも、技術の向上を実現することもできる。私たちはデシジョンツリー分析、サポートベクターマシン、ニューラルネットワークとランダムフォレストを組み合わせ、機械学習システム iMLOv(integratedMachineLearningandOptimizationserver)を開発した。さらに、ユーザーはAIgatha のアルゴリズムを通じて重要パラメータを検出できる。ユーザーは「答え」だけではなく、その「理由」もわかる。

私たちは既にタンパク質構造生物学の分野で重大な進歩を遂げていた。循環置換(circularpermutation)やドメインスワッピング(domainswapping)などのタンパク質構造は伝統的な構造比較法を用いて同定するのは困難である。この難問に対して、私たちはCPと DS二種類の検出アルゴリズム(CPSARST と DS-SARST)を開発した。しかし、これらのツールを使用してデータベースを構築するとき、集中的な手動検査が不可欠である。私たちが CPと DS のデータベースを構築するときには 20,000 個以上のタンパク質のペアを検査した。そのため、私たちは面倒な手動検査の代わりに、iMLOv を導入した。iMLOv を導入した CPと DSシステムの平均精度について、CPSARST は 56.3%から 52.9%に(2376 個目標構造)、DS-SARSTは 26.4%から 70.0%に(2,628 個目標構造)増加した。iMLOv はデータベース検索後、各ヒットの確率を画面に表示する。研究者はその情報で結果の信頼性を判断できる。

Page 27: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

27

人工知能サービスプラットフォーム iMLOv は日常生活でのあらゆる問題でも解決できるツールである。人工知能はただのスローガンから、日常生活でのあらゆる問題でも解決できる素晴らしいツールに変わる。

3.4 iMLOv 予測結果グラフ初期の iMLOv は他のプログラムに機能を提供するライブラリである。新

バージョンではWebサーバーを通じて、マルチ人工知能アルゴリズムを使用し、予測モデルの作成やデータの分析や重要パラメータの選択などができる。iMLOv のグラフィカルユーザーインターフェイスでは複雑の操作やパラメータの設定など一切不要。データを集め、サーバーにアップロードするだけで予測結果を算出できる。

iMLOv は汎用的な人工知能サービスプラットフォームである。本システムはディシジョンメカニズムを介して各分野の問題には異なる人工知能システムを使用し、正確な判断を下すことができる。どんな問題でもかなり正確に予測できる。

iMLOv の二項分類の平均正解率は約80%から 90%であり、一部の分野では95%以上の正解率に達することができる。その汎用性を説明するため、iMLOv の一部の実例を以下に示す。データセットの関連情報はUCIrvineMachineLearningRepository から取得できる。他の応用事例は付録Aをご参照ください。

Page 28: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

28

例 1:アダルトデータセット

データセット名 AdultDataSet(アダルトデータセット)データセットの説明 1994 年の国勢調査データによる、いくつかのパラメータで、個人の年間所得が

毎年 50,000米ドルを超えるかどうかを予測する。システムの初期設定 システムの予測結果原始データ量 32561 計算時間 4840.49sトレーニングセットの数 21707 精度 86.5%テストセットの数 10854相互検証方法 N-foldcrossvalidation(N=3)グループ化方法 : Randomデータセットコンテンツの説明Class 2 income <=50K,>50KFeature 15 age 年齡education-num 教育時間 fnlwgt シリアル番号sex 性別(Female,Male) hours-per-week 1 週間あたりの労働時間capital-gain キャピタルゲイン capital-loss キャピタルロスrace 種族(White,Asian-Pac-Islander,Amer-Indian-Eskimo,Other,Black)education 教育程度(Bachelors,Some-college,11th,HS-grad,Prof-school,Assoc-

acdm,Assoc-voc,9th,7th-8th,12th,Masters,1st-4th,10th,Doctorate,5th-6th,Preschool)

marital-status 結婚歴(Married-civ-spouse,Divorced,Never-married,Separated,Widowed,Married-spouse-absent,Married-AF-spouse)

workclass 仕事のカテゴリ(Private,Self-emp-not-inc,Self-emp-inc,Federal-gov,Local-gov,State-gov,Without-pay,Never-worked)

occupation キャリア(Tech-support,Craft-repair,Other-service,Sales,Exec-managerial,Prof-specialty,Handlers-cleaners,Machine-op-inspct,Adm-clerical,Farming-fishing,Transport-moving,Priv-house-serv,Protective-serv,Armed-Forces)

relationship 関係(Wife,Own-child,Husband,Not-in-family,Other-relative,Unmarried)

native-country 国籍(United-States,Cambodia,England,Puerto-Rico,Canada,Germany,Outlying-US(Guam-USVI-etc),India,Japan,Greece,South,China,Cuba,Iran,Honduras,Philippines,Italy,Poland,Jamaica,Vietnam,Mexico,Portugal,Ireland,France,Dominican-Republic,Laos,Ecuador,Taiwan,Haiti,Columbia,Hungary,Guatemala,Nicaragua,Scotland,Thailand,Yugoslavia,El-Salvador,Trinadad&Tobago,Peru,Hong,Holand-Netherlands.)

Page 29: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

29

3.5 iMLOv ウェブサービスインターフェイスiMLOv のインターフェースは非常に使いやすい。ユーザーは iMLOv に

Excel や同種のソフトで作成された csv 形式のファイルをアップロードするだけで、システムを利用することができる。一般ユーザーはパラメータ設定を調整しなくても、ただ「次へ」をクリックすれば、システムを続行できる。出力ページには、結果を解釈するための説明文がついている。詳細な手順については、付録Bをご参考ください。

Page 30: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

4.技

術開

発ロ

ード

マッ

ブロックチェーン技術をはじめ、分散コンピューティングプラットフォーム、人工知能サービスプラットフォーム、抗体構造予測プラットフォームなどの AIgatha の技術応用の開発ロードマップを 4つの段階に分けて説明する。各段階では、AIgatha の理念とその仕組みについて詳しく述べる。

Page 31: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

31

4.1 LUCA「LUCA」、全名はLastuniversalcommonancestor であり、地球上

のすべての生命の共通起源を表している。「LUCA」は約 35 億〜 38 億年前に現れ、それから古細菌(アーキア)と細菌(バクテリア)などに進化して、様々な生物を生み出した。

Aightha の技術はすべて、ブロックチェーンを用いて分散処理を行うものである。そのため、私たちはこのブロックチェーンシステムのことを「LUCA」と呼ぶ。「LUCA」のアーキテクチャの詳細を以下に述べる。

ユーザー:ユーザー=消費者はトークンを支払い、AIgatha プラットフォーム上のすべてのサービスを使用できる。

開発者:AIgatha ブロックチェーンシステムでアプリケーションプラットフォームを開発、販売できる。

マイナー:AIgatha のプライベート・ブロックチェーンを維持し、プロジェクトの計算資源を提供し、作業証明(ProofofWork)を取得する。

Agigatha のブロックチェーンアーキテクチャは、パブリックチェーンをプライベートチェーンと組み合わせたハイブリッドシステムである。

ファ ン デ ー シ ョ ン とAIgatha マイナーによって、データの流れを維持し、管理する

Ethereum に基づいており、Ethereum のマイナーによって、大量の取引を維持する

コントラクトより作業証明をトークンに変換

Miners

Users/Developers

Page 32: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

32

AIgatha の初期ではトークンのトランザクションを処理するために、パブリックチェーンの Ethereumのスマートコントラストを使用した。プライベートチェーンは私たちが開発したブロックチェーンアーキテクチャである。このプライベートチェーンでは、科学計算のために計算資源を使用する。ほんの一部の資源はブロックチェーンの維持に使用する。プライベートチェーンにタスクの流れとその関連情報を記録している。

「LUCA」アーキテクチャには次の特徴がある:

1. パブリックチェーンをプライベートチェーンと組み合わせて構築したハイブリッドシステムにより、トークンの取引とプロジェクトの計算を分ける。

2. マイナーはブロックチェーンを維持しながら、プロジェクトの計算を行うことで、マイニングに付加価値を与える。

Ethereumは安定しており、多くのマイナーにより維持している。そのため、私たちは Ethereumのスマートコントラストをトークンの交換媒体として使用する。マイナー不足のせいでトークンの取引困難を避けることができる。

最後、私たちは 3年以内で AIgatha がブロックチェーンネットワーク維持およびプロジェクト計算のための計算能力を持っているかどうかを評価し、Ethereumからの独立を検討する。AIgatha が独立したブロックチェーンになる前に、マイナーはプライベートチェーン Ethereumで作業証明をAIgatha トークンに変換する。マイナーのために保留されたAIgatha トークンの割合と変換方法については、AIgatha ビジネス白書をご参照ください。

要約:AIgatha のプライベートチェーンを構築し、マイナーに作業証明を発行するステージは「LUCA」と呼ばれる。

Page 33: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

33

4.2 Pangu Pangu(盤古(ばんこ))は中国神話の神で、さまざまな神々の主であ

り、宇宙開闢の創世神である。天地間に存在する、数限りないすべてのものは Pangu の体と器官から変化したものであると言われている。この意味合いで、私たちはプラットフォームサービス構築の基礎となるこの段階のことを Pangu と名付けた。この段階では、ブロックチェーンに分散型コンピューティングシステムを

実装する。以下では、「Pangu」の詳細について説明する。

プロジェクトのデータを隣接するノードにアップロード。

プロジェクトをタスクに分割。

タスクをタスクプールに入れ、マイナーに浚渫される。

タスクプール:処理待ち。

ジョブ分割

コードのチェック

計算資源の消費量を評価

Page 34: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

34

マイナーがタスクを浚渫するたびに、サーバーはこの情報の流れをブロックチェーンに記録。

タスクの計算終了後、マイナーが計算結果をノードに返す。

サーバーはリターン記録をブロックチェーンに登録。

すべての計算結果がサーバーに返された後。

サーバーによって検証し、まとめた後、ユーザーに返す。

プロジェクトの完成記録をブロックチェーンに登録。

Page 35: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

35

ユーザー:AIgatha の API(詳細は 4.5 章を参照)で、コードを作成し、プロジェクトの計算を行う。AIgatha トークンを支払い、その計算結果を取得する。

マイナー:AIgatha マイナーインターフェース(詳細は 4.5 章を参照)でタスクプールにタスクを浚渫(Dredge)できる。本機の動作状況を計算して確認できる。なお、コンピュータの計算能力をよって、マイナーが確認できるタスクのレベルが分かれる。

クロノス要塞:AIgatha のサーバーとして、各ジョブ(job)を均等なタスクに分ける。まず、各プロジェクトに費やされる計算資源量を見積もり、ユーザーのウォレットからAIgatha トークンをロックし、タスクをタスクプールに入れる。マイナーはタスクをダウンロードして計算することができる。

「Pangu」の特徴を以下に示す:

1.プロジェクトの計算コストに応じて支払いのAIgatha トークン数を決める。各タスクは複数のマイナーにダウンロードされ、計算される。

2.同じのタスクは複数のマイナーに計算されることによって、タスクの戻り率(returnrate)があがり、計算結果の検証もできる。計算結果を得られる。

3.ブロックチェーンの特性によって、計算を行ったマイナーや計算のトータル時間など、タスクの流れを確実に把握できる。今までの分散コンピューティングサービスのブラックボックス操作(black-boxoperation)を解明できる。

4.ジョブ分割によって、マイナーは一部のデータを取得しても、プロジェクト全体の特性やデータを取得できない。クラウドコンピューティングの安全性問題を解消する。(2.3.4、3.1章を参照)

5.ミストコンピューティング(mistcomputing)は依頼性問題を解消する。(2.3.4、3.1章を参照)

Page 36: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

36

6.ホワイトリスト制である。システムにアクセスできるのはアイデンティティの検証をした利用者のみで、悪意のあるユーザーを防止することができる。

7.直感的なインターフェイスデザインとシンプルな分散型コンピューティングドッキングAPI で、ユーザーは簡単に分散型コンピューティングを使用し、問題を解決する。

今後の目標システム開発が成熟したのち、「AIgathaFoundation」はシステムのア

ップデートとメンテナンスのみを行います。今後の目標は以下の通り:

1. ユーザーたちは自分のコンピュータでジョブ分割できる。2. モバイル装置でもジョブ分割やタスクの分配をできる。3.AIgatha サーバーがなくても、ジョブを分割して分配することができる。タスクをマイナーたちのコンピュータに直接に送れる。4. 全世界でクロノス要塞を設置する。クロノス要塞はプロジェクトを独自処理する。5. 他の同種のサービスより「ユーザーのデータの機密性」を重視するため、プロジェクトファイルをアップロードする前に、ユーザー端未でデータを暗号化し、安全に送受信できる転送パッケージを作成する。ユーザーのプライバシーとセキュリティを保証できる。6. クロノス要塞は互いに情報を同期するため、単一のノードに損害があっても、ブロックチェーン全体の動作に影響を及ばない。7.SHA-3(SecureHashAlgorithm3)でプロジェクトとタスクを暗号化する。8.「Pangu」で大量なデータを処理する際には、オペレーティングシステムとハードウェア配置の変更や賃貸契約の締結などが不要。安心感と安定感があるプロジェクトコンピューティング環境を提供し、プロジェクトの発展に伴う様々なニーズにお応える。

「LUCA」に基づいて分散コンピューティングシステムを構築する段階は「Pangu」と呼ばれる。

Page 37: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

37

4.3 IChing『易経』(えききょう)は 7000 年以上の歴史を持ち、東洋最初の占い

方である。ドイツの哲学者ゴットフリート・ヴィルヘルム・ライプニッツ(GottfriedWilhelmLeibniz)は『易経』に関心をもっており、自らが 2進法の計算術を編み出していた。カール・グスタフ・ユング(CarlGustavJung)も「数千年にわたって先人の知恵を集まった『易経』には東洋の文化の精神を含めている。深遠な意味と無限のインスピレーションの源である。」と評価した。

この段階で、私たちはブロックチェーンに人工知能サービスを実装する。以下では、「IChing」の詳細について説明する。

ユーザー:AIgatha トークンを支払い、人工知能予測サービスを利用できる。(ビジネス白書 5.2 を参照)

開発者:開発した人工知能アルゴリズムをテストすることや、販売することができます。

マイナー:AIgatha マイナーインターフェース(詳細は 4.5 章を参照)でタスクプールにタスクを浚渫(Dredge)できる。本機の動作状況を計算して確認できる。なお、コンピュータの計算能力をよって、マイナーが確認できるタスクのレベルが分かれる。

クロノス要塞:AIgatha のサーバーとして、各ジョブ(job)を均等なタスクに分ける。まず、各プロジェクトに費やされる計算資源量を見積もり、ユーザーのウォレットからAIgatha トークンをロックし、タスクをタスクプールに入れる。マイナーはタスクをダウンロードして計算することができる。

Page 38: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

38

AIgatha 人工知能サービスプラットフォームは、以下の機能を備えています:

1. データフォームの作成が簡単:データをcsv形式に変換するだけで、AIgatha 人工知能プラットフォームのサービスを利用できる。2. 直感的なGUI:複雑な開発過程や背景知識なしでAIgatha 人工知能プラットフォームのサービスを利用できる。3. マルチ人工知能アルゴリズム:多種多様の人工知能アルゴリズムを使用し、予測結果をAIgatha 独自の技術で最適化された結果を示す。4. 予測モデルを提供:AIgatha 人工知能プラットフォームで作成した予測モデルをダウンロードできる。現在の問題状況に類似しているものを利用し、問題を解決できる。5. 強力なデータ分析:データマイニングと機械学習で、課題を効率よく解決し、優れたアプリケーションを作成する。製品化までに要する時間を短縮する。6. プライベートとセキュリティの保護:AIgatha 人工知能プラットフォームはデータだけで分析し、予測するため、データセットやパラメータの名前や説明(description)など一切不要。クロノス要塞ノードにはエッジ・キャッシュを行うことができる。AIgatha は秘密性と一貫性のある、スケーラブルな分散システムである。7. 重要パラメータを検出:ユーザーはAIgatha のアルゴリズムを通じてデータセットの重要パラメータを検出できる。ユーザーは「答え」だけではなく、その「理由」もわかる。8. 予測分析レポート:有料サービスでデータセットの高度な分析レポートを取得できる。レポートにはAIgatha 予測分析の技術情報や関連する既定値などを示す。

Page 39: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

39

AIgatha 人工知能プラットフォームの操作手順については Demowebservice の操作手順(付録 B)をご参考ください。ICOが終えた時点、ウェブサイトにおけるデータ解析デモサービス「Demowebservice(デモウェブサービス)」を提供開始いたします。csv 形式のデータをウェブサイトにアップロードすることで、分析サービスを体験できる。このバージョンでの一部機能(パラメータの設定や履歴データの上限など)についてはご利用に制限を設けさせていただいております。

今後の目標

1. 専用のまたは多様の人工知能アルゴリズムをプラットフォームに実装する。2. クライアント専用の理解しやすい人工知能開発環境を開発する。3. スケーラビリティを高める。4. より多くの人工知能アルゴリズムを実装し、ブロックチェーンで販売する。5. 開発者の計算資源として、ブロックチェーンネットワークと分散コンピューティングを使用する。6. 開発者が獲得できるトークンの総額を增加し、開発者の意欲を高める。より多くの問題に対処すできる。

「Pangu」に基づいて人工知能サービスプラットフォームを構築する段階は「IChing」と呼ばれる。

Page 40: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

40

4.4 Xirang 息壌(そくじょう、息壤)、中国神話に登場する土の怪物、あるいは魔法

の土である。神話に拠ればそれは自ら増殖する能力を有する。塵も積もれば山となる。世界中の人は誰でもAIgatha のサービスでアイデアを実現できる。ユーザー、開発者とマイナーは相互利益をもたらせる協力関係を構築することができる。

この段階では、既存のシステムに新たな予測プラットフォームを開発する。(AIgathaBusinessWhitePaper の 5.2 章を参照)一方、開発環境をさらに改善し、より多くの開発者の開発をサポートする。クロノス要塞を世界中に設置する。最終の目的を達成する。

AIgatha の技術は専門技術を普及する過程である。例えば、精密医療とは、各患者の個別の性質によって治療法を構築することである。個別の患者に特化した投薬(合理的に安全な投与量など)や医療機器を構築するため、患者個人の情報、性別、身長、体重、年齢、民族、血液型、遺伝子検査、代謝試験、過去の病歴、家族歴などを分析し、最適の治療法を判断する。この過程は専門の臨床検査と医師の臨床経験が必要とし、専門家でなければ困難である。

しかし、臨床の文献情報よりビッグデータ分析と人工知能を活用することで、潜在的な薬物と疾患の関係を網羅的に予測し、モデルを作成できる。すなわち、精密医療を普及できる。

AIgatha システムのは使い勝手を重視するシンプルな設計をした。どなたでもブロックチェーンのサービスを簡単に利用できると望んでいる。資源不足の個人や中小企業、小型研究ユニットなどはAIgatha のサービスで、開発時間とコストを大幅に節約できる。

Page 41: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

41

AIgatha の目標は、完璧なブロックチェーンシステムを作成することである。

1. 未解決問題はこのブロックチェーンで解決策を見つける。2. ブロックチェーンの特性で大量なデータを保存する。データソースの信頼性を高める。3. 大量のデータから鍵となるパラメータを判別する。4. 資源を集中し、技術進歩を促進する。5. プラットフォームを開放へ、独自アプリの開発が可能。6. フレンドリー、わかりやすいグラフィカル開発インタフェース。7. 開発者:ブロックチェーンの計算資源を利用でき、アルゴリズムの開発のみに力を注ぐ。8. ユ ー ザ ー:AIgatha ト ー ク ン を 消 費 し、 問 題 の 解 決 策 を取得できる。9. 個人や中小企業、小型研究ユニットなどの負担を軽減する。

2017 年は経済格差の最も大きい年である。そして、これからも経済的格差は拡大し続けるのだろう。私たちは誰でもAIgatha プラットフォームを利用することで、自分の理想と夢を叶えることを心から望んでいる。一つ一つの夢を叶え、人類がさらなる進化を遂げるのだろう。

Page 42: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

42

4.5 ユーザインタフェースAIgatha はユーザーの種類と権限(マイナー、開発者、ユーザー)によって、直感的なグラフィカルインターフェイス(GUI)を提供する。AIgathaクライアントシステムを使用するにはユーザーを認証する必要がある。クライアントアプリケーションの画面と説明を以下に示す:

図に示されているように、ユーザログイン画面には 3つのオプションがある:マイナー、一般ユーザーと開発者。

ユーザーは認証によってアカウントを取得すると、クライアントのシステムを使用できる。

Page 43: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

43

一般ユーザーとしてログインすると、図のようにウォレット情報を得ることができる。なお、ウォレット情報の表示に加えて、ウォレット機能を操作することもできる。

一般ユーザーはこのインタフェースで、現時点で開発完成のプロジェクトプラットフォームを把握できる。AIgatha の有料サービスでプラットフォーム機能を使用することができる。

Page 44: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

44

マイナーとしてログインすると、タスクプール(Primordialsoup)の現在の情報を取得できる。タスクプールには現在のノードに存在し、解決を待っているタスクが表示される。自動浚渫(AutoDredge)を選択することで、自動的にタスクを実行する。計算対象のプロジェクトタスクをクリックして、手動で選択することもできる。マイナーは右のタスクリストで現在実行中のタスクと処理待ちタスクの詳細を確認できる。

マイナーがタスクを完成した後、計算結果はクロノス要塞に転送され、マイナーは作業証明書(Workcertification)と計算報酬を得られる。詳細なプロジェクト計算情報は作業証明書に記録されます。

Page 45: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

5.過

去の

応用

事例

本章は AIgatha の研究成果を説明する。すべての応用事例は人工知能と分散コンピューティングのプラットフォームを使用に基づいており、生物医学分野の問題を解決したものである。

Page 46: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

46

5.1 タンパク質構造比較アルゴリズム (iSARST、CPSARST、DSSARST)新たなタンパク質構造を発見するため、タンパク質工学の開発をサポー

トするため、タンパク質の構造と分子進化の理解を深めるため、私たちは2009 に公開した iSARST サーバーの機能を強化した。

1. 新たな 3D構造交換検索アルゴリズムを統合する。2. 機械学習を利用し、データの品質の判断をサポートする。3. 分散コンピューティングシステム計算効率の向上。

このシステムは同族体や循環置換(circularpermutation)の同族体やホモログファミリーなどを識別できる。

計算速度も正解率も以前より大幅に向上した。このサービスはタンパク質に関する研究に支援する。最初の iSARST は同族体の識別システム SARSTと循環置換(CP)同族体識別システムCPSARSTの統合システムであった。

Page 47: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

47

iSARST は NFS環境のMPIタブでの最適化とデータのフィルタリングより設計された。そのため、iSARST は SARST や CPSARST などの検索エンジンと同等の計算速度を持ち、最適化エンジンFAST、TM-alignとSAMOと同等の正解率を持った。しかし、iSARST は初めての CP 同族体識別システムであるが、解析結果のスコアリングシステムがないため、ユーザーの手動検査が必要とする。さらに、データとユーザー数が急速に増す一方で、NFS ベースのシステムはもはや需要を満たすことができない。新しいiSARST は独自のメリットがあり、MySQL ベースの分散コンピューティングシステムと連携するとパフォーマンスと安定性も飛躍的に向上した。iSARST は最適化エンジンよりも高性能に加え、ヒットリストを元にスコアリングを行う。検証をサポートすることができる。

iSARST2017 の新しい成果はドメインスワッピング(DS)を検出すること。ドメインスワッピングは、多量体を作る機構である。ドメインスワッピングに関する大多数のタンパク質は、ブロック単量体とオリゴマーを持つ。ドメインスワッピングを理解することで、沈着症やバイオマテリアルのアセンブリの発展の力になる。伝統的な方法では識別しかたい。iSARST2017の DS 検出アルゴリズムの識別率は既存のアルゴリズムADiDoS の 56.3%よりも高く、70.0%となった。

iSARST2017 を利用する際には複数の蛋白質構造データバンク(PDB)構造データファイルを入力可能。iSARSTは豊使いやすいインターフェイスを提供し、目標タンパク質の同族体と可能の構造を表に示す。iSARST は最初のタンパク質同族体の構造比較サーバーである。iSARST2009 はすでに8年以上稼働しており、処理したリクエストの件数は 12,000 件を超えた。iSARST とそのアルゴリズムの被引用回数は 96 回であり、少なくとも 1つのデータベースと 1つのタンパク質検索エンジンは iSARST よって作成された。

Page 48: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

48

循環置換(circularpermutation)とは、タンパク質などがもつ本来のN・C末端を人工的なリンカーで連結させ、そのタンパク質内の新たな部位に始点・終点をつくり出す変異のことである。循環置換は通常、天然の構造および機能を保持しながら、安定性、活性または機能的多様性を増大させることができる。そのため、循環置換技術はタンパク質フォールディングの解明や酵素活性の強化や二官能性架橋の設計など、多くの分野で使用されている。循環置換タンパク質の作製の高いコストと可能性を考えれば、循環置換の始点、終点を予測するのは有利である。CPred が開発されたまで、最良の循環置換予測システムの感度について、DHFR(ジヒドロ葉酸レダクターゼ)データセットのAUCは 0.70 で、CPDB(循環置換データベース)の感度は 0.63 である。2012 年、タンパク質構造ベースのCPred の DHFRデータセットのAUCは 0.91 で、CPDBの感度は 0.72 である。

5.2 CPred

Page 49: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

49

私たちは三種類の機械学習技術を統合し、28 種類の配列の性質と予測された二次構造と動力学的特性に基づいて、配列性質ベースの CPred を開発した。文献のデータセット(陽性:陰性 =75:101)と CPDB の冗長性をなくした(non-redundant)データベース(1,059 陽性症例)でトレーニングとテストした。最後に、DHFR(陽性:陰性=76:83)とリパーゼB(陽性:陰性=63:33)のデータベースとCPDBの冗長性をなくしたデータベース (3)(4,765 陽性症例)で評価した。各評価データセットは、トレーニングデータセットと 40%以下のデータ共有します。

DHFRのAUCとMCCは0.83と0.60(感度=0.76;特異度=0.85)であり、リパーゼ Bの AUC とMCC は 0.72 と 0.52 であった。GDB の感度は 0.71である。この結果は構造ベースの近接アルゴリズムのパフォーマンスよりも高い。

タンパク質構造ベースのCPred がリリースされたから、CPred とそのアルゴリズムの被引用回数は 20 回であり、少なくとも 1つの人工酵素を作製した。配列性質ベースの CPred は既に実用レベルに達したため、循環置換の発展の力になると考えられる。配列性質ベースの CPred は 2015 年 7 月に新しいCPredサーバーに統合された。研究と教育の目的で、すでに5,000以上のタンパク質配列が利用された。

Page 50: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

50

5.3 CirPred

循環置換(circularpermutation)とは、タンパク質などがもつ本来のN・C末端を人工的なリンカーで連結させ、そのタンパク質内の新たな部位に始点・終点をつくり出す変異のことである。タンパク質フォールディングの解明や酵素活性の強化や二官能性架橋の設計など、多くの分野で使用されている。すべての残基が循環置換できるではない。なお、循環置換はタンパク質の置換、挿入、削除よりも複雑で、高価で時間がかかる。そのため、私たちは循環置換の予測システムCPred を開発した。

しかし、タンパク質の循環置換構造をモデリングする方法がないため、循環置換したタンパク質の活性または安定性(CPM)を予想できない。末端を連結するために添加されるリンカーの設計もできない。CirPred はタンパク質構造モデリング法(PS)、分子動力学シミュレーションソフトウェアMODELLERの GROMACS、AI 予測アルゴリズムと分散コンピューティング技術で開発された。

Page 51: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

51

CirPred には、3 つの動作モードがある。

1. 新たな 3D構造交換検索アルゴリズムを統合する。2. 機械学習を利用し、データの品質の判断をサポートする。3. 分散コンピューティングシステム計算効率の向上。

入力ページでは、ユーザーはタンパク質とCP構造を提供し、リンカーを設計した場合はモード 1を使用し、リンカー部とCP構造に加えて他の修飾がある場合、モード 2を利用するのは助力になるだろう。元のタンパク質から配列の 90%を変更しても、CirPred は依然として高品質のモデルを生成できる。リンカーが必要だが、リンカーの設計法を知らない場合、モード3でこの問題を解決できる。

出力ページには配列の可視化と分析ができるインタラクティブインターフェースを用意した。天然タンパク質と循環置換タンパク質との間のシーケンスアラインメントも提供する。モード 3では、30 の候補リンカーがそれぞれエネルギースコアで列挙される。アニーリングが無効の場合、任意のモードのリクエストは 3分以下かかる。CPDBの 4169 個循環置換ファミリーで評価し、CirPred のモデルと実際の構造の平均類似度とRMSDは 91.3%と3.35Å であり、配列同一性が 10%以下の CPMの平均類似度と RMSDは87.9%と 3.92Å である。

Page 52: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

52

imSuper は効率的なタンパク質二次構造予測システムを提供し、研究をサポートする。imSuperは一連のデータを迅速かつ正確に予測分析できる。独立した試験の正解率は 93.5%で、理論値を達成した。(トレーニング:500 種類のタンパク質;セッティング:CASP12 と TS115;同じデータセットまたはデータセット内の任意の 2つのタンパク質の同一性は 25%以下)imSuper は SSpro8、Spider2、DeepCNF などの 8個の SSP アルゴリズムで構成された。各アルゴリズムの予測結果を設計されたパラメータによってまとめて、機械学習で最後の予測結果を計算し、分散コンピューティングで計算を加速する。平均の実行時間は 1分以下。imSuper の正解率が一番高い、速度は同種の産品の数十倍以上である。SSP は応用の範囲が広い技術であるが、その正解率と計算速度は今までの課題となっていた。imSuper でSSP を強化し、応用の範囲をさらに拡大できると考えられる。

5.4 imSuper私たちはタンパク質二次構造予測ツール(imSuper)を開発しました。タンパク質二次構造予測(SSP)は、多くの用途(機能)をを有するものである。SSP は「古い」問題であり、既に多くの方法が開発されていたが、正解率と計算時間についてはまだ改善の余地がある。正解率 80%以上のシステムはほとんど存在しないし、典型的なタンパク質二次構造予測に数十分から数時間かかる。

Page 53: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

53

imSuper では FASTA形式のタンパク質配列を入力可能。DSSP によって定義されたQ8およびQ3形式を含む、2つのタイプの二次構造要素(SSE)をサポートする。出力ページにはタンパク質の二次構造のグラフィック表示だけではなく、残基と SSE の各要素に対応できる確率も提供する。クロスプラットフォームに対応しており、オペレーティングシステムのコマンドで利用できる。大規模な研究を行うユーザーに役立つ。

imSuper プロトタイプは、教育目的で 2017 年 2 月に設立されました。検索されたタンパク質の数はすでに 9000 種類に超えた。合計で 11 グループのユーザーが imSuper の利用とテストに参加した。

Page 54: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

付録

A:

人工

知能

の応

用事

この付録はAIgatah が iMLOv サービスプラットフォームを使用した人工知能の応用事例であり、29 ページの応用事例に続き、他の応用事例の結果である。

Page 55: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

55

例 1:タイタニックの生存予測

データセット名 PredictingSurvivalontheTitanic(タイタニック号の生存予測)データセットの説明 タイタニック号はオリンピック級客船であり、当時の最大の客船であったが、ヒュ

ーマンエラーが原因で、1912年 4月14日の23 時 40 分で氷山に衝突した。事件後2時間40分、船が半分に割れて、大西洋に沈んだ。死者数は1500を越えて、20世紀の最悪の海難事故と最もよく知られている。個人情報とフェリーチケットのデータで生存率を予測する。

システムの初期設定 システムの予測結果原始データ量 1313 計算時間 84.49sトレーニングセットの数 875 精度 80.34%テストセットの数 438相互検証方法 N-foldcrossvalidation(N=3)グループ化方法 Randomデータセットコンテンツの説明Class 2 Survived 生存(0:いいえ1:はい)Feature 9 Pclass 社会経済的地位

(1位:2位:中 3位)Name 名前 AGE 年齡

(1歳未満小数点あり)sex 性別(male:男female:

女)Fare 運賃

SibSp 兄弟、姉妹、配偶者の総数

Ticket チケット番号

Cabin コクピット番号

Page 56: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

56

例 2:乳癌ウィスコンシン(オリジナル) データセット

データセット名 BreastCancerWisconsin(Original)DataSetデータセットの説明 細胞試料の特性に基づいて、乳がん患者の腫瘍が良性か悪性かを判定する。ウィ

スコンシン大学マディソン病院-699人の乳癌患者の臨床例。システムの初期設定 システムの予測結果原始データ量 699 計算時間 2.47sトレーニングセットの数 466 精度 96.85%テストセットの数 233相互検証方法 N-foldcrossvalidation(N=3)グループ化方法 Randomデータセットコンテンツの説明Class 2 outcome 良性または悪性腫瘍

(0:良性 1:悪性)Feature 10 ClumpThickness クランプの厚さUniformityofCellSize 細胞のサイズ UniformityofCell

Shape細胞の形狀

MarginalAdhesion 細胞接着度 SingleEpithelialCellSize

単一上皮細胞のサイズ

BareNuclei 裸核 BlandChromatin クロマチンNormalNucleoli 正常核 Mitoses スプリットホルモン

Page 57: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

57

例 3:心筋梗塞患者の死亡率

データセット名 MortalityOutcomesforFemalesSufferingMyocardialInfarctionデータセットの説明 1981-1983 年間の心筋梗塞の患者1295 名を調査し、心筋梗塞の死亡率が増加

する活動や病気を判断する。システムの初期設定 システムの予測結果原始データ量 1295 計算時間 17.26sトレーニングセットの数 863 精度 80.08%テストセットの数 432相互検証方法 N-foldcrossvalidation(N=3)グループ化方法 Randomデータセットコンテンツの説明Class 2 outcome 生存(0:いいえ1:はい)Feature 9 age 年齡yronset 罹病年齢 premi 以前の心筋梗塞には水平

因子があるy、n、nk 知らない

smstat 喫煙状況と現在のレベル、x喫煙者、n非喫煙者、nk 知らない

diabetes 糖尿病 y、n、nk 知らない(y、n、nk)

highbp 高血圧y、n、nk 知らない hichol 高いコレステロールy,n,nk 知らない

angina 狭心症 y,n,nk 知らない

stroke 脳卒中 y,n,nk 知らない

Page 58: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

付録 B:iMLOv

Page 59: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

59

ユーザーは、下の図に示したようのCSVファイルを作成する必要がある。

サーバにファイルをアップロードすると、ファイルの基本情報が表示され、データのグループ化方法を選択できる。

Page 60: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

60

「次へ」をクリック。アルゴリズムの選択や、詳細パラメータの調整ができる。デフォルトをチェックすると、システムが自動的にパラメータを設定できる。

最後は、データと設定が正確だとを確認した後、プロジェクトを送信する。

Page 61: ブロックチェーンの技術を使用した、 新たなAIクラウドコンピューティング … · q2 2018 ブロックチェーンの技術を使用した、 新たなaiクラウドコンピューティングサービス

61

予測結果待ちページ

ユーザーは「予測(Prediction)」をチェックするのは、データでトレーニングし、人工知能のモデルを作成したうえ、この完成したモデルを使用し、問題の答えを求めるという意味である。結果ページを以下に示す。システムは各クラスの答え提供する以外に、各答えのプロバビリティも提示する。これらのプロバビリティを参考し、ユーザーはより正しい決定を下せる。将来のシステムでは、さらに特徴パラメータがどれくらい影響を与えたかを評価し、結果画面に示す。ユーザーは私たちのシステムで重要な特徴パラメータを選出することができ、その分野の専門家になれる。