
第7回目の今回は、強化学習の凄さを実感頂こうと思います。
まずは以下のビデオをご確認下さい。英語が出てきますが気にせずに、1分42秒のビデオをご覧頂ければと思います。
強化学習を通し、人工知能(AI)がブロック崩しを賢く学習する様子が実感できます。
(なおスマートフォンでご覧の際は、スマホを横にしてご覧下さい。それでも上手く見れない際はこちらをクリック下さい。他社サイト(YouTube)に遷移します。)
(※他社サイト(YouTube)を参照しています)
強化学習の凄さ、MAiMATEとの対比
ここで、ビデオの「ブロック崩し」と「MAiMATE」を比較してみます。
比較項目 | ブロック崩し | MAiMATE |
開始前の事前の知識 | 何も無し。今から自分がブロック崩しをやることも知らない。 | 何も無し。今から自分がトレードをすることも知らない。 |
学習の始め方 | どこでボールをリリースするかはランダム。 | 買いから入るか、売りから入るか、何もしないかはランダム。 |
学習の目的 | 点数を高くする。 | 利益を多く出す。 |
進化の最終系 | 両端をこじ開けてボールを上に運べば、カンカンカンと点数を量産できることに気が付き、それを実現する技術を身に付ける。 | テクニカル情報とニュース情報がどのような場合に何をするべきか、AIが勝ちやすいと思うトレーディング手法を見出す。ランキング上位はまさに「ブロック崩しの両端突破」に到達している状況に近いと考えられる。 |
進化が上手に行かない場合 | ゲームには必勝法があるため、時間をかけて学習しさえすれば、必勝法に辿り着くことが期待できる。つまり、進化が上手く行かない場合は想定しづらい。 | トレーディングには必勝法が無いため、なかなか自信が持てる手法に辿り着けない場合がある。その場合は引きこもり型となる。 |
このビデオはGoogleが作成したビデオであり、私はそれを強化学習の適用事例として紹介させて頂いています。(Googleさん、ありがとうございます)
みなさん、如何でしょうか?何だかワクワクしませんか?
私の理解する限り、「ディープラーニングを使った」と言っているサービスは「強化学習」ではなく、「予測」か「分類」のどちらかの目的で活用しているケースがほとんどだと思われます。
そして私自身は実際「ディープラーニング」を活用した人工知能(AI)を作成し、フォワードテストを繰り返したのですが、残念ながらサービスリリースするに足る自信が持てる結果を得られなかったため、採用を見送っています。
今は何でもかんでも人工知能(AI)という風潮が日本だけではなく世界中に散見されます。
MAiMATEとあまり関係が無い技術に関しても機会があれば紹介し、質の良い知識提供をして行けたら良いと考えています。