
マイメイトの「エージェント」 育てる機能の解説
2019年9月12日
こんにちは。編集部鮫男です。
マイメイトの「エージェント」は自分で作成した場合、褒める・叱ることで、「育てる(Educate)」ことができます。「育てる」を行った場合、「エージェント」にどう影響を与えるのか、紹介します。
目次
育てる機能の概要
「エージェント」を育てるやり方とその効果について簡単に紹介します。
「エージェント」の育て方

マイメイトログイン後のトップ画面で「育成画面」のオレンジ色のボタンを押すと、上の「育てる」画面へ移行します。
ここでは直近の売買シグナルが表示されており、各判断に対し、「褒める」または「叱る」ことが可能です。売買シグナルをクリックすると、グッドやバッドの絵文字が左に表示されます。
「褒める」や「叱る」とどうなる?
「エージェント」を「褒める」もしくは「叱る」ことで、「エージェント」の売買判断に影響を与えるわけですが、「褒める」際にどのくらい強く褒めるべきか、「叱る」際にどのくらい強く叱るべきか、は丁寧な分析に基づいて決定しています。
「たった1回の『いいね』『ダメだね』という評価で、『エージェント』が長期にわたって積み上げた学習結果を簡単に壊さない」ことを強く意識しました。
ただし、「ユーザーの『いいね』『ダメだね』という評価は『エージェント』の行動に確実且つ少しずつ影響を与え、それが個性となって表れる』こととなります。
無理して評価しなくていい
どのトレードを褒めればいいのか・叱ればいいのかの方針が定まっていない人は、無理に教育せずに「エージェント」の自主学習に任せてしまうことも選択肢の1つです。
一貫性なく褒めたり叱ったりするくらいなら、放置した方が良いでしょう。
教育方針のある人は育成すべき
既に自分の好みのトレードがハッキリとある人は、ぜひ育成をしてください。
例えば100pips以上の利益確定をした取引は褒めて、60pip以上の損を出した時には叱るなど損小利大を推進する方針などもありますね。
「エージェント」は必ず行動変容します。長期にわたってコツコツと「いいね」「ダメだね」の一貫したフィードバックを与え続けることが大事です。
1回の「いいね」「ダメだね」が「エージェント」を壊してしまうことは無いようにデザインしてますので、恐れず週に1回程度はAIエージェントのトレードを振り返り、評価してあげて下さい。
育成はシンプルに「『こういう取引をしちゃだめ』は叱る」
「『最高の取引だね!』は褒める」でOKです。
「エージェント」を育てた際の検証
過去に「エージェント」の育成に関する効果を検証したデータを紹介します。検証する「エージェント」は、2019年8月23~30日の間のトレーディングです(育成画面は当時のもので、現在とは異なる点もあります)。


8月30日に大きめの損失を出していることがわかります。損切りの判断は仕方ないと思いつつ、「もう少し早く決断出来たんじゃないの? 8月28日や29日時点で損切りしてくれても良かったのに」という考えに基づき、8月30日の決済に対して「ダメだね」という叱りを入れています。
ここから継続学習と教育の効果検証の実験です。
実験その1「継続学習の効果、損失が軽減」
「継続学習」及び「8月30日のダメだね」によって、このトレーディング結果がどう変わるのだろうか……が調査の対象です。
ここでまず、「いいね」「ダメだね」を無視した状態で、「エージェント」の自発的な継続学習の効果を確認します。
上記期間のデータを取り込んだ継続学習後の「エージェント」を、もう1度8月23日に連れて帰り、再度トレードをさせた結果が以下の通りです。
なお評価損益の数字が微妙に異なるのは、「何時何分何秒」までを完全に一致させたシミュレーションが困難なためですが、分析結果を覆すような差異ではありません。

上の画面のように、特に「いいね」「ダメだね」が無くとも「エージェント」は損切り額の大きさを自発的に反省し、損切りのタイミングを早めることで損失を軽減していることがわかります。
実験その2「教育の効果、1度では変化なし!?」
では続いて、8月30日に「ダメだね」を付与し、「エージェント」により強い反省を促した場合の変化を確認してみましょう。

変化がありません。つまり、「エージェント」は強い反省を促されたものの、8月29日時点での損切りが最も良い判断であると信じている状態です。
実験その3「しつこく教育、7度目で変化!」
それでも「8月28日に損切りをして欲しい!」ということで、「ダメだね」を含めたこの期間の継続学習を何回も繰り返しました。
その結果、7回目の継続学習後のトレード結果を見ると、売りが1日早まりました。

一貫性のある教育をし続けると、「エージェント」に変化が現れるということです。
最後に
一般的な自動売買サービスは、多くが固定的なロジックであるが故に、長期間にわたって様々な環境に適応できるものはかなり少ないです。
マイメイトは自動売買サービスが抱えるこの課題を「継続学習」の機能で克服しようとしています。
そして「育てる」によって、ユーザーの経験を取り入れさせ、より賢くユニークなものにしていきます。先端の技術を活用するマイメイトだからこそ実現できる機能といえるでしょう。
1万を超える強化学習型トレードAIが毎週継続学習を行う、というプラットフォームは類を見ないと思います。今後どのようになっていくのかは私たちも非常に興味深いです。
最後までお読みいただきありがとうございました!
こんな記事も読まれています
マイメイト運営
MAiMATEの公式ブログを運営しています。マイメイトに関するニュースやお知らせなど全般について情報発信をします。