続・オーバーフィッティングについて
シストレ駆け出しの頃にはまる罠シリーズをしばらく更新していませんが(コラ、
第一弾で書きましたオーバーフィッティングに関する続編です。
シストレ駆け出しの頃にはまる罠(1)過剰最適化(オーバーフィッティング)に注意!
https://www.torezista.com/blog/blog_81/
オーバーフィッティング=過剰最適化につきましては実際いまだに私自身結論が出ていない難しいお話でして、
何をもって過剰最適化というのかは、ロジックを見ただけでは分かるものでもないと思っていますね〜。
ただ1ついえることとしましては、
「将来的に成績がいいロジックであれば、それは過剰最適化ではない」
といえるのではないかと思いますね〜。あまりにも当たり前の話ですが(コラ
たとえばですが、
2000年以降のシグナル数が100,000回の買い戦略A
2000年以降のシグナル数が2,000回の買い戦略B
があった場合、もちろん総シグナル数が多い買い戦略Aの方が過剰最適化に該当しづらいといえると思います。
また、
仕掛け条件数が3個の買い戦略C
仕掛け条件数が15個の買い戦略D
と比較した場合でも、条件が少ない買い戦略Cの方が過剰最適化に該当しづらいのは明白ですね。
ただ、上記で「該当しづらい」と書いておりますとおり、
「該当しない」とは断言できないのが非常に難しいところです。
といいますのも、
シグナル数が少なくても相場の本質をとらえたロジックであればフォワードテスト結果が良くなることもありますし、
仕掛け条件数多くても、もちろんフォワードテスト結果が良くなる場合もありますので、
もちろんそういった場合には過剰最適化とはいえないと思います。
そのため、ここまで書いておいて何ですが、私自身いまだに結論が出ていません(コラ
ただ、1つだけ言えることとしましては、
あくまで最近の私個人の考え方なのですが、シグナル数の多さよりは、仕掛け条件数の少なさを重視しております。
といいますのも、
シグナル数が少ない戦略は、フォワードテスト中でもシグナルが少ないため、大きくは負けづらいというのが1つの理由ですね笑
過剰最適化を確認するためにフォワード結果を確認する必要があるのであれば、やはりシグナル数が少ない戦略は、シグナル数が多い戦略に比べますと資金の回転率が悪いため、資産減少率は抑制される場合が多い、という考え方からです。
それに対しまして仕掛け条件数が多い戦略の場合、
・シグナル数が多い場合にはフォワード中に資金の回転率が高くなるため、もし過剰最適化に該当する戦略であればリスクを伴う
・また、仕掛け条件が多いため、フォワード中に成績を改善したい場合にどの指標が影響をもたらしているかつかみづらい
といった点があるからかもしれませんね〜。
これは私の個人的なカスタマイズのしやすさという意味合いも入っているのですが笑、
やはり坂本タクマ先生もおっしゃっているように、仕掛け条件数も利回りもそこそこというレベルのロジックの方がパフォーマンスがよくなるようなイメージがありますね〜。
(注:あくまでイメージです(コラ
以上のように、シグナル数が少なくても、また仕掛け条件が多くても必ずしも過剰最適化とはいえませんので、
やはり過剰最適化の判断とフォワードテスト結果の判断は対になっているといえるのかもしれませんね〜。
また、過剰最適化の判断をするのにバックテスト段階のシグナル数と期待値を見るのは非常に有効で、
バックテスト段階のシグナル数がある程度多く、かつフォワードにおけるバックテスト段階のその年の期待値が上がっている戦略は、過剰最適化の可能性が払拭されつつある、と考えることができるかもしれません。
もちろん、期待値は直近の地合の影響を強く受けますので(4月以降などですと売りが良くなるのは明白ですね汗)、上昇トレンドと下落トレンドが半々ぐらいのバランスとなる期間で判断されるのがいいかもしれませんね〜。
前々記事:日経平均が陽線か陰線かも重要です。
前の記事:横ばいはプラスと考えるようにしてますね〜。
今の記事:続・オーバーフィッティングについて
次の記事:普遍性を考えるのも手かもしれません。
次々記事:同一業種シグナルの多発時には?