占いと予想最高気温 [雑感]
私は基本的に、占いを信じません。若いころはオカルト好きで、例えばアガスティアの葉などに興味を持ったこともあったのですが、今から考えれば、好意的に見てもそれは生存バイアスの一種なのではないかと思っています。
まあ、占いを信じないとは言っても、新聞やテレビなどで毎朝目にすると、やはり気にはなってしまいます。
そこで、一応その中身には取り敢えず目を通したりします。
占いの内容というものは、いくつかの項目があって、当たったように見える時があっても、完全に一致することはまずありません。
私たちは、いくつかの項目、場合によってはたった一つの項目が当たったように見えただけで、その占い全体が当たったと考えてしまいがちです。
ここではそんな細かいことはさて置いて、取り敢えず毎日占いを見ている人が、翌日になって昨日の占いは当たった、外れたといった判定を下すものとしましょう。
その結果を時系列で見ると、○(当たり)と×(外れ)の羅列となるわけです。
占いを信じやすい人にとっては、その結果は○が多いものになるでしょう。あるいは、占いを信じない人にとっては、かなりきつめの判定となり、×が多くなるかもしれません。
いずれにしましても、○と×とが入り混じった時系列データが得られることになります。
その時系列データを見た人が、ふと、○と×の分布に何か傾向らしきものを見つけたとします。そのようなことは、それがまったくランダムであったとしても、往々にしてあるものです。
するとその人は、その時系列データにおいて、×がある特定の条件の時に発生しやすいことを発見し、その条件に当てはまる日には占いを真逆に解釈すべきだと言い始めます。
確かに、その時点における時系列データだけを見れば、その条件に当てはまる日の○と×とを逆転させれば、全体として○の日の割合が増える、すなわち、占いの的中率が向上するかもしれません。
でも、占いは所詮占いです。それをどんなに加工したとしても、元々は当たるも八卦、当たらぬも八卦なのです。
それ以外の何物でもありません。
一方、新聞の天気欄を見ると、今日の予想最高気温が掲載されていたりします。これを同様に、翌日になってその当落を判定するものとしましょう。
ただし、最高気温をピタリと当てるのは、さすがの気象予報士でも荷が重いでしょう。
そこで、最高気温の予測値には若干の幅を持たせることを許可します。すると、占いの場合と同様に、○(当たり)と×(外れ)の2値を取る時系列データが出来上がります。
この時系列データは、占いの場合とは本質的に異なる傾向があることが期待できます。すなわち、予測の的中率は、未来に渡ってもほぼ一定であると考えられる合理的な理由があります。
ただ、その的中率はさほど高くなく、数字だけを見れば占いの場合と大差ないように見えるかもしれません。逆に、そうなるように予測値の幅を設定するわけです。
さて、占いの時と同様に、その時系列データを見た人が、結果の分布に何らかの傾向を見つけたものとします。
そして、ある条件の時には予想最高気温を一定温度上下させるものとします。
その結果、占いの時と同様に、予想最高気温の的中率が向上したとしましょう。
はたして、このような条件付けに有意性はあるのでしょうか?
普通に考えれば、天気予報は科学です。しかも、完全に解明されているわけではない、研究途上の科学です。
そのような中で、まだ関連付けられていない自然現象により、最高気温の予測値が一定方向にシフトする可能性は否定できません。
すなわち、占いの時とは本質的に異なった条件付けである可能性はあるわけです。
でも、もっと根源的な問題は、そもそもその時系列データが占いの当落なのか、予想最高気温の当落なのか、分からない場合があるということです。
また、条件付けの仕方が全く根拠のない方法である可能性もあります。
元となる最初の時系列の真偽、そして条件付けの真偽。全部で4通りの組み合わせがあります。
結局のところ、定性的には元の時系列データに条件付けをして、それが現象を比較的正しく言い当てる系列になる割合は、4回に1回しかありません。
むやみに条件を付加すると、せっかく元の時系列が予想最高気温であっても、最終結果は占いとさほど変わらないことになってしまうかもしれません。
それだけに、予想最高気温に対しても、「本質的に異なった条件付け」を行なう必要があるわけです。
そして、元の時系列が占いなのか予想最高気温なのか分からない場合、そのまま経過観察すればいずれははっきりするでしょう。
そして、それが予想最高気温である可能性は、現時点では5分5分です。
一方、現時点においてその時系列に条件付けを行なって、的中率を高めたとします。その結果、どうなるでしょう。
上述しましたように、その的中率を将来も維持できる可能性は、4回に1回となります。
つまり、現在手元にある時系列が予想最高気温であることがはっきりしているならば、それに条件付けを行なって的中率を高めるチャレンジをすることは合理的です。
しかし、時系列が占いか予想最高気温か分からない場合、むやみに条件付けを行なうことは得策ではないように思います。
まあ、占いを信じないとは言っても、新聞やテレビなどで毎朝目にすると、やはり気にはなってしまいます。
そこで、一応その中身には取り敢えず目を通したりします。
占いの内容というものは、いくつかの項目があって、当たったように見える時があっても、完全に一致することはまずありません。
私たちは、いくつかの項目、場合によってはたった一つの項目が当たったように見えただけで、その占い全体が当たったと考えてしまいがちです。
ここではそんな細かいことはさて置いて、取り敢えず毎日占いを見ている人が、翌日になって昨日の占いは当たった、外れたといった判定を下すものとしましょう。
その結果を時系列で見ると、○(当たり)と×(外れ)の羅列となるわけです。
占いを信じやすい人にとっては、その結果は○が多いものになるでしょう。あるいは、占いを信じない人にとっては、かなりきつめの判定となり、×が多くなるかもしれません。
いずれにしましても、○と×とが入り混じった時系列データが得られることになります。
その時系列データを見た人が、ふと、○と×の分布に何か傾向らしきものを見つけたとします。そのようなことは、それがまったくランダムであったとしても、往々にしてあるものです。
するとその人は、その時系列データにおいて、×がある特定の条件の時に発生しやすいことを発見し、その条件に当てはまる日には占いを真逆に解釈すべきだと言い始めます。
確かに、その時点における時系列データだけを見れば、その条件に当てはまる日の○と×とを逆転させれば、全体として○の日の割合が増える、すなわち、占いの的中率が向上するかもしれません。
でも、占いは所詮占いです。それをどんなに加工したとしても、元々は当たるも八卦、当たらぬも八卦なのです。
それ以外の何物でもありません。
一方、新聞の天気欄を見ると、今日の予想最高気温が掲載されていたりします。これを同様に、翌日になってその当落を判定するものとしましょう。
ただし、最高気温をピタリと当てるのは、さすがの気象予報士でも荷が重いでしょう。
そこで、最高気温の予測値には若干の幅を持たせることを許可します。すると、占いの場合と同様に、○(当たり)と×(外れ)の2値を取る時系列データが出来上がります。
この時系列データは、占いの場合とは本質的に異なる傾向があることが期待できます。すなわち、予測の的中率は、未来に渡ってもほぼ一定であると考えられる合理的な理由があります。
ただ、その的中率はさほど高くなく、数字だけを見れば占いの場合と大差ないように見えるかもしれません。逆に、そうなるように予測値の幅を設定するわけです。
さて、占いの時と同様に、その時系列データを見た人が、結果の分布に何らかの傾向を見つけたものとします。
そして、ある条件の時には予想最高気温を一定温度上下させるものとします。
その結果、占いの時と同様に、予想最高気温の的中率が向上したとしましょう。
はたして、このような条件付けに有意性はあるのでしょうか?
普通に考えれば、天気予報は科学です。しかも、完全に解明されているわけではない、研究途上の科学です。
そのような中で、まだ関連付けられていない自然現象により、最高気温の予測値が一定方向にシフトする可能性は否定できません。
すなわち、占いの時とは本質的に異なった条件付けである可能性はあるわけです。
でも、もっと根源的な問題は、そもそもその時系列データが占いの当落なのか、予想最高気温の当落なのか、分からない場合があるということです。
また、条件付けの仕方が全く根拠のない方法である可能性もあります。
元となる最初の時系列の真偽、そして条件付けの真偽。全部で4通りの組み合わせがあります。
結局のところ、定性的には元の時系列データに条件付けをして、それが現象を比較的正しく言い当てる系列になる割合は、4回に1回しかありません。
むやみに条件を付加すると、せっかく元の時系列が予想最高気温であっても、最終結果は占いとさほど変わらないことになってしまうかもしれません。
それだけに、予想最高気温に対しても、「本質的に異なった条件付け」を行なう必要があるわけです。
そして、元の時系列が占いなのか予想最高気温なのか分からない場合、そのまま経過観察すればいずれははっきりするでしょう。
そして、それが予想最高気温である可能性は、現時点では5分5分です。
一方、現時点においてその時系列に条件付けを行なって、的中率を高めたとします。その結果、どうなるでしょう。
上述しましたように、その的中率を将来も維持できる可能性は、4回に1回となります。
つまり、現在手元にある時系列が予想最高気温であることがはっきりしているならば、それに条件付けを行なって的中率を高めるチャレンジをすることは合理的です。
しかし、時系列が占いか予想最高気温か分からない場合、むやみに条件付けを行なうことは得策ではないように思います。
お疲れ様です。
データの取り扱いも間違えてはいけないということでしょうか?
by たかとび (2010-06-01 22:51)
たかとびさん、こんにちは。
一言で言えば、機能しないシステムをいくらレジームスイッチしても、かえって良くない結果になるので、まずは機能する(と確信できる)システムを構築することから始めた方がいい、という、全く当たり前のことを、非常に遠まわしに、もったいつけて言っているだけです(^_^;)
ただ、レジームスイッチに限らず、一般的なフィルターやKFシステムクリエイターにおける追加システムの適用などについても言えることなのではないかと思います。
もちろん、機能するシステムをレジームスイッチしたり、フィルターを適用したりすることで、期待値の向上が見込めますし、事実、それを実行して素晴らしい成績を上げているトレーダーの方々も、大勢いらっしゃいます。
by Kフロー (2010-06-02 08:46)
marbeeさん、こんにちは。
いつもありがとうございます。
by Kフロー (2010-06-02 08:47)