なぜチャートが大事なのか

スポンサーリンク

データ分析が見落とすもの

株にせよFXにせよ、初心者の大半はチャートや板から見始めるのではないだろうか。だが、チャートの動きだけでゲームのルールを把握し、早い段階から収益を上げるコツを掴んでしまうのはごく一部の天才に限られる。大半の人間は、ランダムに見えるチャートでは売買判断に自信が持てず、何らかのデータ分析を試みるのではないだろうか。昔の人は手書きノートを作っただろうが、パソコンが普及してからはエクセルなどの表計算ソフトを使った人が多いだろうし、プログラムを書いて分析した人もいるだろう。

データを分析すればマーケットの別の一面を捉えることが出来る。時間帯ごとの値動きの比較、相関が高い銘柄の分析など、チャートを見続けるだけでは判断が難しい事柄を数字で捉えることが可能になる。しかし、数字だけをゴリゴリと弄っていると見落としてしまうことがあるかもしれない、ということを考えてみたい。

アンスコムの四例

アンスコムの四例というものを見てみたい。これは、データの平均、分散、相関係数が完全一致、又はほぼ一致するにも関わらず、実際のデータの散らばり方が全く異なるという好例である。(日本語では「アンスコムの例」「アンスコムの数値例」などとも訳されるようだが、元の英語では「Anscombe’s quartet(リンク先:日本語版wikipedia)」と言われている。quartetという語の「4」という意味を残すため、この記事では「四例」と訳した。)

統計用語にイマイチ馴染みがない人は「全然違うデータの散らばり方でも、ある分析をすると結果が同じように見えてしまう」という話だと捉えれば良い。赤丸は各データの値(x, y)、青の点線は回帰直線である。以下の図はPython + bokehで作成した。

繰り返しになるが、この4例はいずれも統計的な値(平均、分散、相関係数)が完全に同一、あるいは殆ど同じである。しかし、グラフに表せば全く違うデータであることが分かる。この記事の記述は大雑把なので、詳しい説明を読みたければ各自wikipediaなどで調べてほしい。

チャートを見ていれば簡単に分かるようなことも、データ分析に落とし込んだ際に埋もれてしまうかも知れない。チャートを見る意義というのは色々あると思うのだが、今回はそのひとつとしてアンスコムの四例を取り上げてみた。チャートの意義に関してはまた機会を見て書きたいと思う。

ちなみに、Pythonの描画モジュールであるbokehのサンプルコード一覧にはanscombe.pyというコード例が掲載されている。自分はJupyter Lab上でうまく動かすことができなかったので、この記事では自分が分かるようにコードを書き直してグラフを作った。

コメント

当ブログのコンテンツが気に入ったら広告ブロックの解除(ホワイトリスト化)をご検討下さい。

Please disable your adblocker or whitelist this site!

タイトルとURLをコピーしました