ラダーにおいて平均勝率6割は可能か?

f:id:tempe443:20171229230615j:plain



ラダーにおいて1か月の平均勝率6割達成できるかを検証してみました。

検証データは自分のマンモス年(17年4月~18年3月)のラダー戦績10245戦の勝率は52.6%。戦績エクセルはこちらただの戦績なのでファイル開かなくても大丈夫です)

※「レジェンドまで勝ち越す必要がある」「レジェンドからは同じ順位(実力)と戦う」事から52.6%という数字は妥当だと思われる。

 

 

 

 

結論①:筆者(勝率52.6%)が500戦回して勝率6割出すのは1%以下

 

結論②:500戦回せば約5%、1000戦だと約2.5%で勝率55%を達成できる

 詳しくは下記通り

 

 

 

 

 

・筆者(勝率52.6%)が1000戦回した時99%の確率で勝率49.5%~56.0%の間に収まるため勝率6割以上出すのは1%以下となる。

※正式にはデータの中から連続した1000戦(3戦目~1002戦目など)をランダムで100回抽出しその勝率が49.5%~56.0%である回数は99回以上という事になる。

 

 ・筆者(勝率52.6%)が500戦回した時99%の確率で勝率47.7%~57.9%の間に収まるため勝率6割以上出すのは1%以下となる。

※正式にはデータの中から連続した1000戦をランダムで100回抽出しその勝率が47.7%~57.9%である回数は99回以上という事になる。

 

・筆者(勝率52.6%)が1000戦回した時5%の確率で勝率50.6%以下or54.9%以上となる。

※正式にはデータの中から連続した1000戦をランダムで100回抽出しその勝率が50.6%以上or56.2%以下である回数は95回以上という事になる。

 

・筆者(勝率52.6%)が500戦回した時5%の確率で勝率49.4%以下or56.2%以上となる。

※正式にはデータの中から連続した500戦をランダムで100回抽出しその勝率が49.4%or56.2%である回数は95回以上という事になる。

 

データをまとめた結果、他にもこんな情報がわかりました。

連続した1000戦の最高勝率:55.4%

連続した1000戦の最低勝率:50.3%

連続した500戦の最高勝率:57.4%

連続した500戦の最低勝率:49.4%

 ※連続した1000戦とは3戦目~1002戦目、1341戦目~2340戦目など各連続した1000戦を勝率を計算したもの。エクセルで計算できるためすぐに出る。 

 

以下は結論までの簡単な説明。わからなければ見なくても大丈夫です。

 

 

 

 

 

 

 

 

 

 

 

平均と標準偏差

まず下記の表をご覧ください

バナナ食べた本数
  平均
テンペスト 5 5 5 5 5 5 5 5
ウーサー 8 1 4 7 6 3 6 5

 テンペスト君もウーサー君も毎日食べてる本数にバラツキがありますけど平均は同じ5個です。ここで来週の月曜日に2人が食べるバナナの本数を予想してみましょう。テンペスト君はおそらく5本である可能性が高そうですね。ウーサー君はバラバラなので予想しにくそうですね。こういったデータのバラツキの大きさを表したのが標準偏差です。

 

 

 

 

 

 

 

平均だけではダメ?

ここで身近な例を1つ挙げます。20代(単身のみ)の平均貯金額は184万円。では一番出現率の高い貯金額はいくらでしょうか?なななんと0円です。つまり20代の2人の内1人は貯金額が0円という事になります(言い換えれば一部の裕福な層が平均を上げてる)。このように平均が一番メジャーな数値にならない場合もあるわけです。

※0円と言い切れるのは中央値が0円のため。つまり過半数以上が0円

 

 

 

 

 

 

 

 

標準偏差の求め方

 まず平均とどれだけ離れているかの平方偏差というものを求めます。各データの平方偏差の求め方は

 

平方偏差=(平均-各データ)²

 

先ほどのウーサー君のバナナ食べた本数の偏差を求めると

食べた本数 8 1 4 7 6 3 6
偏差 9 16 1 4 1 4 1
計算式 (8-5)² (5-1)² (5-4)² (7-5)² (6-5)² (5-3)² (6-5)²

平方偏差の合計は9+16+1+4+1+4+1=36となります。

次に平方偏差を平均化した分散を求めます。

 

分散=平方偏差の平均値

 

バナナのデータたと

分散:36÷7=5.14

となります。ここで問題が。分散のままだと「数字が大きくなる」「単位がかわってしまう」というデメリットがあるのでルート化して標準偏差を求めます。

 

標準偏差=√分散

 

バナナのデータだと

標準偏差:√5.14=約2.26

となります。

 

 

 

 

 

 

 

 

 

信用区間

信用区間とはざっくり言うと

 

データの中からランダムで1つの値を抽出する。これを100回繰り返した場合した場合95回(または99回)以上になる区間

 

の事である。これを求める式は

 

100回中95回以上の区間=平均±2*標準偏差

100回中99回以上の区間=平均±3*標準偏差

 

となりこれをバナナのデータに当てはめると

 

100回中95回以上の確率で食べる本数=5±2*2.26

つまり0.48本~9.52本となる。ざっくりいうと95%以上の確率でウーサー君の食べるバナナ本数は1本~10本となる事がわかります。