WOTの勝率の誤差について。
この前、WOTのうまさを測る指標であるWN8を紹介したけど、誤差もあるはずと思って計算してみることにした。
ただ、筆者は統計学に疎いので正直、WN8の誤差範囲を計算しようと思ってもハードルが高い。
なので今回はウォーミングアップ的な意味で勝率の誤差について書こうと思う。
勝率の誤差は基本的な二項分布で考えれるので楽。
統計を何も知らなくてもググって頑張ればわかるはず。
WOTの場合、そもそも勝率はチームのものなので自分が関与できるのは数パーセント。
もちろんかなりうまいプレイヤーやかなり下手なプレイヤーは十数パーセントとなる。
ただ、これは運が良かったもしくは悪かっただけの可能性もある。
今回はこの運が良かったもしくは悪かっただけという可能性を誤差として考える。
勝率の誤差はいったいどれくらいあるのか。
どの程度勝率が高ければ誤差ではなく実力だと示せるのか。
これらについて書く。
(まぁ、そもそも戦車ごとに強さが違うから勝率だけではうまいかどうかはわからないけど。(戦車ごとの強さについてhttp://www.noobmeter.com/tankList))
では、本題。
平均プレイヤーを例に考える。
平均プレイヤーは平均的な実力を持つため勝率は50%である。
しかし、うまいプレイヤーが片方に偏ったりすることがあるので常に勝率50%というわけではない。
この平均プレイヤーの勝率にはどの程度の誤差があるか考える。
ステップ1
まず、戦闘回数が十分大きいと仮定する。
すると、正規分布で近似できる。
正規分布とは平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布のこと。
簡単に言うと、何%の確率で勝率がいくつになるかを表したグラフを確率分布という。
そのグラフが一番一般的な形をしていることを正規分布という。
たとえば、平均プレイヤーは勝率50%をとる確率が一番高くて、50%から離れていくにつれ確率が低くなる。
平均プレイヤーが100戦して勝率50%を取る確率は8%くらいだけど勝率65%を取る確率は0.1%以下となる。
この数値は戦闘回数によって変わってくる。
平均プレイヤーが5000戦して勝率55%となる確率は0.000000000015%くらい。
戦闘回数が多いほど誤差は小さい。
まとめ1
勝率何%を取る確率は何%かを表したグラフを確率分布という。
その確率分布が一番普通の形をしていることを正規分布という。
正規分布になるにはある程度多くの戦闘回数が必要。
戦闘回数が少ないと誤差が大きすぎてグラフの形が変になる可能性がある。
戦闘回数が多ければ多いほど勝率は実力に近くなる。
ステップ2
次に、このグラフを使って誤差がどの程度かを調べる。
95%信頼区間で計算する。
信頼区間はどのくらいの幅を信頼できるデータとして扱うかということ。
95%が一般的。(この数値はもっとちゃんと考えないとだめだけど今回は一般的なものを使用した)
信頼区間95%というのはグラフ上で中心に近い95%のデータを信頼するということ。
つまり5%をかなり確率の低いこととして無視するということ。
たとえば平均プレイヤーだと5000戦したとすると95%の確率で48.6%~51.4%の勝率となる。
5%の確率で48.6%~51.4%以外にもなるけどそれはめったに起きないから無視するということ。
ちなみに300戦だと45%~55%(±5%)、3000戦だと48.2%~51.8%(±1.8%)、10000戦だと49.0%~51.0%(±1.0%)くらい。
つまり、300戦で勝率55%を取ったとしても誤差の範囲。
自分の勝率と戦闘回数からどの程度か判別するとよい。
筆者は戦闘回数約3000戦なので誤差範囲は±1.8%。
勝率は51.52%なので自分の勝率は49.7%~53.3%の誤差範囲。
これでは平均プレイヤーを上回っているとはいえない。(誤差範囲に50%があるため)
もし、3000戦の勝率が52%だったら、誤差範囲は50.2%~53.8%となり、平均プレイヤーよりうまいことが証明できる。
筆者の最近の約300戦の勝率は49.14%。
300戦なので誤差範囲は±5%。
なので筆者の勝率の誤差範囲は44.14%~54.14%となる。
最近の300戦の勝率が59.14%の人は誤差範囲は54.14%~64.14%となる。
筆者の勝率とこの人の勝率の誤差範囲は重なっている。
つまり筆者は勝率59.14%の人と同じ実力である可能性がある。
まとめ2
低い確率でしかならない勝率は無視する。
高い確率でなる勝率の範囲を誤差として扱う。
戦闘回数によって誤差範囲が違う。
平均プレイヤーが5000戦したとすると勝率48.6%~51.4%は誤差の範囲。
平均プレイヤーが300戦したとすると勝率45%~55%は誤差の範囲。
300戦程度だと勝率±5%は誤差の範囲。
結論
300戦だと±5%、3000戦だと±1.8%、5000戦だと±1.2%、10000戦だと±1.0%は誤差。
統計話の思いつく問題点について。
正規分布なのか?
そもそも実力が一定でないため正規分布せず、誤差範囲を特定するには実力の変動を加味する必要がある。
10000戦もしてればだんだんうまくなっているはずなのでグラフの形はおかしくなるはず。
この場合は勝率は実際の勝率よりも低めに出る。(正確には低めに範囲を取る)
300戦程度なら実力はあんまり変わらないだろうけど誤差が大きい。
信頼区間は95%か?
戦闘はあくまで全体の結果なので一般的な95%としたが、個人の勝率に与える影響の小ささを考えると信頼区間はもっと低くてもよいかもしれない。
周りのプレイヤーに勝率は左右されやすいので信頼区間を80%とか75%とかにしたほうがいいかもしれない。
そうすると誤差範囲は狭くなる。
そもそも戦闘は独立でないのではないか?
前提として前後の戦闘は影響し合わないものとして考えている。
戦闘の結果を引きずる人もいるはず。
なのでそもそも正規分布しない。
これらの問題は複雑かつ明確な回答がないため今回は無視する。
以上。
間違ってたらごめん