投稿者 PPB  (社会人) 投稿日時 2022/7/27 15:06:46
例えば以下のようなサンプル数値群があったとします。

16, 13, 15, 18, 40, 15, 15, 20, 13, 16, 14, 16, 17

この中に40という数値があり、他の数値より大きめですが、
このような数値を異常値として、プログラム的にサンプルより取り除きたいと思っています。
ただし、サンプルとして許容する最小値・最大値は決まってなく、
他の数値群の傾向を見て判断したいと思っています。
もちろん、異常値判断されるかどうかの微妙なケースもあるかと思いますが、
ざっくりと判定できればいいと思います。

おそらく統計学的な方法を用いることになると思いますが、
どのような方法が考えられますか?

なお、今回のサンプルでは15前後の数値の中に40という数値が1つありましたが、
今回の目的は、明らかに異常値じゃないの?というものが排除できればいいので、
今回のサンプルの中に40前後の数値が多くあれば、それは排除しなくていいと思っています。