データの正規性のチェックについて
データの正規性を検定する方法はいくつかあります。正規性の検定とは、データが正規分布に従うかどうかを確認するための手法です。
グラフを用いた方法
- ヒストグラム: データの分布を視覚化し、正規分布に近い形状かどうかを確認します。
- Q-Qプロット: データの分位点を理論的な正規分布の分位点と比較し、直線に近いかどうかを確認します。
仮説検定を用いた方法
- シャピロ・ウィルク検定: 小規模なサンプルサイズに適しており、データが正規分布に従うかどうかを検定します。
- コルモゴロフ・スミルノフ検定: データの分布と理論的な正規分布を比較しますが、大規模なサンプルサイズには不向きです。
- アンダーソン・ダーリング検定: データの累積分布関数と正規分布の累積分布関数を比較します。
- ライアン・ジョイナー検定: データと正規スコアの相関を計算し、相関係数が1に近い場合は正規性があると判断します。
これらの方法を使って、データが正規分布に従うかどうかを確認することができます。
どの方法を選ぶかは、データの特性やサンプルサイズによって異なります123。
シャピロ–ウィルク検定(シャピロ–ウィルクけんてい、: Shapiro–Wilk test)とは、 統計学において、標本 x1, ..., xn が正規分布に従う母集団からサンプリングされたものであるという帰無仮説を検定する検定である。この検定方法は、サミュエル・シャピロとマーティン・ウィルクが1965年に発表した[1]。
コルモゴロフ–スミルノフ検定(コルモゴロフ–スミルノフけんてい: Kolmogorov–Smirnov test)は統計学における仮説検定の一種であり、有限個の標本に基づいて、二つの母集団の確率分布が異なるものであるかどうか、あるいは母集団の確率分布が帰無仮説で提示された分布と異なっているかどうかを調べるために用いられる。しばしばKS検定と略される。
1標本KS検定は、経験分布を帰無仮説において示された累積分布関数と比較する。主な応用は、正規分布および一様分布に関する適合度検定である。正規分布に関する検定については、リリフォースによる若干の改良が知られている(リリフォース検定)。正規分布の場合、一般にはリリフォース検定よりもシャピロ-ウィルク検定やアンダーソン-ダーリング検定の方がより強力な手法である。
2標本KS検定は、二つの標本を比較する最も有効かつ一般的なノンパラメトリック手法の一つである。これは、この手法が二つの標本に関する経験分布の位置および形状の双方に依存するためである。
2024年9月19日 | カテゴリー:基礎知識/物理学、統計学、有機化学、数学、英語 |