TAG データ分析

区間推定とは

前々回、標本から母集団の平均や分散といったパラメータを求めるための点推定について学習しました。今回は区間推定について学習しましょう。 区間推定 点推定は式に当てはめれば母集団の推定値が1点で求まるためわかりやすいのですが…

中心極限定理

標本次第で標本平均は様々な値をとるのですが、この平均値の分布について中心極限定理という非常に重要な性質があります。今回は中心極限定理について解説します。 中心極限定理とは 前回、平均と分散の点推定について解説しました。母…

点推定

前回は記述統計と推計統計について解説しました。今回から推測統計を主に解説していきます。まずは点推定から学習しましょう。 平均の点推定 平均の点推定の式 点推定とは標本から母集団の統計量、平均や分散となる値そのものを推測す…

記述統計と推計統計

ここからはデータの一部から全体を推測する推測統計を中心に学習を進めます。一旦数式やPythonコードは置いておき、まずは使用する用語について抑えましょう。 記述統計と推計統計 記述統計と推計統計 これまでの学習で平均や標…

パーセント点の求め方

データ集合が特定の分布に従うとき、そのデータの範囲を確率的に評価することが可能となります。このページでは比較的わかりやすい正規分布でパーセント点の求め方を解説します。 パーセント点 冒頭で書いたとおり、正規分布は範囲を確…

正規分布

前回、離散型と連続型の確率変数と確率分布について学習しました。今回は連続型確率分布で最も重要と言われている正規分布について解説します。 正規分布とは ある確率変数Xが以下の確率密度関数で表される分布を正規分布と呼びます。…

確率変数と分布

これまで、データの特徴をとらえるため平均や分散などの統計量について学習してきました。ここからは少し難しくなりますが、確率変数について学習しましょう。 確率変数と分布 離散型確率変数 サイコロの目のように各変数に対して確率…

変動係数 ばらつきを比較する

前回、データのばらつきを示す分散と標準偏差について学習しました。分析業務では複数のデータセット同士のばらつきを比較することがありますが、分散や標準偏差をそのまま比較することは不適切な場合があります。 ばらつきの比較 ある…

分散と標準偏差 データのばらつきを調べる

前回、「データの中心」を表す統計量、平均、中央値、最頻値について解説しました。今回はデータの散らばりぐらい、「分散」と「標準偏差」について解説します。 分散 平均が同じでも・・・ 前回の最後にデータの中心が同じでもデータ…

データの中心を求める

前回はデータをヒストグラムで表し、特徴を観察しました。今回はデータの中心を表す統計量を算出してみましょう。 統計量とデータの中心 統計量とはデータを要約する値のことです。統計分析の目的の1つは、データの特徴を結論付けをす…