CATEGORY データ分析

正規分布

前回、離散型と連続型の確率変数と確率分布について学習しました。今回は連続型確率分布で最も重要と言われている正規分布について解説します。 正規分布とは ある確率変数Xが以下の確率密度関数で表される分布を正規分布と呼びます。...

確率変数と分布

これまで、データの特徴をとらえるため平均や分散などの統計量について学習してきました。ここからは少し難しくなりますが、確率変数について学習しましょう。 確率変数と分布 離散型確率変数 サイコロの目のように各変数に対して確率...

変動係数 ばらつきを比較する

前回、データのばらつきを示す分散と標準偏差について学習しました。分析業務では複数のデータセット同士のばらつきを比較することがありますが、分散や標準偏差をそのまま比較することは不適切な場合があります。 ばらつきの比較 ある...

分散と標準偏差 データのばらつきを調べる

前回、「データの中心」を表す統計量、平均、中央値、最頻値について解説しました。今回はデータの散らばりぐらい、「分散」と「標準偏差」について解説します。 分散 平均が同じでも・・・ 前回の最後にデータの中心が同じでもデータ...

データの中心を求める

前回はデータをヒストグラムで表し、特徴を観察しました。今回はデータの中心を表す統計量を算出してみましょう。 統計量とデータの中心 統計量とはデータを要約する値のことです。統計分析の目的の1つは、データの特徴を結論付けをす...

度数分布とヒストグラム

それではこのページからいよいよ統計分析手法について解説します。まず、データがどういった特徴を持っているのか、分布の有り様を調べるために、度数分布表とヒストグラムについて学習しましょう。 度数分布 度数分布表とは、データの...

データの種類と扱いについて

統計分析を学習する前に、準備運動としてデータの種類や扱い方について簡単におさらいしておきましょう。 データの種類 業務上、統計分析で扱うデータは検索や売上等の業務データやサーバーのログ、顧客アンケート等多岐にわたります。...

Spyderの使い方

前回紹介した分析用のIDEでSpyderというものがあります。このページではSpyderの入門的な使い方について解説します。(もしJupyterLab等、既に手慣れたPythonの編集環境がある場合はそちらを利用していた...

Anacondaと分析系ライブラリ

Pythonでデータ分析をする場合、Pythonに対して各種ライブラリを必要に応じて自分でインストールしてもいいのですが、Anacondaを利用するとより簡単に環境を構築することが可能です。既にPython3でIPyth...

Pythonで学ぶ統計分析入門

統計分析入門 この講座は私自身の知識整理に加え、Pythonを通じて大学教養課程レベルの統計学の概要とデータ分析の基本について解説することを目的としています。対象読者としては、Pythonがある程度理解でき、かつ統計学を...