TAG NumPy

matplotlib 関数のグラフ

このページではmatplotlibを使用して連続的な関数のグラフを描画する方法について解説します。サンプルはOO形式と呼ばれる書き方となっています。figure、axesについて知らない方は事前に以下を一読することをおす...

変動係数 ばらつきを比較する

前回、データのばらつきを示す分散と標準偏差について学習しました。分析業務では複数のデータセット同士のばらつきを比較することがありますが、分散や標準偏差をそのまま比較することは不適切な場合があります。 ばらつきの比較 ある...

分散と標準偏差 データのばらつきを調べる

前回、「データの中心」を表す統計量、平均、中央値、最頻値について解説しました。今回はデータの散らばりぐらい、「分散」と「標準偏差」について解説します。 分散 平均が同じでも・・・ 前回の最後にデータの中心が同じでもデータ...

データの中心を求める

前回はデータをヒストグラムで表し、特徴を観察しました。今回はデータの中心を表す統計量を算出してみましょう。 統計量とデータの中心 統計量とはデータを要約する値のことです。統計分析の目的の1つは、データの特徴を結論付けをす...

度数分布とヒストグラム

それではこのページからいよいよ統計分析手法について解説します。まず、データがどういった特徴を持っているのか、分布の有り様を調べるために、度数分布表とヒストグラムについて学習しましょう。 度数分布 度数分布表とは、データの...

データの種類と扱いについて

統計分析を学習する前に、準備運動としてデータの種類や扱い方について簡単におさらいしておきましょう。 データの種類 業務上、統計分析で扱うデータは検索や売上等の業務データやサーバーのログ、顧客アンケート等多岐にわたります。...

NumPy入門 乱数

今回はシミュレーションやテストデータを作成する際によく使う乱数についてです。 randomモジュールとrand NumPyのrandomモジュールには様々な乱数を生成するメソッドが用意されています。まずは基本的なrand...