TAG 統計分析

変動係数 ばらつきを比較する

前回、データのばらつきを示す分散と標準偏差について学習しました。分析業務では複数のデータセット同士のばらつきを比較することがありますが、分散や標準偏差をそのまま比較することは不適切な場合があります。 ばらつきの比較 ある…

分散と標準偏差 データのばらつきを調べる

前回、「データの中心」を表す統計量、平均、中央値、最頻値について解説しました。今回はデータの散らばりぐらい、「分散」と「標準偏差」について解説します。 分散 平均が同じでも・・・ 前回の最後にデータの中心が同じでもデータ…

データの中心を求める

前回はデータをヒストグラムで表し、特徴を観察しました。今回はデータの中心を表す統計量を算出してみましょう。 統計量とデータの中心 統計量とはデータを要約する値のことです。統計分析の目的の1つは、データの特徴を結論付けをす…

度数分布とヒストグラム

それではこのページからいよいよ統計分析手法について解説します。まず、データがどういった特徴を持っているのか、分布の有り様を調べるために、度数分布表とヒストグラムについて学習しましょう。 度数分布 度数分布表とは、データの…

データの種類と扱いについて

統計分析を学習する前に、準備運動としてデータの種類や扱い方について簡単におさらいしておきましょう。 データの種類 業務上、統計分析で扱うデータは検索や売上等の業務データやサーバーのログ、顧客アンケート等多岐にわたります。…

Spyderの使い方

前回紹介した分析用のIDEでSpyderというものがあります。このページではSpyderの入門的な使い方について解説します。(もしJupyterLab等、既に手慣れたPythonの編集環境がある場合はそちらを利用していた…

Anaconda

Pythonでデータ分析をする場合、Pythonに対して各種ライブラリを必要に応じて自分でインストールしてもいいのですが、Anacondaを利用するとより簡単に環境を構築することが可能です。既にPython3でIPyth…

Pythonで学ぶ統計分析入門

統計分析入門 この講座は私自身の知識整理に加え、Pythonを通じて大学教養課程レベルの統計学の概要とデータ分析の基本について解説することを目的としています。対象読者としては、Pythonがある程度理解でき、かつ統計学を…