TAG データ分析

変動係数 ばらつきを比較する

前回、データのばらつきを示す分散と標準偏差について学習しました。分析業務では複数のデータセット同士のばらつきを比較することがありますが、分散や標準偏差をそのまま比較することは不適切な場合があります。 ばらつきの比較 ある...

分散と標準偏差 データのばらつきを調べる

前回、「データの中心」を表す統計量、平均、中央値、最頻値について解説しました。今回はデータの散らばりぐらい、「分散」と「標準偏差」について解説します。 分散 平均が同じでも・・・ 前回の最後にデータの中心が同じでもデータ...

データの中心を求める

前回はデータをヒストグラムで表し、特徴を観察しました。今回はデータの中心を表す統計量を算出してみましょう。 統計量とデータの中心 統計量とはデータを要約する値のことです。統計分析の目的の1つは、データの特徴を結論付けをす...

度数分布とヒストグラム

それではこのページからいよいよ統計分析手法について解説します。まず、データがどういった特徴を持っているのか、分布の有り様を調べるために、度数分布表とヒストグラムについて学習しましょう。 度数分布 度数分布表とは、データの...

Spyderの使い方

前回紹介した分析用のIDEでSpyderというものがあります。このページではSpyderの入門的な使い方について解説します。(もしJupyterLab等、既に手慣れたPythonの編集環境がある場合はそちらを利用していた...

Anacondaと分析系ライブラリ

Pythonでデータ分析をする場合、Pythonに対して各種ライブラリを必要に応じて自分でインストールしてもいいのですが、Anacondaを利用するとより簡単に環境を構築することが可能です。既にPython3でIPyth...

Pythonで学ぶ統計分析入門

統計分析入門 この講座は私自身の知識整理に加え、Pythonを通じて大学教養課程レベルの統計学の概要とデータ分析の基本について解説することを目的としています。対象読者としては、Pythonがある程度理解でき、かつ統計学を...

Flaskで作る簡易分析ツール 補足

補足として完成後の構成とソースコードを掲載します。 プロジェクト 構成は以下のとおりとなります。 schema.sql requirements.txt 利用するライブラリは以下のとおりです。(2018/4/21 修正 ...

Flaskで作る簡易分析ツール7 flashメッセージ

前回で、ツールとして使うための最低限の機能の実装は終わりました。ここからは補足機能の追加としてflushメッセージの追加をしてみましょう。 flaskのflashメッセージ flashメッセージとは、処理が終わったりエラ...

Flaskで作る簡易分析ツール6 一覧画面の作成

前回までで分析処理と結果の参照処理の実装が終わりました。次に結果一覧が参照できるトップページを作成しましょう。 一覧参照処理の実装 models.pyの修正 一覧参照のために、結果全件取得処理が必要となります。model...