CATEGORY データ分析

pandas入門 pandasの基礎知識

pandasのインストール pipでインストールできます。 numpyも一緒にインストールされます。比較的サイズ(pandasとnumpyを合わせて40M程度)が大きため少し時間がかかります。anacondaを使えば一通...

pandas入門 pandasとは

pandasとは? pandasとはpythonのデータ分析ライブラリの1つで、大きな表データ、行列を扱うことができます。特に、時系列データを分析する際には最適といえます。 ピボットテーブル、groupby、ソートなどの...

matplotlib入門 日本語環境

matplotlibで日本語フォントを利用すと豆腐になる、という方向けの記事です。僕の環境はUbuntuなのですが、macやwindowsでも同じ方法で対応できます。 まずはコマンドラインでpythonを起動し、matp...

matplotlib入門 ヒストグラム編

今回はmatplotlibのヒストグラムについてです。 以前ご紹介した棒グラフでも作成は可能なのですが、matplotlibにはhistというヒストグラム用の関数が用意されています。 簡単なヒストグラムを描いてみる まず...

matplotlib入門 散布図編1

Pythonで分析したデータを可視化する際、matplotlibというライブラリが便利です。何回かに分けてその使い方を説明しようと思います。 matplotlibとは? matplotlibとはPythonのプロットライ...

matplotlib入門 散布図編2

前回の続きです。前回はとりあえずデータを散布図で表示するとこまで説明しました。データを可視化し、統計的な傾向がつかめたら、今度はそれを資料にして人に説明する場合が出てきます。今回はそのための見せ方の工夫ついて説明します。...