CATEGORY 応用編

pandas入門 Seriesの演算

pandasのSeriesには独自に演算が定義されています。あまりこのトピックを扱った資料は少ないのですが、この後学ぶDataFrameの操作でも使用するため、今後の理解の支えになると思います。 スカラー演算 Serie...

pandas入門 Seriesの基本

前回ご説明したとおり、Seriesはシーケンスオブジェクトにindexと呼ばれるラベルをつけることができ、DataFrameの一部として扱うことができます。 読者がコピペしやすいように記述していますが、スクリプトを毎回書...

pandas入門 pandasの基礎知識

pandasのインストール pipでインストールできます。 numpyも一緒にインストールされます。比較的サイズ(pandasとnumpyを合わせて40M程度)が大きため少し時間がかかります。anacondaを使えば一通...

pandas入門 pandasとは

pandasとは? pandasとはpythonのデータ分析ライブラリの1つで、大きな表データ、行列を扱うことができます。特に、時系列データを分析する際には最適といえます。 ピボットテーブル、groupby、ソートなどの...

beautifulsoup4入門 htmlをパース、スクレイピングする

requestsの使い方 webサイトのデータを取得するで、web上のデータを取得する方法について学習しました。取得したデータの形式はjsonだったりxmlだったり色んな形式があると思いますが、ここではhtmlデータを解...

requestsの使い方 webサイトのデータを取得する

pythonを使用する1つの目的としてマーケティング等で使用する分析データの取得が挙げられるのではないでしょうか。サードパーティ製のライブラリであるrequestsを使用すると、web上のデータを簡単に取得することができ...

sphinx入門 その2 コード内のdocstringの記述

前回はsphinxによるソースコードからのドキュメント自動生成について学習しました。今回はコード内のdocstringの記述方法について学習します。pythonのdocstringの記法はEpytext、google、N...

sphinx入門 その1 ドキュメントの自動生成

メジャーなプログラム言語ではプログラムのコメントからドキュメントを生成するライブラリがあります。例えばjavaだとjavadocが有名ですね。Pythonではsphinxというライブラリでドキュメントを生成することができ...

matplotlib入門 日本語環境

matplotlibで日本語フォントを利用すと豆腐になる、という方向けの記事です。僕の環境はUbuntuなのですが、macやwindowsでも同じ方法で対応できます。 まずはコマンドラインでpythonを起動し、matp...

matplotlib入門 ヒストグラム編

今回はmatplotlibのヒストグラムについてです。 以前ご紹介した棒グラフでも作成は可能なのですが、matplotlibにはhistというヒストグラム用の関数が用意されています。 簡単なヒストグラムを描いてみる まず...