ここではDataFrameのループ処理について学習します。 iterrows 1行ずつ処理する 時系列データなどを扱う際、1行ずつなんらかの指標を計算することがよくあると思います。 DataFrameを1行ずつ処理する場...
CATEGORY データ分析
pandas入門 DataFrameの更新系処理
DataFrameに列や行を追加、更新、削除する方法についてです。 Seriesを列として追加 DataFrameに新たな列としてSeriesを追加する場合、添字に新しいカラム名を指定して代入します。また、既存のカラム名...
pandas入門 DataFrameのソート
pandasのメリットの1つとして多次元のリストを簡単にソートすることができる点が挙げられると思います。 データ分析以外にもETL等でソートが必要な場合はpandasの使用を検討してみてください。 DataFrameのソ...
pandas入門 whereによるフィルタリング
ここでDataFrameのデータ選択方法について学習しましたが、元のDataFrameと同じサイズのDataFrameが必要になる場合がでてきます。そんな時はwhereを使うことで解決することができます。 DataFra...
pandas入門 DataFrameのフィルタリング
ここではDataFrameに対し、条件を満たす行を抽出する処理について学習します。SQLでいうところのselect文のwhere句に相当します。 pandasのフィルタリングの基礎概念 pandasのフィルタリングは一見...
pandas入門 DataFrameのデータ参照
これまでDataFrameに関する説明と、基本的な統計量の算出方法について説明しました。 このページではDataFrame内部のデータを参照する方法について学習します。 列を取得する カラムを指定して列データをSerie...
pandas入門 DataFrame 基本統計量の算出
DataFrameに格納されたデータは簡単に基本的な統計量を計算することができます。 行数、要素数 行数(レコード数) 行数を出力する場合はlen関数を使用します。また、sizeメソッドを使用すると要素数を取得することが...
pandas入門 DataFrameの生成の基本
次に分析の中核となるDataFrameの生成についてです。まずは操作に馴染むためにリストなどのシーケンシャルオブジェクトからDataFrameを生成する方法について学習します。 別項にて説明しますが、実際の業務ではこのペ...
pandas入門 Seriesの演算
pandasのSeriesには独自に演算が定義されています。あまりこのトピックを扱った資料は少ないのですが、この後学ぶDataFrameの操作でも使用するため、今後の理解の支えになると思います。 スカラー演算 Serie...
pandas入門 Seriesの基本
前回ご説明したとおり、Seriesはシーケンスオブジェクトにindexと呼ばれるラベルをつけることができ、DataFrameの一部として扱うことができます。 読者がコピペしやすいように記述していますが、スクリプトを毎回書...