pandas入門 DataFrame excelファイルで入出力

非IT部門の場合、データ管理をWebではなくExcelで行っていることが多々あると思いますが、pandasではそういったExcelデータを吸い上げたりExcelで出力することができます。

事前準備 Excel入出力モジュール

Excelと連携する場合、事前に以下のモジュールをインストールしてください。

# 読み込みで必要
pip install xlrd

# 書き込みで必要
pip install openpyxl

read_excelでExcelファイルを読み込む

read_excelメソッドでファイル名を指定します。その他、シート名、スキップする行、列数などを指定することが可能です。CSVなどと比較してExcel自体が複雑ですのでオプションが非常に多いです。全ては公式をご参照ください。

# 最初のシートを読み込む
df = pd.read_excel('sample.xls')

# シート名を指定し、1行目をスキップする場合
df = pd.read_excel('excelsample.xls', sheet_name="表紙", skiprows=1)

 

to_excelでExcelファイルに書き込む

# とりあえず書き出す。
df.to_excel('output.xlsx')

# シート名を指定する
df.to_excel('output.xlsx',sheet_name='sample')

 
いかがでしょうか。Javaのpoiなどと比較すると格段に簡単で便利ですね。データ分析以外にも業務用のバッチでも使用できると思います。