非IT部門の場合、データ管理をWebではなくExcelで行っていることが多々あると思いますが、pandasではそういったExcelデータを吸い上げたりExcelで出力することができます。
事前準備 Excel入出力モジュール
Excelと連携する場合、事前に以下のモジュールをインストールしてください。
# 読み込みで必要 pip install xlrd # 書き込みで必要 pip install openpyxl
read_excelでExcelファイルを読み込む
read_excelメソッドでファイル名を指定します。その他、シート名、スキップする行、列数などを指定することが可能です。CSVなどと比較してExcel自体が複雑ですのでオプションが非常に多いです。全ては公式をご参照ください。
# 最初のシートを読み込む df = pd.read_excel('sample.xls') # シート名を指定し、1行目をスキップする場合 df = pd.read_excel('excelsample.xls', sheet_name="表紙", skiprows=1)
to_excelでExcelファイルに書き込む
# とりあえず書き出す。 df.to_excel('output.xlsx') # シート名を指定する df.to_excel('output.xlsx',sheet_name='sample')
いかがでしょうか。Javaのpoiなどと比較すると格段に簡単で便利ですね。データ分析以外にも業務用のバッチでも使用できると思います。