본문 바로가기

Pandas

데이터프레임 -> 엑셀파일로 저장하기.


import pandas as pd
import numpy as np
import seaborn as sns
import ssl
from bs4 import BeautifulSoup
import requests
import re

ssl._create_default_https_context = ssl._create_unverified_context

# 판다스 DataFrame() 함수로 데이터프레임 변환. 변수 df1, df2에 저장
data1 = {'name' : [ 'Jerry', 'Riah', 'Paul'],
         'algol' : [ "A", "A+", "B"],
         'basic' : [ "C", "B", "B+"],
          'c++' : [ "B+", "C", "C+"]}

data2 = {'c0':[1,2,3],
         'c1':[4,5,6],
         'c2':[7,8,9],
         'c3':[10,11,12],
         'c4':[13,14,15]}

df1 = pd.DataFrame(data1)
df1.set_index('name', inplace=True)
print(df1, '\n')

df2 = pd.DataFrame(data2)
df2.set_index('c0', inplace=True)
print(df2, '\n')

#df1을 sheet1 으로 df2를 sheet2 로 저장한다
writer = pd.ExcelWriter("/Users/pandas_sample/df_excelWriter.xlsx")
df1.to_excel(writer, sheet_name="sheet1")
df2.to_excel(writer, sheet_name="sheet2")
writer.save()

 

 

2개의 데이터프레임을 하나의 엑셀파일 & 2개의 sheet로 나눠서 저장하는 코드이다. 실제로 쓸 경우를 생각해보면 raw 데이터를 하나의 sheet로 저장하고, 집계 데이터를 또 다른 sheet로 저장하면 편리할 것 같다. 대부분의 데이터분석에서 raw sheet와 리포트 sheet를 구분하고 있으니, 그 작업을 파이썬에서 바로 마무리할 수도 있겠다. 


Where there is a will there is a way