본문 바로가기

Pandas - .pivot_table 본문

파이썬/파이썬 기본

Pandas - .pivot_table

jaegomhoji 2022. 2. 23. 14:50

 

** 구성은 

pd.pivot_table(data= , index, columns, values, aggfunc) 로 이루어짐 

data.pivot_table( , , ,) 도 동일 

 

* index -> 기준 (인덱스)

* values -> 보고싶은 값 ( 결과 )

* column -> 지정하게 되면 전체 칼럼이 아닌 지정한 컬럼의 범주가 컬럼이되며, 그에 해당하는 벨류들이 출력된다 

* aggfunc -> 수행할 연산 ( 함수 , len 등도 사용 가능 )

 

+ fill_value=0 옵션을 사용하면 NaN 값이 지정한 옵션대로 출력된다 

+ 멀티 인덱스도 설정 가능하다 ( 두 개 이상의 index와 values 값도 설정 가능하다 )

> 인덱스 안에 string data type으로 넣어준다 

df.pivot_table(index=["idx1","idx2","idx3",.... ]) 

 

+ margins = True 옵션 시 총계 값도 출력한다 

 

* 깔끔한 파일의 경우 멀티 컬럼 멀티 인덱스가 있어서 , 피벗 테이블 제작시 몹시 귀찮은 해당 문제를 해결해야 한다. 

> 그럴땐 data.columns.droplevel([0,n]) 이런식으로 상위 레벨의 칼럼을 날려버릴 수 있다 

> 데이터에 접근할때는 멀티레벨 인덱스로 접근해야 한다. data[indexlevel0,indexlevel1,indexlevel2] 

 

'파이썬 > 파이썬 기본' 카테고리의 다른 글

for 문 ++  (0) 2022.02.23
pip 설치 / module 직접 설치하기  (0) 2022.02.23
Packages = Matplotlib  (0) 2022.02.23
Packages - Pandas  (0) 2022.02.22
예외, 예외처리 방법들  (0) 2022.02.03
Comments