Pandas - .pivot

jaegom's study room

파이썬/파이썬 기본

jaegomhoji 2022. 2. 23. 14:50

** 구성은

pd.pivot_table(data= , index, columns, values, aggfunc) 로 이루어짐

data.pivot_table( , , ,) 도 동일

* index -> 기준 (인덱스)

* values -> 보고싶은 값 ( 결과 )

* column -> 지정하게 되면 전체 칼럼이 아닌 지정한 컬럼의 범주가 컬럼이되며, 그에 해당하는 벨류들이 출력된다

* aggfunc -> 수행할 연산 ( 함수 , len 등도 사용 가능 )

+ fill_value=0 옵션을 사용하면 NaN 값이 지정한 옵션대로 출력된다

+ 멀티 인덱스도 설정 가능하다 ( 두 개 이상의 index와 values 값도 설정 가능하다 )

> 인덱스 안에 string data type으로 넣어준다

df.pivot_table(index=["idx1","idx2","idx3",.... ])

+ margins = True 옵션 시 총계 값도 출력한다

* 깔끔한 파일의 경우 멀티 컬럼 멀티 인덱스가 있어서 , 피벗 테이블 제작시 몹시 귀찮은 해당 문제를 해결해야 한다.

> 그럴땐 data.columns.droplevel([0,n]) 이런식으로 상위 레벨의 칼럼을 날려버릴 수 있다

> 데이터에 접근할때는 멀티레벨 인덱스로 접근해야 한다. data[indexlevel0,indexlevel1,indexlevel2]

'파이썬/파이썬 기본' 관련글

Comments