Pandas - .pivot_table 본문
** 구성은
pd.pivot_table(data= , index, columns, values, aggfunc) 로 이루어짐
data.pivot_table( , , ,) 도 동일
* index -> 기준 (인덱스)
* values -> 보고싶은 값 ( 결과 )
* column -> 지정하게 되면 전체 칼럼이 아닌 지정한 컬럼의 범주가 컬럼이되며, 그에 해당하는 벨류들이 출력된다
* aggfunc -> 수행할 연산 ( 함수 , len 등도 사용 가능 )
+ fill_value=0 옵션을 사용하면 NaN 값이 지정한 옵션대로 출력된다
+ 멀티 인덱스도 설정 가능하다 ( 두 개 이상의 index와 values 값도 설정 가능하다 )
> 인덱스 안에 string data type으로 넣어준다
df.pivot_table(index=["idx1","idx2","idx3",.... ])
+ margins = True 옵션 시 총계 값도 출력한다
* 깔끔한 파일의 경우 멀티 컬럼 멀티 인덱스가 있어서 , 피벗 테이블 제작시 몹시 귀찮은 해당 문제를 해결해야 한다.
> 그럴땐 data.columns.droplevel([0,n]) 이런식으로 상위 레벨의 칼럼을 날려버릴 수 있다
> 데이터에 접근할때는 멀티레벨 인덱스로 접근해야 한다. data[indexlevel0,indexlevel1,indexlevel2]
'파이썬 > 파이썬 기본' 카테고리의 다른 글
for 문 ++ (0) | 2022.02.23 |
---|---|
pip 설치 / module 직접 설치하기 (0) | 2022.02.23 |
Packages = Matplotlib (0) | 2022.02.23 |
Packages - Pandas (0) | 2022.02.22 |
예외, 예외처리 방법들 (0) | 2022.02.03 |
Comments