[데이터 전처리] 피벗 테이블, 파일 호출 / 저장Data Analysis/EDA2023. 5. 3. 16:33
Table of Contents
반응형
1. 피벗 테이블
import pandas as pd
import numpy as np
df = pd.DataFrame({'가입월':[1,1,1,2,2,3],'탈퇴월':[1,2,3,2,3,3],'탈퇴회원수':[101,52,30,120,60,130]})
피벗테이블 이란 데이터프레임에서 두개의 열을 이용하요 행/열 인덱스가 재조정된 테이블을 의미합니다.
pivot_table() 함수를 사용하여 데이터프레임, 분석할 열, index, columns 등의 인자를 넣어서 사용 할 수 있습니다.
매우 유용하고 많은 기능을 제공하지만, 문법이 조금 까다롭습니다.
aggfunc : 집계 함수
fill_value : Nan 대체값
margins : 분석 결과를 오른쪽과 아래에 붙일지 여부
margins_name : 마진 열(행)의 이름
pivot = pd.pivot_table(df, values='탈퇴회원수', index=['가입월'], columns=['탈퇴월'])

2. 파일 호출 / 저장
반응형
'Data Analysis > EDA' 카테고리의 다른 글
| [EDA] EDA는 코드보다 질문이 먼저다 : 데이터를 탐색하는 사고 순서 (0) | 2026.05.24 |
|---|---|
| [데이터 전처리] 그룹화 (0) | 2023.05.02 |
| [데이터 전처리] 데이터 결합 (0) | 2023.05.01 |
| [데이터 전처리] 레코드 칼럼 추가, 삭제, apply.map (0) | 2023.04.27 |
| [데이터 전처리] 결측값 처리 (0) | 2023.04.26 |
@모모띠 :: Data Lab :: Journey From Data to Insight
Notice
HELLO WORLD
안녕하세요. 데이터로 말하는 분석가 모모입니다.
데이터를 구조화하고 분석하는 과정과 실무에 활용되는 도구 중심의 내용을 기록합니다.
Popular
New
Recommend