[데이터 전처리] 결측값 처리Data Analysis/EDA2023. 4. 26. 20:28
Table of Contents
반응형
1. 결측값 처리
import pandas as pa
import numpy as np
df = pd.DataFrame({'a':[1,1,3,4,5], 'b':[2,3,np.nan,3,4], 'c':[3,4,7,6,4]})

isnull() 함수를 사용해서 결측 유무를 확인 할 수 있습니다.
df.isnull()

dropna() 함수를 사용해서 결측값이 포함된 행을 지울 수 있습니다.
df.dropna(axis=1) #1열 제거

fillna() 함수를 사용해서 특정값을 결측값을 대체할 수 있습니다.
df.fillna(0, inplace=True)
df

fillna() 함수의 인자로 method를 사용하면, 앞, 뒤 값등으로 대체 할 수 있습니다.
2. 타입 변환
df = pd.DataFrame({'판매일':['5/11/21','5/12/21','5/13/21','5/14/21','5/15/21'],
'판매량':['10','15','20','25','30'],
'방문자수':['10','-','17','23','25'],
'기온':['24.1','24.3','24.8','25','25.4']})
dtypes 함수로 열 별 타입을 확인 할 수 있습니다.
df.dtypes

astype() 함수를 사용하면 원하는 열의 타입을 원하는 타입으로 변환 할 수 있습니다.
df = df.astype({'판매량':'int'})
to_datatime()함수를 이용하면 날짜를 format 형식으로 변환 할 수 있습니다.
df['판매일'] = pd.to_datetime(df['판매일'], format="%m/%d/%y")
반응형
'Data Analysis > EDA' 카테고리의 다른 글
| [EDA] EDA는 코드보다 질문이 먼저다 : 데이터를 탐색하는 사고 순서 (0) | 2026.05.24 |
|---|---|
| [데이터 전처리] 피벗 테이블, 파일 호출 / 저장 (0) | 2023.05.03 |
| [데이터 전처리] 그룹화 (0) | 2023.05.02 |
| [데이터 전처리] 데이터 결합 (0) | 2023.05.01 |
| [데이터 전처리] 레코드 칼럼 추가, 삭제, apply.map (0) | 2023.04.27 |
@모모띠 :: Data Lab :: Journey From Data to Insight
Notice
HELLO WORLD
안녕하세요. 데이터로 말하는 분석가 모모입니다.
데이터를 구조화하고 분석하는 과정과 실무에 활용되는 도구 중심의 내용을 기록합니다.
Popular
New
Recommend