머신러닝을 설명할 때 가장 먼저 등장하는 구분이 있습니다. 지난번 글에도 등장했던,,,! 바로 지도학습과 비지도학습입니다.
이 구분은 단순한 이론적 분류가 아니라 문제 정의 단계에서 가장 먼저 결정해야 할 요소입니다. 라벨이 존재하는지 여부에 따라 모델의 학습 방식과 평가 기준이 완전히 달라지기 때문입니다. 오늘은 이 두 가지 학습 방식의 구조적 차이를 정리해보겠습니다.

1. 지도학습 (Supervised Learning)
지도학습은 정답(라벨)이 있는 데이터를 기반으로 학습합니다. 입력(X)과 출력(Y)이 명확히 정의되어 있으며 모델은 입력과 출력 사이의 관계를 학습합니다.
구조는 다음과 같습니다.
입력 데이터(X) + 정답(Y) → 모델 학습
새로운 입력(X) → 예측 결과(Ŷ)
1.1 지도학습의 유형
지도학습은 크게 두 가지로 나뉩니다.
① 회귀 (Regression)
연속적인 값을 예측하는 문제입니다.
예: 매출 예측, 가격 예측, 수요 예측
대표 모델:
- Linear Regression
- Ridge / Lasso
- Random Forest Regressor
- Gradient Boosting Regressor
② 분류 (Classification)
범주형 값을 예측하는 문제입니다.
예: 스팸 여부, 정상/이상 구분, 감정 분류
대표 모델:
- Logistic Regression
- Decision Tree
- Random Forest
- XGBoost / LightGBM
1.2 지도학습의 특징
- 명확한 평가 지표 존재 (MSE, Accuracy, F1 등)
- 성능 비교가 상대적으로 명확
- 라벨 품질이 모델 성능에 직접적인 영향
실무에서는 데이터가 충분하고 라벨 기준이 명확할 때 지도학습이 가장 안정적인 선택이 됩니다.
2. 비지도학습 (Unsupervised Learning)
비지도학습은 정답(라벨)이 없는 데이터를 학습합니다. 모델은 데이터 내부의 구조나 패턴을 스스로 찾습니다.
구조는 다음과 같습니다.
입력 데이터(X) → 패턴 / 군집 / 이상치 탐색
2.1 비지도학습의 유형
① 군집화 (Clustering)
데이터를 유사한 그룹으로 묶는 방법입니다.
대표 모델:
- K-Means
- Hierarchical Clustering
- DBSCAN
- Gaussian Mixture Model
② 차원 축소 (Dimensionality Reduction)
데이터의 주요 특징을 유지하면서
차원을 줄이는 방법입니다.
대표 모델:
- PCA
- t-SNE
- UMAP
2.2 비지도학습의 특징
- 명확한 정답이 없음
- 평가 기준이 상대적으로 모호
- 탐색적 분석(EDA)과 밀접하게 연결
비지도학습은 라벨을 만들기 위한 전 단계로 활용되기도 합니다.
| 구분 | 지도학습 | 비지도학습 |
| 라벨 존재 | 있음 | 없음 |
| 목표 | 예측 정확도 향상 | 데이터 구조 파악 |
| 평가 방식 | 명확한 지표 존재 | 상대적으로 모호 |
| 활용 시점 | 문제 정의 후 | 문제 탐색 단계 |
3. 문제 정의 단계에서 판단 기준
문제를 정의할 때 가장 먼저 점검해야 할 질문은 다음입니다.
- 예측해야 할 명확한 결과값이 존재하는가?
- 라벨을 신뢰할 수 있는가?
- 라벨을 만드는 것이 가능한가?
라벨이 존재하고 신뢰 가능하다면 지도학습이 적합합니다.
라벨이 없고 데이터 구조를 먼저 이해해야 한다면 비지도학습이 출발점이 됩니다.
정리
지도학습과 비지도학습의 차이는 단순한 이론 구분이 아닙니다.
- 라벨의 존재 여부
- 평가 방식의 명확성
- 문제 해결 단계
이 세 가지가 핵심 차이입니다. 문제를 정의할 때 먼저 학습 방식부터 명확히 구분하는 것이 모델 선택보다 중요한 출발점이 됩니다.
'AI & ML > ML' 카테고리의 다른 글
| [머신러닝] 결정 트리: 모델이 스스로 질문을 만드는 방법 (0) | 2026.05.06 |
|---|---|
| [머신러닝] 로지스틱 회귀: 분류 문제를 확률로 푸는 방법 (0) | 2026.04.26 |
| [머신러닝] 선형 회귀: 가장 단순한 모델의 작동 원리 (0) | 2026.04.26 |
| [머신러닝] 지도학습(회귀모델 vs 분류모델) (3) | 2026.02.17 |
| [머신러닝] 머신러닝의 시작은 문제 정의다 (0) | 2026.02.16 |
HELLO WORLD
안녕하세요. 데이터로 말하는 분석가 모모입니다.
데이터를 구조화하고 분석하는 과정과 실무에 활용되는 도구 중심의 내용을 기록합니다.