<Regularization>
1. Overfitting
2. Regularization
Overfitting

Underfitting: High bias, Low variance
Overfitting: Low bias, High variance → 새로운 sample에 대한 일반화 ↓
overfitting 감소법
1. Feature 개수 감소
- 적절한 Feature들만 선택
- Model selection algorthm
2. Regularization
- 모든 Feature들 유지한 채, parameters θj의 value 감소
- Feature들 기여도 감소
| Regularization Parameter λ↑ | Regularization paramter λ↓ | Feature 수↑ | Feature 수↓ |
| go Underfitting | go Overfitting | go Overfitting | go Underfitting |
Regularization
Cost function with Regularization

- λ 값이 커질수록 go Underfitting
- j = 1부터 시작 → θ0(y절편) 제외하고 시작 → θ₁, θ₂, θ₃, ... regularization

→ Train Loss가 가장 낮더라도 Overfitting되어 Test Loss에서 높은 Loss 발생
L1 Regularization: θ의 가중치가 0에 접근하면서 결국 수렴

- 가중치의 크기값 포함
- 작은 가중치들은 거의 0에 수렴
- 중요한 가중치들만 남게 된다.
- sparse model에 효과적
- Lasso regression

L2 Regularization: θ의 가중치가 0에 접근하지만 수렴하지는 않음

- 가중치의 제곱 포함
- 가중치의 크기가 더 직접적인 영향
- Ridge regression

'Machine Learning' 카테고리의 다른 글
| Clustering (0) | 2022.05.27 |
|---|---|
| Dimension Reduction (0) | 2022.05.25 |
| Cross Validation & Dimension Reduction (0) | 2022.05.24 |
| Logistic Regression (0) | 2022.05.20 |