<Dimension Reduction>
1. Principal Component Analysis
2. Multidimensional Scaling
Principal Component Analysis
Principal Component Analysis (PCA)
- variation(변동성)이 가장 큰 axis를 찾아 projection 하여 dimension reduction
- Reduced 된 dimension은 모두 orthogonal
- Eigen-decomposition Algorithm

Multidimensional Scaling
Multidimensional Scaling (MDS)
- dimension reduction 전·후 좌표값들의 pairwise distance를 최대한 보존하는 게 목적

→ distanced value값을 측정하여 최소화
- Gradient-decent type algorithm
Sammon`s mapping
- MDS의 Local version
- large distance 한 값의 loss에 더 적은 가중치 부여

- gradient-decent type algorithm
cf) distance가 가깝다. = 두 vector가 더 밀접한 관계에 있다.
vector 사이의 유사도 측정법
1. Euclidean distance

- 유클리드 거리를 이용해 두 vector 사이의 거리 측정
- vector의 길이에 관여.
2. Cosine similarity

- vector 사이의 cosine 값을 구하여 유사도 측정
- vector의 길이에는 관여하지 않는다.

Euclidean distance → vector C는 vector D와 더 유사하다.
Cosine similarity → vector C는 vector B와 더 유사하다.
'Machine Learning' 카테고리의 다른 글
| Clustering (0) | 2022.05.27 |
|---|---|
| Cross Validation & Dimension Reduction (0) | 2022.05.24 |
| Regularization (0) | 2022.05.23 |
| Logistic Regression (0) | 2022.05.20 |