정규화
2022. 3. 12. 17:59ㆍAI/Machine learning
- 목차
반응형
정규화
- Normalization
- Standardization
- Regularization
Normalization
값의 범위를 특정 범위로 바꾸는 것
e.g., 0 - 1 사이로 값을 조절
(val - min_val) / (max_val - min_val)
- 학습 시 gradient가 fluctuation 하는 것을 막고 optimal cost로 수렴하게 해 줌
- 영상의 HDR 처리와 같은 원리
- HDR 처리를 하면 어두운 곳부터 밝은곳까지 골고루 고르게 잘 보이게 됨
- 즉, 영상 내 전체 정보를 다 확보할 수 있음
- HDR 처리가 (정규화가) 되어 있지 않다면 어두운 부분이나 밝은 부분의 데이터가 보다 압축되어 있어서 손실됨
- HDR 처리를 하면 어두운 곳부터 밝은곳까지 골고루 고르게 잘 보이게 됨
Standardization
값의 범위 (scale)이 평균이 0, 분산이 1이 되도록 변환
즉, sample들의 분포를 표준 정규 분포화 시키는 것
단, 표준정규분포로 바꾸려면 sample들의 특징이 이미 정규분포여야 함
scikit-learn의 StandardScaler 등을 통해 수행 가능
Regularization
overfitting을 막기 위해서 가중치(weight)을 조절
L1 Regularization: Lasso
L2 Regularization: Lidge
반응형
'AI > Machine learning' 카테고리의 다른 글
검색 vs. 추천 (0) | 2022.03.13 |
---|---|
Content based filtering, collaborative filtering (0) | 2022.03.13 |
코사인 유사도(cosine similarity) (0) | 2022.03.06 |
로지스틱 회귀 logistic regression (0) | 2022.03.06 |
Modeling (모델링) (0) | 2022.03.06 |