Machine Learning

Normalization

by Minwoo 2019. 9. 18.

목차

    Normalization

     

    Data Normalization 은 데이터의 범위를 사용자가 원하는 범위로 제한하는 것이다. 이미지 데이터의 경우 픽셀 정보를 0~255 사이의 값으로 가지는데, 이를 255로 나누어주면 0~1.0 사이의 값을 가지게 될 것이다.

     

    위의 예를 수식으로 간단하게 쓴다면,

     

    (정규화하고자 하는 값 - 데이터 값들 중 최소값) / (데이터 값들 중 최대값 - 데이터 값들 중 최소값)

     

    이다. 

     

    다른 방법으로는

     

    (정규화하고자 하는 값 - 데이터의 평균) / 데이터의 표준편차

     

    가 있다.

     

    두번째 경우는 Standardization 이라고도 한다.

     

     

     

    왜 하는데?

     

    학습을 더 빨리하고 Local optimum 에 빠지는 가능성을 줄이는 등의 다양한 실용적 이유가 있다.

     

    직관적 이해를 위해 그림을 첨부한다.

     

    Normalization
    Normalization

     

    Geoffrey Hinton 교수님의 자료이다. Optimum 이 주어진 Cost function space 의 중심에 있을 때, 형태가 Elongated 된 것 보다 Spherical 한 것이 Gradient descent 방법으로 찾아갈 때 더 빠를 것이라고 이해할 수 있다.

     

    Normalization

     

    출처[2]

     

    Andrew Ng 교수님의 자료가 더 도움이 될지도 모르겠다.

     

    Normalization

     

    그래프를 깔끔하게 그리기 번거로워서 간단하게 파워포인트로 그렸다. 왼쪽이 정규화 하지 않은 경우의 Cost function 이고 오른쪽이 정규화 한 Cost function 일 때, 정규화 한 경우가 Local optimum 에서 더 빨리 빠져나올 수 있다는 것을 직관적으로 이해할 수 있을 것이다.



    source: 

    https://light-tree.tistory.com/132?category=755497 

    댓글