예전에 타리크 라시드의 '신경망 첫걸음'이라는 책으로 머신러닝 공부하면서 정리한 개념을 다시 정리한다.
머신러닝 개념 정리
1. 학습 모델 종류
•
의사결정트리 : 기호주의, 귀납적 추론
•
신경망 기반 : 노드, 연결주의
•
KNN, 서포트벡터머신 : 유사성 근거로 학습
•
베이지안모델 : 확률 추론
•
유전 알고리즘 : 모든 선택은 자연 선택에 의해 이뤄진다, 진화주의, 유전학
•
모델 앙상블(여러 학습 모델을 활용하는 것)
2. 모델 평가하기
•
에러의 제곱
•
정확도
•
우도 (가능도) : 모델의 예측값을 '가능성'이 큰 쪽으로 이동시킨다. 로그함수 이용
•
정밀도와 재현률
•
엔트로피
3. 머신러닝의 응용분야
•
분류 : 특정 데이터에 레이블을 붙여 분류
•
클러스터링 : 데이터의 유사성을 기반으로 데이터를 여러 그룹으로 나눈다.
•
추천 : 과거 데이터를 기반으로 다른 제품 추천
•
회귀 : 과거 데이터를 기반으로 미래, 미래 데이터를 예측하는 것 (판매, 주가 예측)
•
차원 축소 : 데이터의 특성을 유지하면서 데이터 양을 줄여주는 것 (많은 데이터를 계산하기보다는 특성을 기반으로 데이터 양을 줄여 메모리 양을 줄이고 계산 속도를 빠르게 함)
4. 활성화 함수(activation function)
생물학적 뉴런은 입력된 신호의 합들이 특정 분계점을 넘을 때에만 반응한다.
즉, 딸기를 보았을 때, 빨간색, 씨앗, 달콤한 냄새, 시큼한 냄새 등 입력 신호의 합이 '딸기'라는 점을 넘어섰을 때
우리는 '딸기'임을 인식하는 반응(출력)을 한다.
활성화함수도 이와 마찬가지로, 입력된 값들을 합해보았을 때 특정 분계점을 넘지 않으면 반응하지 않고,
특정 분계점을 넘으면 반응을 할 수 있게 해주는 함수이다.
활성화함수는 여러 종류가 있고 그중에서도 ReLU함수가 실무에서 많이 쓰이지만 학습 용도로는 시그모이드 함수가 쉽다.
•
ReLU 함수는 입력이 0보다 크면 입력을 그대로 반환. 0보다 작으면 0을 반환