머신러닝/기초

머신러닝의 종류

HeyTeddy 2021. 12. 19. 23:10
반응형

선형 회귀분석(Linear Regression)

- 독립변수와 종속변수가 선형적인 관계가 있다라는 가정하에 분석

- 직선을 통해 종속변수를 예측하기 때문에 독립변수의 중요도와 영향력을 파악하기 쉬움

의사결정나무(Decision Tree)

- 독립 변수의 조건에 따라 종속변수를 분리 (비가 내린다 -> 축구를 하지 않는다)

- 이해하기 쉬우나 overfitting이 잘 일어남

- 오버피팅(overfitting): 과적합, 훈련데이터에 너무 잘 맞아서 훈련데이터를 통한 정확도는 높으나, 테스트데이터에서 정확도가 낮게 나오는 현상

 

KNN(K-Nearest-Neighbor)

- 새로 들어온 데이터의 주변 k개의 데이터의 class로 분류하는 기법

- k는 사람이 지정, 사람이 지정해 줘야하는 것 -> 하이퍼파라미터

 

Neural Network

- 입력, 은닉, 출력츨으로 구성된 모형으로서 각 층을 연결하는 노드의 가중치를 업데이트하면서 학습

- 최근에 잘 안쓰임

SVM(Support Vector Machine)

- Class 간의 거리(margin)가 최대로 되도록 decision boundary를 만드는 방법

- 학습시간 오래걸림

- 최근에 잘 안쓰임

 

Ensemble Learning

- 여러 개의 모델(classifier or base learner)을 결합하여 사용하는 모델

- 데이터가 입력되었을 때, 여러개의 모델을 사용하고, 투표를 통해 최종 분류를 함.

- 좋고 다른 대회에서 자주 사용함, 앙상블 모델이 대부분 유리하게 나옴.

 

K-means clustering

- Label 없이 데이터의 군집으로 k개로 생성

- 비지도 학습의 대표적인 모델

- 랜덤하게 점을 찍고, 주변에 가까운 곳을 할당

- 단점: k에 따라 성능이 달라짐, 데이터가 고차원으로 갈수록 안맞는 모델

반응형

'머신러닝 > 기초' 카테고리의 다른 글

기업이 데이터 분석하는 과정  (0) 2023.06.28
모형의 적합성 평가 및 실험설계  (0) 2022.03.20
지도학습과 비지도학습  (0) 2021.12.19
머신러닝의 개념  (0) 2021.12.19