지도 학습 알고리즘
대표적인 Task
분류(Classification)
예) 스팸필터
회귀(Regression)
예측변수라 부르는 특성(feature),(주행거리,연식등)을 사용해 중고차 가격 같은
타깃(target)수치를 예측하는 것
로지스틱회귀
클래스에 속할 확률을 출력
지도학습 알고리즘 종류
- K-최근접 이웃(K-nearest Neighbors, K개의 K)
- 선형 회귀(Linear Regression)
- 로지스틱 회귀(Logistic Regression)
- 서포트 벡터 머신(Support Vector Machine, SVM)
- 결정트리(Decision Tree)와 랜덤 포레스트(Random Forest)
- 신경망(Neural Networks)
비지도 학습 알고리즘의 종류
군집(clustering)
- K-평균(K-means)
- DBSCAN
- 계층 군집 분석(Hierarchical cluster analysis(HCA)
예) 레이블 없이 블로그 방문자 간의 연결고리를 찾기
- 이상치 탐지(Outlier Detection), 특이치 탐지(Novelty Detection)
예) 부정 거래를 막기 위해 이상한 신용카드 거래 감지, 제조 결함, 데이터셋 이상한 값 제거(이상치)
예) 훈련 세트에 있는 모든 샘플과 달라 보이는 새로운 샘플을 탐지(특이치)
- 원-클래스(One-Class SVM)
- 아이솔레이션 포레스트(Isolation Forest)
시각화(Visualization)와 차원 축소(Dimensionality Reduction)
레이블 없는 대규모의 고차원 데이터를 넣으면 도식화 가능한 2D나 3D표현을 만듦
상관관계가 겹치는 특성을 합치며 차원을 축소함
- 주성분 분석(Principal Component Analysis, PCA )
- 커널(Kernel PCA)
- 지역적 선형 임베딩(Locally-Linear Embedding , LLE)
- t-SNE(T-distributed Stochastic Neighbor Embedding)
연관 규칙 학습(Association Rule Learning)
대량의 데이터에서 특성 간의 흥미로운 관계를 찾는 알고리즘
사이킷런에서는 제공하지 않음
- 어프라이어리(Apriori)
- 이클렛(Eclat)
준지도 학습
일부만 레이블이 되어 있는 데이터로 학습
예) 구글 포토 호스팅 서비스
- 심층 신뢰 신경망(Deep Belief Network, DBN)
여러겹의 제한된 볼츠만 머신(Restricted Bolzmann Machine, RMB)의 비지도 학습을 기초로
순차적으로 훈련된 다음 전체 시스템이 지도 학습 방식으로 세밀하게 조정
강화 학습
에이전트가 환경을 관찰해서 행동하고 그 결과로 보상 또는 벌점을 받는 것
시간이 지나면서 보상을 얻기 위해 최상의 전략을 스스로 학습
예)딥마인드 알파고
'23년 이전 글 > 머신러닝' 카테고리의 다른 글
머신러닝의 주요 메커니즘 (0) | 2022.01.10 |
---|