23년 이전 글/머신러닝

지도 학습 알고리즘과 비지도 학습 알고리즘

지도 학습 알고리즘

대표적인 Task

분류(Classification)

예) 스팸필터

회귀(Regression)

예측변수라 부르는 특성(feature),(주행거리,연식등)을 사용해 중고차 가격 같은

타깃(target)수치를 예측하는 것

로지스틱회귀

클래스에 속할 확률을 출력

 

지도학습 알고리즘 종류

- K-최근접 이웃(K-nearest Neighbors, K개의 K)

- 선형 회귀(Linear Regression)

- 로지스틱 회귀(Logistic Regression)

- 서포트 벡터 머신(Support Vector Machine, SVM)

- 결정트리(Decision Tree)와 랜덤 포레스트(Random Forest)

- 신경망(Neural Networks)

 

비지도 학습 알고리즘의 종류

 

군집(clustering)

- K-평균(K-means)

- DBSCAN

- 계층 군집 분석(Hierarchical cluster analysis(HCA)

예) 레이블 없이 블로그 방문자 간의 연결고리를 찾기

- 이상치 탐지(Outlier Detection), 특이치 탐지(Novelty Detection)

예) 부정 거래를 막기 위해 이상한 신용카드 거래 감지, 제조 결함, 데이터셋 이상한 값 제거(이상치)

예) 훈련 세트에 있는 모든 샘플과 달라 보이는 새로운 샘플을 탐지(특이치)

- 원-클래스(One-Class SVM)

- 아이솔레이션 포레스트(Isolation Forest)

 

시각화(Visualization)와 차원 축소(Dimensionality Reduction)

레이블 없는 대규모의 고차원 데이터를 넣으면 도식화 가능한 2D나 3D표현을 만듦

상관관계가 겹치는 특성을 합치며 차원을 축소함

- 주성분 분석(Principal Component Analysis, PCA ) 

- 커널(Kernel PCA)

- 지역적 선형 임베딩(Locally-Linear Embedding , LLE)

- t-SNE(T-distributed Stochastic Neighbor Embedding)

 

연관 규칙 학습(Association Rule Learning)

대량의 데이터에서 특성 간의 흥미로운 관계를 찾는 알고리즘

사이킷런에서는 제공하지 않음

- 어프라이어리(Apriori)

- 이클렛(Eclat)

 

준지도 학습

일부만 레이블이 되어 있는 데이터로 학습

예) 구글 포토 호스팅 서비스

- 심층 신뢰 신경망(Deep Belief Network, DBN)

여러겹의 제한된 볼츠만 머신(Restricted Bolzmann Machine, RMB)의 비지도 학습을 기초로

순차적으로 훈련된 다음 전체 시스템이 지도 학습 방식으로 세밀하게 조정

 

강화 학습

에이전트가 환경을 관찰해서 행동하고 그 결과로 보상 또는 벌점을 받는 것

시간이 지나면서 보상을 얻기 위해 최상의 전략을 스스로 학습

예)딥마인드 알파고

 

반응형

'23년 이전 글 > 머신러닝' 카테고리의 다른 글

머신러닝의 주요 메커니즘  (0) 2022.01.10