본문 바로가기
Data Analysis/Process

4. 데이터 분석 및 모델링 _ (2-3) 머신러닝 기반 분석 모형

by @0-0 2024. 6. 13.
반응형
더보기

[  Data Analysis Process  ]

1. 분석 주제 정의

2. 데이터 수집

3. 데이터 전처리

4. 데이터 분석 및 모델링

   1) 데이터 분할

   2) 분석 모델 설정

   3) 분석 모형 정의

   4) 모델 검증/테스트

5. 결과 해석 및 시각화

 

분석 모델 설정

 


3. 머신러닝 기반 분석 모형

: 데이터의 패턴을 학습해, 이를 바탕으로 예측/분류 수행

 

더보기

1. 지도학습

   1) 회귀

   2) 분류

   

2. 비지도학습

   1) 군집화

   2) 차원 축소

   3) 밀도 추정

   4) 연관 규칙

 

3. 강화학습

 

1) 지도학습(Supervised Learning)

: 정답이 있는 데이터(labelled data)로 모델을 학습해 예측/분류 작업을 수행

 

(1) 회귀(Regression)

  • 선형회귀(Linear Regression)
  • 다항회귀(Polynominal Regression)
  • Ridge 회귀 : L2 정규화를 이용한 규제를 추가한 선형회귀   
  • Lasso 회귀 : L1 정규화를 이용한 규제를 추가한 선형회귀

 

(2) 분류(Classification)

  • K-NN(K-Nearest Neighbor)
  • 나이브 베이즈(Naive Bayes)
  • SVM(Support Vector Machine)
  • 의사결정나무(Descision Tree)
  • 로지스틱 회귀(Logistic Regression)

2) 비지도학습(Unsupervised Learning)

: 정답이 없는 데이터(Unlabelled data)로 데이터의 구조를 학습해, 데이터의 패턴을 찾거나 그룹화함

 

(1) 군집화(Clustering)

  • K-Means
  • DBSCAN

 

(2) 차원 축소(Dimension Reduction)

  • PCA
  • SVD(특이값 분해)

 

(3) 밀도 추정

  • 커널 밀도 추정(KDE) : 커널 함수, 대역폭(h)의 매개변수를 사용해 확률 밀도를 추정
  • 가우시안 혼합 모델(GMM)
  • 자율적 공간 매핑(SOM; Self-Organizing Map) : 고차원 데이터를 저차원 격자로 투영해 데이터 밀도를 시각화로 표현

 

(4) 연관규칙

 


3) 강화학습(Reinforcement Learning)

: 에이전트(주체)가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습

 

 

 

* 참고

 

DA) Process _ 4-1) 통계 기반 분석 모형

더보기[  DA Process  ]1. 분석 주제 정의2. 데이터 수집3. 데이터 정제4. 데이터 분석   1) 데이터 분할   2) 분석 모델 설정   3) 분석 모형 정의   4) 모델 검증/테스트5. 데이터 시각화 분석 모델

datasly9-9.tistory.com

 

DA) Process _ 4-2) 데이터마이닝 기반 분석 모형

더보기[  DA Process  ]1. 분석 주제 정의2. 데이터 수집3. 데이터 정제4. 데이터 분석   1) 데이터 분할   2) 분석 모델 설정   3) 분석 모형 정의   4) 모델 검증/테스트5. 데이터 시각화 분석 모델

datasly9-9.tistory.com

 

반응형