[ Data Analysis Process ]
1. 분석 주제 정의
2. 데이터 수집
3. 데이터 전처리
4. 데이터 분석 및 모델링
1) 데이터 분할
2) 분석 모델 설정
3) 분석 모형 정의
4) 모델 검증/테스트
5. 결과 해석 및 시각화
분석 모델 설정
3. 머신러닝 기반 분석 모형
: 데이터의 패턴을 학습해, 이를 바탕으로 예측/분류 수행
1. 지도학습
1) 회귀
2) 분류
2. 비지도학습
1) 군집화
2) 차원 축소
3) 밀도 추정
4) 연관 규칙
3. 강화학습
1) 지도학습(Supervised Learning)
: 정답이 있는 데이터(labelled data)로 모델을 학습해 예측/분류 작업을 수행
(1) 회귀(Regression)
- 선형회귀(Linear Regression)
- 다항회귀(Polynominal Regression)
- Ridge 회귀 : L2 정규화를 이용한 규제를 추가한 선형회귀
- Lasso 회귀 : L1 정규화를 이용한 규제를 추가한 선형회귀
(2) 분류(Classification)
- K-NN(K-Nearest Neighbor)
- 나이브 베이즈(Naive Bayes)
- SVM(Support Vector Machine)
- 의사결정나무(Descision Tree)
- 로지스틱 회귀(Logistic Regression)
2) 비지도학습(Unsupervised Learning)
: 정답이 없는 데이터(Unlabelled data)로 데이터의 구조를 학습해, 데이터의 패턴을 찾거나 그룹화함
(1) 군집화(Clustering)
- K-Means
- DBSCAN
(2) 차원 축소(Dimension Reduction)
- PCA
- SVD(특이값 분해)
(3) 밀도 추정
- 커널 밀도 추정(KDE) : 커널 함수, 대역폭(h)의 매개변수를 사용해 확률 밀도를 추정
- 가우시안 혼합 모델(GMM)
- 자율적 공간 매핑(SOM; Self-Organizing Map) : 고차원 데이터를 저차원 격자로 투영해 데이터 밀도를 시각화로 표현
(4) 연관규칙
3) 강화학습(Reinforcement Learning)
: 에이전트(주체)가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습
* 참고
DA) Process _ 4-1) 통계 기반 분석 모형
더보기[ DA Process ]1. 분석 주제 정의2. 데이터 수집3. 데이터 정제4. 데이터 분석 1) 데이터 분할 2) 분석 모델 설정 3) 분석 모형 정의 4) 모델 검증/테스트5. 데이터 시각화 분석 모델
datasly9-9.tistory.com
DA) Process _ 4-2) 데이터마이닝 기반 분석 모형
더보기[ DA Process ]1. 분석 주제 정의2. 데이터 수집3. 데이터 정제4. 데이터 분석 1) 데이터 분할 2) 분석 모델 설정 3) 분석 모형 정의 4) 모델 검증/테스트5. 데이터 시각화 분석 모델
datasly9-9.tistory.com
'Data Analysis > Process' 카테고리의 다른 글
1. 분석 주제 정의 (0) | 2024.06.19 |
---|---|
4. 데이터 분석 및 모델링 _ (2-4) 데이터 유형에 따른 분석 모형 (0) | 2024.06.13 |
4. 데이터 분석 및 모델링 _ (2-2) 데이터마이닝 기반 분석 모형 (0) | 2024.06.11 |
4. 데이터 분석 및 모델링 _ (2-1) 통계 기반 분석 모형 (2) | 2024.06.10 |
4. 데이터 분석 및 모델링 _ (1) 데이터 분할 (0) | 2024.06.05 |