data analysis process2 4. 데이터 분석 및 모델링 _ (2-1) 통계 기반 분석 모형 더보기[ Data Analysis Process ]1. 분석 주제 정의2. 데이터 수집3. 데이터 전처리4. 데이터 분석 및 모델링 1) 데이터 분할 2) 분석 모델 설정 3) 분석 모형 정의 4) 모델 검증/테스트5. 결과 해석 및 시각화 분석 모델 설정: 모델링 결과 중 가장 우수한 알고리즘 선정 1. 통계 기반 분석 모형: 수집한 데이터를 이용해 유용한 정보를 뽑아내는 것 더보기1. 기술통계 분석 1) 중심경향성 2) 데이터 산포 3) 데이터 분포 2. 상관분석 3. 회귀분석 1) 단순회귀 2) 다중회귀 3) 다항회귀 4) 곡선회귀 5) 로지스틱회귀 6) 비선형회귀 4. 분산분석 1) 일원분산분석 2) 이원분산분석 3) 다변량 분산분석 .. 2024. 6. 10. 4. 데이터 분석 및 모델링 _ (1) 데이터 분할 더보기[ Data Analysis Process ]1. 분석 주제 정의2. 데이터 수집3. 데이터 전처리4. 데이터 분석 및 모델링 1) 데이터 분할 2) 분석 모델 설정 3) 분석 모형 정의 4) 모델 검증/테스트5. 결과 해석 및 시각화 데이터 분할: 모델의 성능 향상과 과적합 문제의 방지를 위해 적절한 데이터 분할이 필요 1. 과적합- 과적합은 모델의 복잡도와 학습 데이터의 양에 영향을 받음 1) 과대적합(Overfitting): 모델이 훈련 데이터에 지나치게 최적화되어 일반화된 성능을 나타내지 못하는 문제 (high bias)→ 모델이 훈련 데이터에 대해서는 높은 정확도를 보이지만, 새로운 데이터에 대해서는 성능이 낮아짐💡해결 방법- 데이터 수 늘리기- 파라미터 수가 적은 .. 2024. 6. 5. 이전 1 다음