본문 바로가기

차원 축소2

3. 데이터 전처리 _ (2) 분석 변수 처리 더보기[  Data Analysis Process  ]1. 분석 주제 정의2. 데이터 수집3. 데이터 전처리   1) 데이터 정제   2) 분석 변수 처리4. 데이터 분석 및 모델링5. 결과 해석 및 시각화 데이터 전처리2. 분석 변수 처리 1) 변수 선택: 적절한 변수를 선택하는 것은 계산의 효율성을 향상하고 과적합을 방지해, 모델의 성능을 향상하고 해석의 용이성을 높임 (1) 변수 유형 ① 독립 변수(x) : 설명/예측/원인 변수, 위험인자, 공변량(연속형), 요인(범주형)  ② 종속 변수(Y) : 반응/결과/표적 변수  (2) 변수 선택 방법 ① 도메인 지식 활용 : 도메인에 대한 전문지식을 참고해 중요한 변수를 선택  ② 필터 기법 : 데이터의 통계적 특성을 이용, 빠르고 간단하게 적용 가능상관분.. 2024. 6. 19.
ML) 차원 축소 차원 축소 비지도학습의 대표적 알고리즘으로 고차원의 raw 데이터를 데이터의 의미있는 특성을 유지하며 저차원의 데이터로 변환하는 기법 이유_ - 사람이 보기에 시각적으로 용이함 - 변수(피처, 컬럼)의 조합을 통해 새로운 변수 발견 - 차원의 저주 해결 * 차원의 저주: 차원(데이터의 특징)이 커질수록 분석을 위한 알고리즘 실행이 매우 복잡해지고 어려워짐. 이를 채우기 위한 데이터 수도 많아야 함. 이때 데이터가 충분하지 않으면 오버피팅의 문제가 발생할 수 있음 ⇒ 좋은 성능을 가진 이해하기 쉽고 빠르게 실행되는 모델을 만들기 위함 1. Feature Selection - 모델 구성에 사용할 의미있는 변수를 선택 → 변수의 하위 집합을 반환 2. Feature Extraction - 데이터에서 변수를 추.. 2024. 1. 8.