패스트캠퍼스 환급챌린지 58일차 미션 (3월 29일) : 데이터 분석 Master Class 강의 후기
58일차! 멀고도 멀게 느껴졌던 60일도 이틀만을 남겨두고 있다!60일 간 강의를 모두 듣고 싶었지만,, 생각보다 강의가 많았다ㅎㅎ이틀동안 남은 강의들을 꾸준히 잘 듣고이번 챌린지를 통해 잡아놓은 매일의 공부 습관을 꼭 지켜나갈 것이다! 오늘은 어제에 이어 데이터 정제에 대해 배웠다.특히 데이터 분석 전 꼭 확인해야 할결측치, 이상치를 확인하고, 처리하는 방법에 대해 배웠다. anyNA(), is.na()를 사용하여 결측치를 확인하고,drop_na(), na.omit(), replace_na()를 통해 결측치를 처리한다.이상치의 경우 통계기법이나 박스플롯을 사용하여 확인한 후,replace를 사용하여 대체하거나, 삭제하는 등의처리기법을 통해 처리한다. Part 4. R _ 데이터 정제 0..
2024. 3. 29.
패스트캠퍼스 환급챌린지 55일차 미션 (3월 26일) : 데이터 분석 Master Class 강의 후기
55일차! R의 'dplyr' 라이브러리의 두 번째 시간이었다!arrange(), mutate(), group_by(), summarize()를 배웠다. 이 함수들은 데이터를 정렬, 변환, 그룹화하고, 그룹별 요약 통계를 계산하는 데 사용되는데복잡한 데이터 집합을 쉽게 다루고 분석할 수 있게 도와준다.'dplyr'라이브러리는 데이터 분석 과정에서 유용하게 쓰이므로이를 통해 데이터를 효율적으로 조작하고,분석의 질을 한 단계 끌어올릴 수 있다! Part 4. R _ 데이터 분석 기초 02. 데이터 가공 4. arrange(): 데이터 정렬 # 부서번호가 10, 40인 직원 중 id, ename열을 id 내림차순으로 적기emp %>% filter(dept_no) %in% c(10, 40) %..
2024. 3. 26.
패스트캠퍼스 환급챌린지 49일차 미션 (3월 20일) : 데이터 분석 Master Class 강의 후기
Part 3. PYTHON _ 데이터 분석 프로젝트 04. 파이썬 데이터 분석 프로젝트 6. 부동산 데이터: 최적의 자취방 구하기 4) 분석 - 여러 항목의 분포 확인하기 : 월세, 보증금, 전용면적, 연식, 역까지 최소거리for x in ['월세','보증금','전용면적(m2)','연식','역까지최소거리']: fig = px.box(data_frame = data_filtered, x=x, width=700, height=400) fig.show() - 월세, 전용면적, 연식, 지하철까지 거리를 점수화 하기data_filtered['월세_등급'] = pd.qcut(data_filtered['월세'], 5, labels=[1,2,3,4,5])data_filtered['전용면적_등급'] ..
2024. 3. 20.