본문 바로가기
Challange

패스트캠퍼스 환급챌린지 57일차 미션 (3월 28일) : 데이터 분석 Master Class 강의 후기

by @0-0 2024. 3. 28.
반응형

57일차!

 

데이터 가공을 끝내고 데이터를 정제하는 과정에 대해 배웠다!

 

오늘 처음 배운 것은 "tidverse" 라이브러리인데

tidverse 라이브러리에는 데이터를 가공하는 dplyr,

데이터를 불러올 때 사용하는 readr,

데이터 시각화에 많이 사용되는 ggplot까지

데이터 분석의 일련의 과정에서 쓰일 수 있는

다양한 패키지들이 들어있는 라이브러리였다!

 

두번째로 배운 개념은 tidy 데이터였다!

tidy 데이터는 앞서 배운 엑셀에서도 배운 데이터 형식이다.

한 눈에 보기엔 가독성이 떨어질 수는 있지만

컴퓨터를 사용한 분석에 최적화될 수 있도록 데이터 형식을 만드는 것이다.

배웠던 내용이었지만 이번 강의를 통해

tidy 데이터에 대한 내용을 다시 한 번 복습할 수 있었다.

 

또한 마지막으로 pivot_longer와 pivot_wider으로 피봇팅을 하는 방법을 배웠는데

피봇팅을 잘 하려면

테이블을 어떻게 구성하고 싶은지,

코드로 구현하기 전 잘 구상해 놓아야 할 것 같다.

 

 

 

 


 

Part 4. R _ 데이터 분석 기초

 

 

 

 

 

 

03. 데이터 정제

 

1. tidverse 생태계

 

1) tidyr 라이브러리

: 데이터 정제 패키지

- "tidyr is designed specifically for tidying data, not general reshaping"

 

 

2) tidverse 생태계

: 데이터 형식에 대한 공통된 규칙을 토대로 데이터 조작부터 분석, 시각화까지 원활하게 진행되도록 설계된 패키지의 모음

install.packages("tidverse")

library(tidverse)

tidy data

 

 

 

2. tidy 데이터

 

1) tidy 데이터 규칙

① 각 변수는 열을 형성

② 각 관찰값은 행을 형성

③ 각 유형의 관찰 단위(값)은 테이블을 구성

 

 

2) untidy 데이터 성질

- 열 이름이 변수 이름이 아니고 값인 데이터

- 여러 변수가 하나의 열에 저장된 데이터

- 변수가 열과 행 모두에 저장된 데이터

- 여러 유형의 다른 관측 단위가 동일한 테이블에 저장된 데이터

- 단일 관측 단위가 여러 테이블에 저장된 데이터

 

 

 

3. 피봇팅

 

1) Pivot

- pivot :  축을 중심으로 회전하다/회전시키다 ⇒ 특정 변수를 기준으로 위,아래/옆으로 길게 늘리는 것

 

- 축으로 데이터를 전환시키는 기법

① pivot_longer(data, cols, names_to, values_to)

② pivot_wider(data, names_from, values_from)

 

stu1_long <- pivot_longer(stu1,
             col = c('year1', 'year2'),
             names_to = 'year',
             values_to = 'math')

pivot_wider(stu1_long,
            names_from = year,
            values_from = math)

tidy data

 

 

+ 응용

stu2 %>%
	group_by(id, name, year) %>%
	summarize(avg_math = mean(math)) %>%
	pivot_wider(names_from = 'year',
			values_from = avg_math)

 

 

 

 

 

 

 

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

 

 

 

 

:: https://bit.ly/48sS29N

 

패스트캠퍼스 [직장인 실무교육]

프로그래밍, 영상편집, UX/UI, 마케팅, 데이터 분석, 엑셀강의, The RED, 국비지원, 기업교육, 서비스 제공.

fastcampus.co.kr

 

반응형