56일차!
R의 'dplyr' 라이브러리의 마지막 시간이었다!
join()과 set operation을 이용한 데이터 결합, "dplyr"라이브러리의 기타 함수에 대해 배웠다.
join()의 경우, 엑셀부터 SQL, 파이썬 과정에서 모두 배웠기 때문에
개념은 익숙해서 사용하는 방법만 배우면 되었는데,
기준으로 삼는 컬럼을 설정하는 것만 달랐기 때문에 어렵지 않았다.
데이터 결합을 하는 다른 함수도 배웠지만
아무래도 데이터프레임을 결합할 때는,
기준을 가지고 결합하는 경우가 많기 때문에 join()의 사용이 압도적으로 많을 것 같다!
또한 set operation은 그냥 합집합, 교집합, 차집합이어서
이 내용도 쉽게 할 수 있었다!
또한 기타 함수들에서는 lead()와 lag와 같은 함수들을 배웠는데
for문 등을 따로 사용하지 않고
함수 하나로 유용하게 데이터 프레임을 조작할 수 있다는게
큰 장점인 것 같다!
Part 4. R _ 데이터 분석 기초
02. 데이터 가공
7. join()
: 데이터 결합
m1 <- data.frame(id = 1:3,
name = month.name[1:3])
m2 <- data.frame(id = 4:12,
name = month.name[4:12])
a1 <- data.frame(abb = month.abb[1:3])
a2 <- data.frame(abb = month.abb[2:5])
* month.name : 달의 이름 전체가 출력
* month.abb : 달의 이름 일부가 출력
1) 행 기준 합치기
- rbind()
* 만약 열의 갯수가 다르다면 결합되지 않음
- bind_rows()
* 열의 갯수가 달라도 결합 가능, 이때 결측값은 <NA>로 채워짐
2) 열 기준 합치기
- cbind()
- bind_cols()
* 행의 갯수가 달라도 합쳐짐
3) join()
- 위의 함수들은 어떠한 기준에 따라 합쳐지는게 아닌 그냥 서로 다른 데이터프레임을 붙이는 느낌
⇒ 이를 해결하기 위해 join()을 사용
8. set operation
: 행으로 데이터 합치기
m1 <- data.frame(id = 1:4,
name = month.name[1:4])
m2 <- data.frame(id = 3:7,
name = month.name[3:7])
m3 <- data.frame(id = 3:7,
name = month.name[3:7],
kname = c("3월", "4월", "5월", "6월", "7월"))
1) union()
: 합집합, 데이터를 합치되, 중복 데이터는 제거
2) intersect()
: 교집합
3) setdiff(A, B)
: 차집합, A-B의 결과를 출력
9. 기타 함수
1) all.equal(a, b) : 두 데이터프레임이 동일한지 확인
2) lead() : 선택된 열의 다음 행부터 출력
- 선택된 열과 lead열의 차이를 구하는 것과 같이 사용
3) lag() : 선택된 열의 이전 행부터 출력
4) min_rank() : 랭크를 매길 때 중복된 숫자를 상관하지 않고 순서대로 순서를 매김
ex. 1, 2, 3, 3, 3, 4
5) dense_rank() : 랭크를 매길 때 중복된 숫자만큼 건너뛴 후 순서대로 순서를 매김
ex. 1, 2, 3, 3, 3, 6
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
패스트캠퍼스 [직장인 실무교육]
프로그래밍, 영상편집, UX/UI, 마케팅, 데이터 분석, 엑셀강의, The RED, 국비지원, 기업교육, 서비스 제공.
fastcampus.co.kr
'Challange' 카테고리의 다른 글
패스트캠퍼스 환급챌린지 58일차 미션 (3월 29일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.29 |
---|---|
패스트캠퍼스 환급챌린지 57일차 미션 (3월 28일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.28 |
패스트캠퍼스 환급챌린지 55일차 미션 (3월 26일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.26 |
패스트캠퍼스 환급챌린지 54일차 미션 (3월 25일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.25 |
패스트캠퍼스 환급챌린지 53일차 미션 (3월 24일) : 데이터 분석 Master Class 강의 후기 (1) | 2024.03.24 |