반응형
53일차!!
이제 챌린지의 종료까지 단 일주일만을 남겨두고 있다!
얼마남지 않은 지금 할 일이 정말 너무 많아서
이런 바쁜 와중에 블로그를 쓰는게 정말 힘들지만 끝까지 놓치지 않고 해나가고 싶다!
오늘 배운 내용은 우선 R에서 데이터 분석의 핵심! 데이터 프레임이다.
이는 엑셀 시트와 비슷한 형태로, 각 열이 변수를 나타내고 행이 관측값을 나타낸다.
read.csv() 함수를 사용해 CSV 파일을 불러오고,
write.csv()로 데이터를 저장할 수 있다.
오늘 배운 기본적인 데이터 조작을 통해 분석의 기초를 다지고,
복잡한 데이터 분석으로 나아갈 수 있는 발판을 마련했다.
R은 분석 언어의 마지막 챕터인데 이에 접어들며,
배운 내용을 실제 데이터에 적용해보며 또 새로운 내용을 잘 배워가고 싶다!
Part 4. R _ 데이터 분석 기초
01. 데이터 기초 개념
1. 데이터 프레임
: 행, 열로 이루어진 2차원 테이블 형태의 자료구조, 다양한 유형의 데이터를 저장하고 조작하는데 사용
- 열 : 속성을 나타냄 = 변수, 컬럼
- 행 : 열에 대한 정보를 나타냄 = 로우, 케이스
# 벡터
v1 <- c(1, 2, 3)
# 행렬 : 2차원 벡터
m1 <- matrix(1:12, 3, 4)
# 배열
a1 <- array(1:12, c(2, 3, 2))
# 데이터 프레임
df1 <- data.frame(id = 1:3,
name = c('A', 'B', 'C'),
grade = c(4, 5, 3))
# 리스트
li <- list(v1, a1, m1, df1)
2. 외부 데이터 호출
# csv 호출
csv1 <- read.csv("csv 파일 위치")
head(csv1)
csv2 <- read.csv("csv 파일 위치", header = F) # 헤더 없음 처리
# 컬럼명 변경
names(csv2)
names(csv2) <- c('id', 'ename', 'dept_no', 'level', 'join_date', 'gender', 'base', 'bonus')
names(csv2)[4] <- 'job_level' # 특정 컬럼명 변경
# csv 파일 저장
write.csv(csv2, file = 'csv22.csv')
3. 데이터 조작
# 데이터 프레임 복사
emp <- csv1
# 파생변수
emp$total <- emp$base + emp$bonus
emp$country <- 'Korea'
# 조건문
emp$city <- ifelse(emp$job_level == 1 | emp$job_level == 2,"junior",
ifelse(emp$job_level == 3 | emp$job_level == 4, "intermediate", "senior"))
4. 데이터 파악
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
패스트캠퍼스 [직장인 실무교육]
프로그래밍, 영상편집, UX/UI, 마케팅, 데이터 분석, 엑셀강의, The RED, 국비지원, 기업교육, 서비스 제공.
fastcampus.co.kr
반응형
'Challange' 카테고리의 다른 글
패스트캠퍼스 환급챌린지 55일차 미션 (3월 26일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.26 |
---|---|
패스트캠퍼스 환급챌린지 54일차 미션 (3월 25일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.25 |
패스트캠퍼스 환급챌린지 52일차 미션 (3월 23일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.23 |
패스트캠퍼스 환급챌린지 51일차 미션 (3월 22일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.22 |
패스트캠퍼스 환급챌린지 50일차 미션 (3월 21일) : 데이터 분석 Master Class 강의 후기 (0) | 2024.03.21 |