본문 바로가기
Challange

패스트캠퍼스 환급챌린지 53일차 미션 (3월 24일) : 데이터 분석 Master Class 강의 후기

by @0-0 2024. 3. 24.
반응형

53일차!!

 

이제 챌린지의 종료까지 단 일주일만을 남겨두고 있다!

얼마남지 않은 지금 할 일이 정말 너무 많아서

이런 바쁜 와중에 블로그를 쓰는게 정말 힘들지만 끝까지 놓치지 않고 해나가고 싶다!

 

오늘 배운 내용은 우선 R에서 데이터 분석의 핵심! 데이터 프레임이다.

이는 엑셀 시트와 비슷한 형태로, 각 열이 변수를 나타내고 행이 관측값을 나타낸다.

read.csv() 함수를 사용해 CSV 파일을 불러오고,

write.csv()로 데이터를 저장할 수 있다.

오늘 배운 기본적인 데이터 조작을 통해 분석의 기초를 다지고,

복잡한 데이터 분석으로 나아갈 수 있는 발판을 마련했다.

R은 분석 언어의 마지막 챕터인데 이에 접어들며,

배운 내용을 실제 데이터에 적용해보며 또 새로운 내용을 잘 배워가고 싶다!

 

 

 

 

 

 


 

Part 4. R _ 데이터 분석 기초

 

 

 

 

 

 

01. 데이터 기초 개념

 

1. 데이터 프레임

: 행, 열로 이루어진 2차원 테이블 형태의 자료구조, 다양한 유형의 데이터를 저장하고 조작하는데 사용

 

- : 속성을 나타냄   = 변수, 컬럼

- : 열에 대한 정보를 나타냄   = 로우, 케이스

 

# 벡터
v1 <- c(1, 2, 3)

# 행렬 : 2차원 벡터
m1 <- matrix(1:12, 3, 4)

# 배열
a1 <- array(1:12, c(2, 3, 2))

# 데이터 프레임
df1 <- data.frame(id = 1:3,
		  name = c('A', 'B', 'C'),
                  grade = c(4, 5, 3))
                  
# 리스트
li <- list(v1, a1, m1, df1)

dataframe

 

 

 

2. 외부 데이터 호출

# csv 호출
csv1 <- read.csv("csv 파일 위치")
head(csv1)

csv2 <- read.csv("csv 파일 위치", header = F) # 헤더 없음 처리


# 컬럼명 변경
names(csv2)
names(csv2) <- c('id', 'ename', 'dept_no', 'level', 'join_date', 'gender', 'base', 'bonus')

names(csv2)[4] <- 'job_level' # 특정 컬럼명 변경


# csv 파일 저장
write.csv(csv2, file = 'csv22.csv')

 

read csv file

 

 

 

3. 데이터 조작

# 데이터 프레임 복사
emp <- csv1


# 파생변수
emp$total <- emp$base + emp$bonus
emp$country <- 'Korea'


# 조건문
emp$city <- ifelse(emp$job_level == 1 | emp$job_level == 2,"junior",
                   ifelse(emp$job_level == 3 | emp$job_level == 4, "intermediate", "senior"))

 

 

4. 데이터 파악

 

 

 

 

 

 

 

 

 

 

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

 

 

 

 

:: https://bit.ly/48sS29N

 

패스트캠퍼스 [직장인 실무교육]

프로그래밍, 영상편집, UX/UI, 마케팅, 데이터 분석, 엑셀강의, The RED, 국비지원, 기업교육, 서비스 제공.

fastcampus.co.kr

 

반응형