본문 바로가기

R 통계

[R] 범주형 데이터와 그래프

Table

table()

  • 인자로 주어진 데이터 x1, x2에 대한 빈도수를 구하는 함수
  • 'table'유형의 R 객체를 반환
    - 1개의 인자인 경우 도수분포표 2개의 인자인 경우 교차표를 반환

 

<사용방법>

table(x1)
or
table(x1,x2)  ##이때 x1, x2는 범주로 구분할 수 있는 R벡터값

 

인자가 1개인 table함수의 사용 예시

 

인자가 2개인 table함수의 사용 예시

 


CrossTable()

  • crosstable형태로 데이터 출력

gmodels 패키지 설치 필요

 

install.packages('gmodels')ㅔ

library(gmodels)

 

<사용방법>
CrossTable(x1,x2)   ##이때 x1, x2는 범주로 구분할 수 있는 R벡터값
ex) CrossTable(df$sex, df$incm)

표에 나타나는 수치는 순서대로
1.일반횟수
2.카이로제곱분포
3.행 기준 분포 비율
4.열 기준 분포 비율
5.전체기준 분포 비율


prop.table()

  • table의 값들의 비율(percentage)을 나타내는 함수
<사용방법>
prop.table(x)    ##이때 x는 table()함수의 결과 값
ex) prop.table(table(df$sex))

 

 

 

주의사항 : x는 table()함수의 결과 값임을 기억하자! 그냥 column을 넣으면 각 인자들을 하나의 카테고리로 잘못인식함

 


막대 그래프(Bar Chart)

  • 범주데이터(categorical data)를 다룰때 많이 사용됨
  • 데이터들의 범주별 비교가 편리함
<사용방법>
barplot(data)    ##이때 data는 데이터 벡터
ex) barplot(table(df$sex))
(추가인자로 legned = T를 주어 범례 표시 가능)

legend = F일때의 그래프

 

legend = T일때의 그래프


Pie Chart

  • 범주의 수가 적은 경우, 상대적인 빈도를 표현하기에 적합함
<사용방법>
pie(data)    ##이때 data는 데이터 벡터
ex) pie(table(df$sex))

 

주의사항 : table()의 결과 값을 입력으로 넣어줘야함 descr라이브러리의 freq()를 넣으면 비율값 또한 pie차트에 포함됨

'R 통계' 카테고리의 다른 글

[R] dataframe과 열의 차이  (1) 2024.10.15
[R] 데이터 전처리 -결측치 제거  (0) 2024.10.15
[R] 정규성 분석  (0) 2024.10.12
[R] 수치형 데이터와 그래프  (0) 2024.10.12
[R] 외부 데이터 불러오기  (0) 2024.10.12