Table
table()
- 인자로 주어진 데이터 x1, x2에 대한 빈도수를 구하는 함수
- 'table'유형의 R 객체를 반환
- 1개의 인자인 경우 도수분포표 2개의 인자인 경우 교차표를 반환
<사용방법>
table(x1)
or
table(x1,x2) ##이때 x1, x2는 범주로 구분할 수 있는 R벡터값
CrossTable()
- crosstable형태로 데이터 출력
gmodels 패키지 설치 필요
install.packages('gmodels')ㅔ
library(gmodels)
<사용방법>
CrossTable(x1,x2) ##이때 x1, x2는 범주로 구분할 수 있는 R벡터값
ex) CrossTable(df$sex, df$incm)
표에 나타나는 수치는 순서대로
1.일반횟수
2.카이로제곱분포
3.행 기준 분포 비율
4.열 기준 분포 비율
5.전체기준 분포 비율
prop.table()
- table의 값들의 비율(percentage)을 나타내는 함수
<사용방법>
prop.table(x) ##이때 x는 table()함수의 결과 값
ex) prop.table(table(df$sex))
주의사항 : x는 table()함수의 결과 값임을 기억하자! 그냥 column을 넣으면 각 인자들을 하나의 카테고리로 잘못인식함
막대 그래프(Bar Chart)
- 범주데이터(categorical data)를 다룰때 많이 사용됨
- 데이터들의 범주별 비교가 편리함
<사용방법>
barplot(data) ##이때 data는 데이터 벡터
ex) barplot(table(df$sex))
(추가인자로 legned = T를 주어 범례 표시 가능)
Pie Chart
- 범주의 수가 적은 경우, 상대적인 빈도를 표현하기에 적합함
<사용방법>
pie(data) ##이때 data는 데이터 벡터
ex) pie(table(df$sex))
주의사항 : table()의 결과 값을 입력으로 넣어줘야함 descr라이브러리의 freq()를 넣으면 비율값 또한 pie차트에 포함됨
'R 통계' 카테고리의 다른 글
[R] dataframe과 열의 차이 (1) | 2024.10.15 |
---|---|
[R] 데이터 전처리 -결측치 제거 (0) | 2024.10.15 |
[R] 정규성 분석 (0) | 2024.10.12 |
[R] 수치형 데이터와 그래프 (0) | 2024.10.12 |
[R] 외부 데이터 불러오기 (0) | 2024.10.12 |