공식
- s^2 = (X^2-nE(X)^2)/(n-1)
- 표준편차=s : X의 퍼짐성 측도
- 표준오차=s/root(n) : 표본평균 X-bar의 퍼짐성. variability.
- 변동계수=s/x-bar*100 : 표본평균에 대해 흩어진 정도. 단위 없음.
- 공분산=Cov(X,Y)=E(XY)-E(X)E(Y)
- 상관계수=r=Cov(X,Y)/(sx.sy)
- 결정계수=r^2
- 분산팽창지수(VIF) = 1/(1-r^2) 10이상이면 유의
오답
- 유의확률: 유의수준과 비교하여 귀무가설의 기각과 채택을 결정하는 기준이 되는 값
- 제2종오류: 가설검정에 있어서 귀무가설이 거짓인데 거짓인 귀무가설을 채택하는 것
- 상관관계는 두 변수 간의 분산에 차이가 있는지를 검정하는 것이다. (X)
- 확률표본추출: 시간과 비용이 많이 든다. (O)
- 비확률표본 추출
- 할당표본 추출: 층화표본과 비슷(비율을 고려), randomly sampling
- 유의표본: 의도적으로 추출. 정보 갖고 추출. 예비조사, 시험조사. 주관O
- 임의표본=간편추출: 쉽게 표본 선택, 시간비용 절약. 편견O. 대표성 문제.
- 누적표본=눈덩이표집: 주위 사람들 조사. 사생활 보호O. 어려움.
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터분석기사 필기 문제풀이 - 1과목 (0) | 2021.04.16 |
---|