자격증/빅데이터분석기사

공식 s^2 = (X^2-nE(X)^2)/(n-1) 표준편차=s : X의 퍼짐성 측도 표준오차=s/root(n) : 표본평균 X-bar의 퍼짐성. variability. 변동계수=s/x-bar*100 : 표본평균에 대해 흩어진 정도. 단위 없음. 공분산=Cov(X,Y)=E(XY)-E(X)E(Y) 상관계수=r=Cov(X,Y)/(sx.sy) 결정계수=r^2 분산팽창지수(VIF) = 1/(1-r^2) 10이상이면 유의 오답 유의확률: 유의수준과 비교하여 귀무가설의 기각과 채택을 결정하는 기준이 되는 값 제2종오류: 가설검정에 있어서 귀무가설이 거짓인데 거짓인 귀무가설을 채택하는 것 상관관계는 두 변수 간의 분산에 차이가 있는지를 검정하는 것이다. (X) 확률표본추출: 시간과 비용이 많이 든다. (O) 비확률표..
비정형 데이터: 소셜 미디어, 로그파일, 클릭스트림 ERP(Enterprise Resource Planning, 전사적지원관리) 데이터는 정형 데이터이다. 빅데이터는 컴퓨터 생산 기술의 발달보다 정보통신 기술(인터넷 등)의 발달, 컴퓨터 처리 속도의 성능 향상으로 인하여 전 분야로 확산되었다. 빅데이터 개념이 나온 배경은 1980 개인용 컴퓨터라기보다는 1990 인터넷의 확산이 적절하다. 자바 개발자는 응용 프로그램 개발을 담당하며, 빅데이터 분석을 위한 인력이 아니다. Hive 전문가는 분석용 데이터 소스를 처리한다. 빅데이터 분석 시 침착성, 창의성, 논리적 사고가 요구된다. 데이터 크기 단위: GB < TB < PB < EB < ZB < YB < BB < GeB 빅데이터에서는 제대로 정의된 데이터 ..
noodle-dev
'자격증/빅데이터분석기사' 카테고리의 글 목록