목표 시계열 데이터의 성분을 설명할 수 있다. 시계열 데이터의 특성에 맞는 통계 분석을 할 수 있다. 시계열 분석 절차를 순서대로 설명할 수 있다. 시계열 데이터 순차적인 시간의 흐름에 따라 기록된 데이터를 의미 Y=T+S+C+R 또는 Y = T * S * C * R 추세(Trend) = 시간의 흐름에 따라 점진적이고 지속적인 변화(지속적인 증가) 계절성(Seasonality) = 특정 주기에 따라 일정한 패턴을 갖는 변화(여름에는 많고, 겨울에는 적고) 싸이클(Cycle) = 경제 또는 사회적 요인에 의한 변화(예 : 경기 변동)이며, 일정 주기가 없고 장기적인 변화 잔차(Residuals) = 설명할 수 없는 변화(추세, 계절성, 싸이클로 설명할 수 없는 부분을 담당한다) 책에 따라서 T+S+R로만 ..
목표 산점도의 특징을 설명할 수 있다. 피어슨 상관계수와 스피어맨 상관계수의 차이를 설명할 수 있다. 상관분석을 진행하는 순서를 설명할 수 있다. 상관관계 상관관계는 변수 간의 상호 관련성을 의미하며, 관계의 정도는 통계적 또는 시각적인 방법으로 파악 가능 산점도 or 상관계수 선형관계를 측정하는 피어슨 상관계수 비선형 순위 상관관계를 측정하는 스피어맨 상관계수 산점도(scatter plot) 산점도를 이용하면 상관관계를 쉽게 파악 가능 >두 연속형 데이터의 관계 파악을 빠르게 할 수 있다. >특정 관계를 가지고 있는 데이터는 한 눈에 파악 가능하다.(선형, 비선형, 원형 등) >극단치 혹은 이상치 파악 가능 >한 변수의 값이 증가할 떄, 다른 변수의 값도 같이 증가한다면 두 변수는 양의 상관관계 >한 ..
목표 귀무가설과 대립가설을 구분할 수 있다. 제 1종 오류와 제 2종 오류의 차이를 설명할 수 있다. 양측 검정과 단측 검정을 목적에 맞게 설정할 수 있다. 가설 검정이란? 모집단에 어떤 가설을 설정한 뒤, 통계 기법을 이용한 가설의 채택 여부를 확률적으로 판정하는 통계적 추론의 방법 가설 예시 [정치 분야] >주류세 인상은 음주 운전율을 줄였다. [제조 분야] >공정 불량률은 5%가 넘는다 [마케팅 분야] >마케팅 방법에 따른 매출의 변화가 있다. [의약 분야] >신약은 효과가 있다. 어떻게 가설을 검증하나? 귀무가설 - 바교하는 값과 차이가 없다, 동일하다는 걸 전제로 하는 귀무가설 대립가설 - 비교하는 값과 차이가 있다. 어떤 연구자의 목적과 주장을 전체로 하는 대립가설 귀무가설은 H0 : Null..
목표 다변량 시각화를 정의할 수 있다. 파이썬을 활용하여 유형별 다변량 데이터를 시각화할 수 있다. 다변량 시각화 두 개 이상의 변수로 구성된 데이터의 관계를 시각화 기반으로 파악하는 데이터 탐색 유형 주어진 변수 간의 패턴 및 관계를 다양한 그래프의 시각화를 통해 전체적으로 파악한다. 다변량 시각화 종류 데이터 조합 시각화 방안 목적 범주형 - 범주형 모자이크플롯 두 개 범주형 변수 내 범주 별 조합의 빈도 크기를 개략적으로 파악 범주형 - 연속형 박스플롯 평행좌표 범주 별 기술통계량 및 경향성을 개략적으로 파악 연속형 - 연속형 산점도 연속형 변수 간 관계성을 개략적으로 파악(선형/비선형 및 음양 방향 등) 범주형 - 범주형에서는 모자이크 플롯 빈도 크기를 개략적으로 파악 범주 별 기술통계랑 및 경향..
목표 다변량 비시각화를 정의할 수 있다. 파이썬을 활용하여 다변량 데이터를 비시각화할 수 있다. 다변량 비시각화 두 개 이상의 변수로 구성된 데이터의 관계를 교차표 및 상관계수 등으로 파악하는 데이터 탐색 유형 주어진 변수 간의 관계를 수치 및 통계적 지표 기반으로 파악하는 것이 목적 개별 속성을 기반으로 어떠한 관계를 가지고 있는지 파악하는 게 목적이기 때문에, 데이터 분석 업무단에서 데이터 분석가의 고민이 담기는 부분이다. 다변량 비시각화의 종류 데이터 조합 비시각화 방안 목적 범주형 - 범주형 교차표 두 개 범주형 변수의 범주 별 연관성 및 구성 파악 범주형 - 연속형 범주 별 통계량 범주 별 대표 통계량 비교 파악 연속형 - 연속형 상관계수 두 개 연속형 변수의 관계썽 정도 파악 범주형-범주형에서..
목표 일변량 시각화를 정의할 수 있다. 파이썬을 활용하여 일변량 데이터를 시각화할 수 있다. 일변량 시각화 일변량 시각화 방안에는 어떠한 방안이 있는가? 하나의 변수로 구성된 데이터를 전체적인 관점으로 파악할 수 있는 데이터 탐색 유형 단일 변수 데이터를 다양한 그래프로 시각화하여 전체적인 관점으로 살펴보는 것이 목적이다. 일변량 비시각화와 같이 원인과 결과등을 다루지는 않는다. 시각화 vs 비시각화 시각화는 직관적 이해 추구, 정보 전달 시간 단축 데이터의 전체적인 파악을 목표로 할때 사용 비시각화는 효과적인 데이터 요약, 빠른 데이터 성격 파악 범주형 시각화 파이차트 범주형을 빈도표에서 비율로 환산해서 부채꼴의 넓이로 표현 범주형 개수가 적은 경우나 많은 경우 둘 다 쓰기 어렵다. 범주형 비율이 비슷..