목표 범주 인코딩의 정의를 설명할 수 있다. 변수의 결합과 분해를 기반으로 새로운 특징을 생성할 수 있다. 차원 축소의 목적에 따라 주성분 분석과 군집 분석을 통해 새로운 특징을 생성할 수 있다. 특징 생성 Feature Creation 원본 데이터의 조합/ 변환 등을 기반하여 새로운 특징들을 구축 및 생성하는 방법 특징이란 원 데이터의 변환을 통해 생성되는 새로운 컬럼 변수(변수 값) 원본 데이터로 특징을 새롭게 생성하여 분석 과정 내 성능과 효율성 확보 비용, 연산 비용의 효율성 추구 피처 엔지니어링 원시 데이터로부터 적절하고 올바른 특징들을 만들어 내는 일련의 과정 품질 확보 - 가공을 거치지 않은 Raw 데이터 활용 기반의 모델링은 품질 확보가 어렵다. 최적화된 형태 변환 - 효과적인 Featur..
목표 변수 변환의 정의 및 특징을 설명할 수 있다. 구간화를 지정 길이 기반 방안과 분포 기반 방안으로 구분할 수 있다. 정규화를 최대-최소 정규화와 Z-점수 정규화 방안으로 구분할 수 있다. 데이터 변환(Transformation) 연속형, 범주형 등 원 데이터의 값을 다른 형태로 바꾸는 과정 분석 방법론에 대한 적용 여러 형태로 표현된 데이터 값을 다양한 분석 방법론에 적용하기 위해 원시 형태에서 다른 형식으로 바꾸는 과정 주어진 목적 기반의 올바른 결과 획득을 위하여 원시 데이터를 데이터 분석에 용이하도록 형태 변환 변환 목적 및 특징 빠른 특성 파악 데이터의 특성을 빠르게 파악 가능 파생 변수 생성 및 단순화를 통한 결과 리포팅 등 활용 연령, 흡연량, 연령대를 연령대와 평균 흡령량으로(연령대 별..