티스토리 뷰

반응형

데이터 사이언스의 발전 배경

 

Technology,Hardware, infra 관점

volume(크기) - 방대한 양의 데이터

velocity(속도) - 일반 처리 및 실시간 처리

variety(다양성) - 정형, 비정형, 빈정형데이터

 

Business,software,Analytics 관점

veracity(진실성) - 데이터 품질 및 신뢰성 확보

value(가치) - 궁극적 비즈니스 가치 창출

visualization(시각화) - 복잡한 결과의 시각화 표현

 

데이터 분석의 현재

 

내부 데이터의 한정적 활용 환경 -> 대용량 데이터의 분석 환경 -> 고차원 데이터 분석 환경(현재)

 

내외부/비정형(이미지) 데이터 확용

 

데이터 사이언티스트 정의

빅데이터를 가공 및 분석하여 새로운 가치를 창출하는 자

 

Citizen Data Scientist

특정 도메인 내 빅데이터를 활용하여 본인의 비즈니스 영역 결과를 개선하는 자

 

 

협업에서의 업무 단계

 

  Project initiation
과제 수행 준비
Data Preparation
데이터 준비
Data Analytics
데이터 분석
OutPut
분석 결과 정보화
Knowldge
자산화
Role 방향성 제시
커뮤니케이션/협의
활용 데이터 검토
데이터 전처리
탐색적 데이터 분석
분석 모델링
인사이트 도출
결과의 통역/전개
응용/설계/운영화
Activity 주제 정립
업무 Scope 정의 등
데이터 정의
데이터 정제/변형 등
탐색적 데이터 분석
통계/ML/DL 분석 등
분석 결과 해석
활용 방안 제시
자동화 설계
운영 방안 도출
Technic Analytic Knowledge
Leader Ship
computer Science
Data Manipulation
Mathmatics
Statistics
Data Mining
Visualization
Presentation
Application
Domain Knowledge
Marketing
Knowledge

 

상세 분석 프로세스

Pre Initiation

프로젝트 수행 준비

>현업 AS-IS 현황파악

>핵심 카테고리 도출

 

요구사항 수집

Access Situation

> 핵심 카테고리 선정 및 Key 이슈 도출

> 담당부서 인터뷰 기반 요구사항 수집 및 분석

 

AS-IS 분석

현황 및 요건 정의

> 검토 영역 선정

> 현황/요건별 데이터 레벨 매핑 등 수행

> 분석 관점의 수행 타당성/가능성 진단

 

TO-BE 도출

분석 과제 도출

> 주요 이슈 기반 Pain 및 개선 Point 도출

> 각 Point별 분석 주제 제안 및 주제별 수행 요견/방향성 정의

 

분석 대상 데이터 수집/처리

데이터 정의

>주제별 대상 데이터 정의

>데이터 품질 체크

>데이터 정제 및 전처리 수행

 

탐색적 데이터 분석

데이터 탐색

>주제별 EDA 수행

>유의미한 인사이트 도출 및 정리

 

고급 데이터 분석

분석 모델 개발

>최종 Target 모델 개발

>모델 검토 및 정합성 검증

시각화

>분석 결과 시각화

성능 개선을 위해 Feedback Loop로 다시 분석 대상 데이터 수집 및 처리

 

결과 기반 활용 방안 제안

결과 보고

>분석 결과 최종 보고

>관련 부서 대상 Analyics

>관점 내 활용 방안 제안

 

데이터 사이언스에서 중점으로 두는 것

Data Preparation
데이터 준비
Data Analytics
데이터 분석
OutPut
분석 결과 정보화
활용 데이터 검토
데이터 전처리
탐색적 데이터 분석
분석 모델링
인사이트 도출
결과의 통역/전개
데이터 정의
데이터 정제/변형 등
탐색적 데이터 분석
통계/ML/DL 분석 등
분석 결과 해석
활용 방안 제시
데이터 정제
데이터 변환
일변량/ 다변량 탐색
시계열 분석
정적 시각화
동적 시각화

 

반응형