데이터 종류 대분류 수치형 데이터 - 사칙 연산이 가능 범주형 데이터 - 범주로 나누어지는 데이터 이 중에서도 각각 연속, 이산과 순서, 명목으로 나뉜다. 수치형(연속) - 키, 몸무게 수입 수치형(이산) - 과일 개수, 책의 페이지 수 범주형(순서) - 학점, 순위(랭킹) 범주형(명목(간단하게 생각해보면 이름)) - 성별, 음식 종류, 우편 번호 이산형은 정수로 딱 떨어져 셀 수 있는 것. 범주형에서 순서형은 순위가 정해져 있다. 그에 반해 명목형은 순위가 따로 없는 데이터다. 수치형 데이터 시각화 import seaborn as sns titanic = sns.load_dataset('titanic') # 타이타닉 데이터 불러오기 titanic.head() #씨본을 사용하면 데이터가 더 정갈하다 ti..
Kaggle 시작이 막막하다면 kaggle의 사용법을 아주 잘 알려주는 책을 정리해보았다. https://goldenrabbit.co.kr/2022/05/10/%ec%ba%90%ea%b8%80-%ec%95%88%eb%82%b4%ec%84%9c-%ec%ba%90%ea%b8%80-%ec%9d%b4%eb%a0%87%ea%b2%8c-%ec%8b%9c%ec%9e%91%ed%95%98%ec%84%b8%ec%9a%94/ [ sikaro.tistory.com 전 시간에 이어서 이번엔 딥러닝 문제해결 프로세스이다. 딥러닝 문제해결 프로세스 문제(경진대회) 이해 - 배경, 목젹, 유형 등 / 평가지표 파악 탐색적 데이터 분석 - 데이터 구조 탐색 / 데이터 시각화(타깃값 분포, 데이터 수, 품질 등) 베이스라인 모델 - ..
kaggle의 사용법을 아주 잘 알려주는 책을 정리해보았다. https://goldenrabbit.co.kr/2022/05/10/%ec%ba%90%ea%b8%80-%ec%95%88%eb%82%b4%ec%84%9c-%ec%ba%90%ea%b8%80-%ec%9d%b4%eb%a0%87%ea%b2%8c-%ec%8b%9c%ec%9e%91%ed%95%98%ec%84%b8%ec%9a%94/ [캐글 안내서] ❷ 캐글, 이렇게 시작하세요 - 골든래빗 데이터 과학자를 위한 놀이터라고 불리는 캐글의 사용 설명서입니다. 캐글 가입부터 각 메뉴와 기능뿐 아니라 경진대회를 찾고 모델을 제출하고 평가받는 전 과정을 누구나 따라할 수 있게 쉽 goldenrabbit.co.kr 한국어로 되어 있고, 정말 친절하고 자세하게 나와 있어서..