[에이블스쿨] 5일차(2) - 데이터 분석(단변량-범주,숫자)
숫자형 단변량 분석 데이터가 그렇게 분포하고 있는데에는 다 이유가 있다. 분포로부터 뭔가 특이한 점이 있다면 그 이유를 찾는 게 데이터 분석이다. 20명의 나이 데이터(정보)가 있다. 그러면 데이터를 한눈에 파악하기 위해서는 무엇을 해야 하는가? ->내 생각: 기본적인 건 정렬. 그 후에 그룹화 수치형 변수를 정리하는 두 가지 방법 1. 숫자로 요약하기 : 정보의 대표값 평균, 중앙값,최빈값, 사분위수 -> 기초 통계량 2. 구간을 나누고 빈도수를 계산한다. -> 도수 분포표 평균 : 산술평균, 기하 평균, 조화 평균 조화평균은 모델링 할때 다룬다. -> ROC AUC, F1 SCORE np.mean(df['컬럼명']) = 넘파이 함수 df.mean() 중위수 : 순서상 가운데 최빈값 = mode : 자..
프로그래밍 공부/에이블스쿨
2024. 2. 27. 14:57