Kaggle 시작이 막막하다면 kaggle의 사용법을 아주 잘 알려주는 책을 정리해보았다. https://goldenrabbit.co.kr/2022/05/10/%ec%ba%90%ea%b8%80-%ec%95%88%eb%82%b4%ec%84%9c-%ec%ba%90%ea%b8%80-%ec%9d%b4%eb%a0%87%ea%b2%8c-%ec%8b%9c%ec%9e%91%ed%95%98%ec%84%b8%ec%9a%94/ [ sikaro.tistory.com 전 시간에 이어서 이번엔 딥러닝 문제해결 프로세스이다. 딥러닝 문제해결 프로세스 문제(경진대회) 이해 - 배경, 목젹, 유형 등 / 평가지표 파악 탐색적 데이터 분석 - 데이터 구조 탐색 / 데이터 시각화(타깃값 분포, 데이터 수, 품질 등) 베이스라인 모델 - ..
kaggle의 사용법을 아주 잘 알려주는 책을 정리해보았다. https://goldenrabbit.co.kr/2022/05/10/%ec%ba%90%ea%b8%80-%ec%95%88%eb%82%b4%ec%84%9c-%ec%ba%90%ea%b8%80-%ec%9d%b4%eb%a0%87%ea%b2%8c-%ec%8b%9c%ec%9e%91%ed%95%98%ec%84%b8%ec%9a%94/ [캐글 안내서] ❷ 캐글, 이렇게 시작하세요 - 골든래빗 데이터 과학자를 위한 놀이터라고 불리는 캐글의 사용 설명서입니다. 캐글 가입부터 각 메뉴와 기능뿐 아니라 경진대회를 찾고 모델을 제출하고 평가받는 전 과정을 누구나 따라할 수 있게 쉽 goldenrabbit.co.kr 한국어로 되어 있고, 정말 친절하고 자세하게 나와 있어서..
지난 시간에는 classifier 중 이웃, kNN에 대해 배웠다. 이번 시간에는 Linear classifier에 대해 배울 것이다. 다시 CIFAR10을 불러와보자. 50,000 training images. each image is 32*32*3 Linear classifier 선형 분류기의 아이디어는 parametric approach이다. 3072 number에서 f(x,W) 라는 함수에 W라는 parameters or weights 라는 기본적인 가중치를 준다. f(x,W) = Wx +b (10,) (10, 3072) 모든 이미지를 함수로 만들어준다. 이미지를 쪼갠 후, W라는 가중치 벡터를 곱해서 각각의 r,g,b에 대한 결과값을 구한다. b라는 편향성으로 함수를 보정해준다. 함수와 같다. ..
clssification 할 떄 이미지들에서 고려할 점. 1. 우리는 이미지를 바로 인식할 수 있지만, 컴퓨터에서 이미지는 전부 숫자로 이루어져 있다. rgb를 뜻하는 코드[0~255]와 800*600*3 channel RGB 즉, 빨강, 초록, 파랑 채널의 숫자들을 각각 가지고 있다. 2. 만약 카메라의 방향이나 각도를 바꾼다면 픽셀의 값은 매우 많이 변동한다. 이 점에서 로봇들이 어떻게 대응할 것인지 생각해 볼것. 만약 같은 물체지만 색깔이 다른 경우, 전부 다른 픽셀값을 가지므로 그 방안에 대해서도 고려해야 한다. 4. 카테고리 안에서도 분류되는 경우가 있다. ex) 고양이의 종류. 5. background color에 대해서도 고려해야 한다. 6. 조명이나 일루미네이션에 대해서도 인식할 수 있을정..