데이터를 어떻게 경영에 접목하고, 가치를 만들어내는가? 두 대의 자동차가 있다. 1 갤런당 10마일 SUV 1 갤런 당 20마일 세단 둘 다 연간 1만마일을 주행한다. 어느 모델을 업그레이드 해야 할까? a. 연비 10을 20 세단으로 교체 b. 연비 20 세단을 50 새 모델로 교체 기존 1000, 업그레이드 후 500 절감량은 500 500 업그레이드 후 200 절감량은 300 뻔해 보이는 선택이 틀릴 떄도 많다. 결혼한 사람이 결혼하지 않은 사람을 바라보고 있는가? 어느 경우에도 이 경우를 만족한다. aws, slack,app store, alipay의 공통점은? 확실한 미래예측 기반의 성공보다는 진행과정에서 발견과 수정을 진행했다. strategy is often retrospective rati..
https://ko.khanacademy.org/computing/computer-programming/sql/sql-basics/pt/aggregating-data 집계함수의 사용 CREATE TABLE groceries (id INTEGER PRIMARY KEY, name TEXT, quantity INTEGER, aisle INTEGER); INSERT INTO groceries VALUES (1, "Bananas", 4, 7); INSERT INTO groceries VALUES(2, "Peanut Butter", 1, 2); INSERT INTO groceries VALUES(3, "Dark Chocolate Bars", 2, 2); INSERT INTO groceries VALUES(4, "I..
https://ko.khanacademy.org/computing/computer-programming/sql/sql-basics/pt/querying-the-table CREATE TABLE groceries (id INTEGER PRIMARY KEY, name TEXT, quantity INTEGER, aisle INTEGER); INSERT INTO groceries VALUES (1, "Bananas", 4, 7); INSERT INTO groceries VALUES(2, "Peanut Butter", 1, 2); INSERT INTO groceries VALUES(3, "Dark Chocolate Bars", 2, 2); INSERT INTO groceries VALUES(4, "Ice crea..
https://ko.khanacademy.org/computing/computer-programming/sql/sql-basics/pt/creating-a-table-and-inserting-data 테이블 만들기 쇼핑 리스트를 테이블로 만든다고 하자. /** Grocery list: Bnanans (4) Peanut Butter (1) Dark Chocloate Bars (2) **/ 테이블을 만들 때는 CREATE TABLE을 쓴다. CREATE TABLE 이름 (컬럼명 데이터 타입) CREATE TABLE groceries ( ); #에러가 뜬다. 왜냐하면 괄호 한에 열 이름을 적어줘야 하기 때문. 컬럼명에는 각 아이템을 묶어 설명해줄 수 있는 속성을 넣는다. 그리고 그 옆에는 데이터 타입도 같이 ..
https://www.kaggle.com/competitions/hms-harmful-brain-activity-classification/overview 이 글을 쓰고 있는 2024년 2월 19일 현재, 캐글에서 진행하고 있는 컴피티션이다. 필자는 본 경진대회를 진행하면서, 실제로 배운 데이터 분석 요소들을 적용해보려고 한다. 글로 써질 것들은 모델을 학습하고, 만들기 까지의 과정이다. 오늘 시간에는 베이스라인 모델링을 진행한다. Group K-Fold 적용하기 CatBoost를 학습하기 위해서 기본적인 CatBoost 환경을 사용한다. 이때 K_Fold를 같이 사용하기 위해서, TARGET으로 각 타겟을 라벨링 인코딩을 해줄 것이다. 또한 GPU로 지정해줌으로서, 더 빠른 학습 속도를 가지게 만든다...
https://www.kaggle.com/competitions/hms-harmful-brain-activity-classification/overview 이 글을 쓰고 있는 2024년 2월 18일 현재, 캐글에서 진행하고 있는 컴피티션이다. 필자는 본 경진대회를 진행하면서, 실제로 배운 데이터 분석 요소들을 적용해보려고 한다. 글로 써질 것들은 모델을 학습하고, 만들기 까지의 과정이다. 오늘 시간에는 베이스라인 모델링을 위한 추가적인 피처 엔지니어링을 진행한다. 베이스라인 모델링 개요 베이스라인 모델링은 본격적으로 성능 개선을 하기 전에, 어떤 모델을 싱글 모델로 가장 좋은 모델을 활용할 지, 그리고 그 단계에서 어떻게 모델링을 해 나갈지 고민하는 과정이다. 앙상블 기법은 당연히 해야 하는 과정이지만,..