langchain의 ollama를 이용한다. llama 서버는 연결되어 있어야 한다. import threading import speech_recognition as sr from ultralytics import YOLO import cv2 import os from langchain_community.llms import Ollama # 음성 인식 설정 r = sr.Recognizer() mic = sr.Microphone() # 웹캠 캡처 설정 cap = cv2.VideoCapture(0) # YOLOv8 모델 로드 model = YOLO("yolov8n.pt") llm = Ollama(model="llama2") # 물체 인식 스레드 실행 여부 플래그 detect_thread = None det..
간단한 코드. 사진이라고 말하면 openCV를 시작해서 객체 모델을 탐지한다. 멈춰라고 말하면 opecv를 닫는다. 끝내기라고 말하면 프로그램 자체를 끝낸다. import threading import speech_recognition as sr from ultralytics import YOLO import cv2 # 음성 인식 설정 r = sr.Recognizer() mic = sr.Microphone() # 웹캠 캡처 설정 cap = cv2.VideoCapture(0) # YOLOv8 모델 로드 model = YOLO("yolov8n.pt") # 물체 인식 스레드 실행 여부 플래그 detect_thread = None detect_thread_running = False def listen_and_..

데이터를 불러오고, stratify를 통해 분리한다. from sklearn.model_selection import train_test_split # 훈련 데이터, 검증 데이터 분리 train, valid = train_test_split(train, test_size=0.1, stratify=train[['healthy', 'multiple_diseases', 'rust', 'scab']], random_state=42) from PIL import Image from torch.utils.data import Dataset import numpy as np import os class CustomImageDataset(Dataset): def __init__(self, dataframe, image..

https://www.kaggle.com/c/plant-pathology-2020-fgvc7 잎사귀가 각 타깃값일 확률을 예측 다중분류 문제. healty : 건강한 잎사귀 multiple_diseses : 질병 잎사귀 rust : 녹슨 잎사귀 scab : 붉은 곰팡이병 잎사귀 사진을 보고 각 잎사귀일 확률을 예측한다. train.csv : 훈련 이미지 데이터와 타깃값 test.csv 테스트 이미지 데이터 images : 훈련/ 테스트 이미지 데이터 포함 sample_submission.csv 샘플 EDA 진행 train.shape, test.shape ((1821, 5), (1821, 1)) 훈련, 테스트 데이터 둘 다 1821개 RangeIndex: 1821 entries, 0 to 1820 Data..

주제 센서 데이터 분류 예측 문제 정의 562개의 피처 데이터를 통해,타겟값인 6개의 동작 분류 3일차 캐글 컴퍼티션에는 라벨 12개를 분류 목표 피처 엔지니어링 실습 탐색적 데이터 분석 실습 머신러닝 모델링 과정 실습 모델 성능 향상을 위한 추가적인 피처 엔지니어링/튜닝 실습 프로젝트 내 역할 pycaret을 이용한 Best model 도출 시계열 피처 도출 smote를 이용한 upsampling boxcox를 이용한 데이터 변환 최종 순위 21위 1. 데이터 분석 1.1 구성 data01_train 각 피처를 이미 전처리한 데이터. 필터 및 스케일링까지 적용되어 있으므로 따로 전처리할 필요는 없다. feature 각 피처가 속한 그룹을 표시하는 데이터 train, test,sample - 캐글용 1...

주제 장애인 콜택시 대기시간 예측(시계열 데이터) 장애인 콜택시 관련 데이터와 날씨 데이터가 주어진다. 문제 정의 전 날 콜택시 운행이 종료되었을 때, 다음 날 대기시간을 예측 하루 후 미래의 날씨 데이터 예보를 가지고 있다고 가정하고, 하루 후의 실제 대기시간을 예측 목표 데이터 전처리 과정 실습 탐색적 데이터 분석 실습 머신러닝 모델링 과정 실습 모델 성능 향상을 위한 추가적인 피처 엔지니어링/튜닝 실습 프로젝트 내 역할 pycaret을 이용한 Best model 도출 피처 엔지니어링으로 주말 여부에 대한 상관계수 도출 토론 후에 팀원이 주말 여부에 대해서 주말 하루 전이라는 추가적인 피처 생성 모델 튜닝 기본적인 모델링 및 시계열 데이터에서의 Data leakage에 대해 팀원들에게 설명 1. 데이..