빅프로젝트 끝나고 굉장히 오랜만의 공모전 마침 RAG에 대해서 공부하고 싶은 계기가 생겨 참가하게 되었다. 기본적인 베이스라인은 langchain과 pdf추출을 이용한 RAG를 사용한다. 7차 미프에서 해봤던 경험을 바탕으로 실험을 진행. 아직 3일차라 임베딩에서만 실험중이다. https://github.com/ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever GitHub - ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever: Korean Sentence Embedding Model Performance BenKorean Sentence Embeddin..
수시 채용 중심으로 변화직무소개 콘텐츠가 가장 많음최종 면접까지 가는 경우가 많이 없음 1년간 입사 지원지원 기업 수 - 평균 6.4개면접 횟수 - 평균 2회 개발 직군 필요 역량 어떤 기능의 구현을 위해서 알고리즘에 대한 이해와 구현이 필요함그게 코딩테스트를 위한 것이다. AI 직무목표에 맞는 기술에 대한 리서치 진행 - 모델을 결정알고리즘을 고쳐본다. 그 다음에 제품화 머신러닝, 딥러닝에 관한 지식수학, 통계에 관한 지식대용량 데이터 분산 처리에 관한 지식컴퓨터 과학에 관한 지식코드 품질 향상에 관한 지식 데이터 정제 및 ETL 파이프라인 개발 및 운영할 수 있는 역량 학술 논문을 검색 - 이해 - 모델 구현- 프로젝트에 적용할 수 있는 역량비즈니스 주요 지표를 개선할 수 있는 모델을 개발할 수 있..
주요 기능:api에 이미지 보내기말로 질문하기너무 답변이 길면 말을 끊을수도 있다.대충 4o 어플이 가지고 있는 기능은 다 넣었다. 하루만에 완성하기 위한 루트.당연히 AI를 써야 한다. gemini api 대회가 있길래 심심해서 만들어본 프로젝트. websim ai = 프론트엔드django를 이용해서 app을 만든다. 그리고 가져다 붙인다. web speech api로 음성을 텍스트로 변환이미지를 받아들이는 건 당연히 리퀘스트 리스폰스 이제 정말 인정할 때가 됐다. AI를 사용하는 건 효율성 측면에서 엄청나다.도대체 이걸 그냥 손으로 쳤으면 얼마나 걸렸을까? 일주일? 한달? 그만큼 파급력이 있다는 걸 인정하고 이제는 차라리 코드를 디버깅 하는 실력을 기르는 게 나은 거 같다.6개월 간 부트캠프 거치면서..
Dense Passage Retrieval (DPR):쿼리와 문서를 고차원 벡터 공간에 임베딩하는 신경망 기반의 방법입니다.의미적 유사성을 잘 포착하여 전통적인 키워드 기반 방법보다 우수한 성능을 보입니다.Contrastive Learning-based Retriever:대조 학습을 사용하여 관련 문서와 비관련 문서를 더 잘 구분하도록 학습합니다.SimCSE나 ConDE와 같은 방법들이 이 범주에 속합니다.Hybrid Retriever:스파스 검색(예: BM25)과 덴스 검색(예: DPR)을 결합한 방법입니다.두 방식의 장점을 결합하여 더 robust한 검색 성능을 제공합니다.ColBERT:쿼리와 문서의 토큰 수준 상호작용을 모델링합니다.세밀한 매칭을 통해 높은 정확도를 제공하면서도 효율적인 검색이 가능..

transformer 기반 백본은 NLP 모델에 아주 파격을 불러왔고, 지금도 많이 연구되고 있는 여러모로 핫한 논문이다. 여태까지 모델은 transformer 기반 구조로, self-attention 메커니즘을 이용해서 텍스트의 정밀도와 정확도를 예측해왔다. 하지만 본 논문에서는 다시 RNN과 CNN 같은 초심으로 돌아가, 게이트 메커니즘을 사용하면서도 아주 빠르게 선형적으로 처리할 수 있는 기반을 마련한다. 어떻게? Selective SSM(State Spaces Modeling)을 통해서! 상태 공간 모델링은 원래 제어에 쓰는 것이다. 본 블로그에서도 로봇이론 포스팅을 할 때 한 번 소개한 적이 있었다.학부가 기계과인 나로서는 자주 보던 공식이라 상당히 흥미로웠다. 본 논문은 어려워보이지만, 핵심..
5,6 주차는 코드 수정 뿐만 아니라, ppt에 시연영상까지 찍어야 해서 글을 쓸 시간도 없었다. 마침내 어제부로 모든 산출물을 제출했고, 내가 했던 것들을 잊지 않기 위해 일단은 기록으로 남겨두려 한다. QA(Qulity Assistance) 작업 어찌 보면 실제 검증을 하기에 가장 중요한 작업이다. 여태까지의 개인 프로젝트와 달리, 상업적으로 이게 실용성 있는지 없는지를 보는 거니 말이다. 일단 프론트엔드 측면에서부터 디자인을 갈아엎었다. 실제적으로 눈에 띄는 디자인과, 실용성이 있는 디자인으로 바뀌었다. 그런 측면에서 코드의 검수는 백과 프론트를 어느정도 다 할 수 있는 내가 자진해서 맡았다. 왜냐하면 그렇게라도 하지 않으면 백과 프론트 연결이 안될 것 같았기 때문이다. 어느정도 데이터의 정의는 약..