Builder.shin
RAG 시스템
38개의 게시물
RAG 시스템
RAG 시스템에 Reranking 단계 추가하기
벡터 검색만으로는 정확도가 부족했던 RAG 시스템에 Cohere Rerank API를 도입했다. 초기 검색 결과를 재정렬하여 답변 품질을 개선한 과정을 정리한다.
2024년 7월 10일
RAG 시스템
RAG 시스템 구축하며 겪은 청크 사이즈 최적화 문제
사내 문서 검색 시스템에 RAG를 도입하면서 청크 사이즈 설정에 어려움을 겪었다. 512 토큰에서 시작해 여러 실험을 거쳐 256 토큰과 오버랩 20%로 안착한 과정을 정리했다.
2024년 6월 29일
RAG 시스템
프로덕션 RAG 시스템 구축하며 마주친 청크 사이즈 문제
사내 문서 검색 시스템을 RAG로 구축하면서 청크 사이즈 설정이 검색 품질에 미치는 영향을 확인했다. 고정 사이즈 방식의 한계와 의미 단위 분할로 개선한 과정을 기록한다.
2024년 5월 20일
RAG 시스템
RAG 시스템에 Reranking 레이어 추가하기
기존 RAG 시스템의 검색 정확도를 개선하기 위해 Cohere Rerank API를 도입했다. Vector similarity만으로는 부족했던 컨텍스트 정확도를 크게 향상시킬 수 있었다.
2024년 4월 6일
RAG 시스템
프로덕션 RAG 시스템에 청크 오버랩 적용하기
문서 검색 품질 개선을 위해 청크 오버랩 전략을 도입했다. 경계 부분의 문맥 손실 문제를 해결하고 검색 정확도를 약 15% 향상시켰다.
2024년 3월 5일
RAG 시스템
RAG 시스템에서 청크 크기가 검색 정확도에 미치는 영향
사내 문서 검색 RAG 시스템을 구축하면서 청크 크기에 따른 검색 품질 차이를 실험했다. 512 토큰과 1024 토큰 청크를 비교한 결과, 문서 특성에 따라 최적값이 달랐다.
2024년 2월 25일
RAG 시스템
LangChain으로 사내 문서 검색 RAG 시스템 구축하기
사내 기술 문서와 위키가 산재되어 있어 필요한 정보를 찾는데 시간이 오래 걸렸다. LangChain과 OpenAI Embeddings를 활용해 RAG 기반 검색 시스템을 구축한 과정을 기록한다.
2024년 2월 16일
RAG 시스템
RAG 시스템에서 청크 크기 조정으로 검색 정확도 개선하기
사내 문서 검색 RAG 시스템을 구축하면서 청크 크기에 따른 검색 품질 차이를 경험했다. 512 토큰에서 256 토큰으로 조정하면서 정확도가 눈에 띄게 개선되었다.
2024년 2월 12일
RAG 시스템
RAG 시스템 구축하며 배운 임베딩 벡터 저장소 선택 기준
사내 문서 검색 RAG 시스템을 구축하면서 Pinecone, Weaviate, Qdrant를 비교 테스트했다. 규모와 쿼리 패턴에 따라 적합한 벡터 DB가 달랐고, 초기 프로토타입에선 PostgreSQL의 pgvector 확장으로도 충분했다.
2024년 1월 17일
RAG 시스템
RAG 시스템 프로토타입 구축하며 배운 것들
사내 문서 검색 개선을 위해 RAG(Retrieval-Augmented Generation) 시스템 프로토타입을 구축했다. OpenAI API와 벡터 DB를 조합하며 마주친 임베딩, 청킹, 검색 전략 이슈를 정리한다.
2023년 12월 20일
Previous
1
2
3
4
Next
카테고리
Builder.shin