🗨️ 들어가며지난 포스팅에서는 사회초년생을 위한 뉴스레터 생성 프로젝트를 소개드렸습니다.이번 글에서는 뉴스레터 생성에 필요한 'Agent 설계 과정'을 더욱 구체적으로 정리해 보려 합니다. 여러분도 경험해 보셨겠지만, 뉴스를 읽다 보면 종종 배경지식이 부족해 맥락을 이해하기 어렵고, 결국 추가 검색을 하느라 시간을 허비하게 됩니다. 이런 불편함을 해소하기 위해 시작한 이번 프로젝트는 뉴스에서 다루고 있는 주제의 역사적 배경부터 앞으로의 영향력까지 모든 것을 체계적으로 정리해 주는 원스톱 뉴스레터 서비스를 목표로 합니다. 이 과정에서 단순 뉴스 요약을 넘어, 깊이 있는 정보를 다루기 위해 Multi-Agent 방식으로 한 편의 뉴스레터를 생성하기로 하였습니다. 🗨️ Multi-Agent 시스템 도입의..
🗨️ 들어가며안녕하세요, 오늘은 최근 진행 중인 사이드 프로젝트에 대해 소개해 드리려고 합니다. 이 프로젝트는 사회초년생들이 어렵게 느끼는 경제 뉴스를 쉽고 흥미롭게 읽을 수 있는 뉴스레터 아티클을 LLM(Large Language Model)을 활용해 자동으로 생성하는 서비스입니다. 이번 포스팅에서는 이 프로젝트를 시작하게 된 계기와 필요성, 그리고 전체적인 개요를 공유하고, 추후에 더 구체적인 기술적 내용과 개발 과정을 다룰 예정입니다. 🗨️ 사회초년생에겐 너무 어려운 경제 뉴스 여러분은 경제 뉴스를 얼마나 자주 읽으시나요? 아마 많은 분들이 "읽고 싶어도 너무 어려워서..." 라고 대답하실 것 같습니다.일반 언론사의 경제 뉴스는 사실 전문적인 용어와 배경 지식을 요구하는 경우가 많습니다. "기준..
이전 Pretty Nail 프로젝트의 한계PrettyNail 프로젝트는 교조증(손톱을 물어뜯는 습관)을 개선하기 위해, 손톱을 물어뜯는 행동을 감지해 경고를 주는 AI 프로젝트다. 이를 구현하기 위해, 아래와 같은 여정 밟아 왔다.PrettyNail - 너 그게 맛있냐?PrettyNail - AI로 어떻게 손톱 물어뜯는 걸 인식할까?하지만 손톱을 물어뜯는 자세는 사람들마다 매우 다양하며, 복잡한 형태를 가진다. 단순 AI 로직으로는 높은 수준의 성능을 기대하기 어렵다. 가령, 턱을 괴는 모습과 손톱을 물어뜯는 행동조차도 쉽게 구별해 내기 힘들어한다. 때문에, 과거 PrettyNail의 로직은 사용성 측면에서 아쉬움이 있었다. 그러다 최근 우아한형제들의 테크 밋업(우아콘)에서 PrettyNail의 성능을 ..
6,7월 동안 2024 우아한 스터디를 참여했다. 생성 AI가 판을 치는 이 시대, 어떻게 AI를 잘 활용할 수 있을까? 우선 프롬프트 엔지니어링을 잘 하는것부터 시작해야한다. 우리 함께 프롬프트 엔지니어링을 잘 터득해서, AI 시대에 함께 잘 살아보세! 라는 의미로 만들어진 스터디다. 스터디명은 프롬프트 참 잘하는 집! (뭔갈 열심히 튀겨야 할 것 같은) ✔️ 나만의 지원 Tip 공부하겠다고 모이는 스터디에 무슨 지원 팁?.. 이냐 할 수 있다. 그런데 우아한 스터디는 지원하는 사람이 정말 많다 보니, 나름의 전략을 가지고 지원할 수밖에 없다. 사실 작년에 지원했다가 떨어진 이력이 있다. 내 전략은 적극성이었다.(이보다 더 진부한 지원팁이 있을까?..) 스터디와 학교 수업과는 정말 다르다. 누군가 나를..
사이드 프로젝트로 현대자동차 설명서 RAG를 구현하며,경험을 공유하고 있습니다.1. 현대자동차 챗봇 구현기 - RAG 기본 구현2. 현대자동차 챗봇 구현기 - PDF를 잘 추출해야 하는 이유 문제 : RAG의 평가 데이터셋 구축의 어려움초등학생 때부터 지금 까지, 그리고 앞으로도 우리는 끊임없이 시험을 치르게 됩니다. 시험 기간만 되면 모두들 좋은 성적을 받기 위해 밤낮을 새곤 하죠. 하지만, 여기에는 시험을 치르는 사람보다 어쩌면 더 고통을 받는 분들이 계십니다. 바로 시험 문제 출제자들이죠.지정된 범위 내에서 풀 수 있는가? 중복 정답이 있지는 않은가? 출제 의도가 분명한가? 고려해야 할 요소가 상당히 많습니다. 덕분에 시험기간만 되면 출제자들은 문제 출제에 감금이 되곤 하죠. RAG의 성능을 평가..
RAG(Retrieval-Augmented Generation)는 LLM과 검색 기술을 결합하여, 필요한 정보를 검색하고 검색 결과를 기반으로 질문에 답변하는 AI 시스템입니다. 간단한 RAG 시스템을 구현하는 건 그리 어렵지 않습니다. 그러나 프로덕트 수준의 RAG를 개발하거나, RAG의 성능을 끌어내는 일은 상당히 까다롭고 많은 자원이 소모되는 일입니다. 이번 포스팅에선 이러한 RAG 시스템을 효율적으로 구현 및 최적화해 주는 툴인 AutoRAG에 대해서 살펴보겠습니다. 문제 : RAG 최적화의 어려움기본적인 RAG 시스템(또는 Naive RAG)을 구축하는 것은 간단할 수 있지만, 실제 프로덕트 단계에서 요구하는 성능을 가지기 위해선 더 많은 장치들을 필요로 합니다. 예를 들어, 검색 결과의 질을 ..
PDF를 잘 읽는 게 중요한 이유 RAG(Recurrent Attention-Gated) 시스템을 구성하기 위해 가장 먼저 해야 할 작업은 문서를 텍스트 형태로 로드하는 작업이에요. 만약 문서의 종류가 Excel이나 Code 파일 같이 정형화된 파일일 경우, 텍스트로 변환하는 과정이 비교적 수월할 수 있습니다. 하지만, PDF 같이 비정형 파일들은 텍스트로 변환할 때 여러 가지 고려사항이 필요합니다. 아래는 PDF 파일을 단순히 텍스트로 변환한 예시예요. 위의 결과를 보면 PDF 내의 텍스트는 잘 불러온 것처럼 보이지만, 글의 단락과 구성이 반영되어 있지 않고 표의 정보도 깨져 있음을 볼 수 있어요. 사람에게 우측과 같이 텍스트만 제공하면, 정보를 제대로 파악하지 못할 가능성이 큽니다. 이는 LLM(..
💡 여러분은 자동차를 사면 설명서를 꼭 읽어보시나요? 대부분의 사람들은 기쁜 마음으로, 동네 드라이브부터 나갈 거라 생각해요. 그도 그럴것이, 새 차를 운전하는 데는 생각보다 설명서의 정보가 필요하지 않거든요. 스마트폰, 에어컨 등 다른 전자기기도 마찬가지 일거에요.그런데 가끔은 기기의 공식 설명서가 필요한 순간들이 꼭 있습니다.예를 들어 차 계기판에 뜬 경고 문자가 무슨 의미인지, 차량의 특정 버튼이 어떤 기능인지 등등이요. 물론 해당 궁금증을 차량 커뮤니티에 올리면 전문가가 답변을 달아놓겠지만, 이 과정이 생각보다 번거롭고 시간이 걸립니다. 그렇다고 아래와 같은 수백 페이지의 공식 설명서를 읽자니.. 한국 사람으로서 벌써부터 치가 떨립니다. 그냥 해당 설명서를 잘 숙지하고 있는 전문가를 주머니 속..