안녕하세요 뭐든지 물어봐 팀 발표를 맡은 인공지능학과 22학번 이혁승입니다.

발표 시작하겠습니다.

우선 저희 서비스에 대해서 설명 드리도록 하겠습니다. 저희가 문서에서 원하는 정보를 찾을 때 보통 어떻게 찾으시나요? 저같은 경우에는 ctrl+f 단축키를 활용해서 단어를 검색해 원하는 정보를 찾고는 했습니다. 그러나 만약 문서의 양이 200장 300장이 넘어간다면 원하는 정보를 쉽게 찾을 수 있을까요? 찾을 수야 있겠지만 꽤나 귀찮을 일이 될 것입니다. 그래서 저희 ‘뭐든지 물어봐’는 원하는 문서에서 궁금한 점이 있다면 채팅 형태로 묻고 답할 수 있는 서비스입니다.

기존 유사한 서비스로 dagglo가 있는데 요약 서비스만 제공할 뿐 궁금한 점이 있을 때 바로바로 답변을 얻을 수 없다는 한계점이 있었습니다. 저희 팀은 기존 서비스의 한계점을 보완하여 ‘뭐든지 물어봐’ 서비스를 구현하였습니다.

저희가 이 서비스를 어떻게 구현하였는지 설명드리도록 하겠습니다.

우선 웹은 프론트엔드 React, 백엔드 django를 사용했습니다. AI 팀의 경우 Pytorch와 Huggingface를 적극적으로 활용했습니다.

우선 API 명세서는 다음과 같이 작성하여 진행했습니다.

저희 서비스의 핵심인 AI part를 어떻게 구현했는지 설명드리겠습니다.

우선 저희의 초기 모델 파이프라인은 다음과 같습니다.

KakaoTalk_20231003_214353000.jpg

문서가 업로드 되면 이를 파인콘을 활용해서 vector 형태로 저장합니다. Consine similarity를 활용해서 질문과 유사한 Top3 context를 찾아내고, 이를 다시 closed domain question answering task를 수행하는 모델에 넣어 최종적으로 저희가 원하는 결과를 얻습니다.

저희가 기존 아키텍쳐에 넣어 나온 결과 중 일부를 보여드리겠습니다.

(조사가 포함되어 나온 사진)