복잡한 문서에서 내가 필요한 정보만 뽑아 알아서 해석해 준다면?

아르고스 Document Analyzer!
ARGOS Identity's avatar
Jul 11, 2024
복잡한 문서에서 내가 필요한 정보만 뽑아 알아서 해석해 준다면?

안녕하세요.

AI 기반의 아이덴티티 플랫폼 아르고스 아이덴티티(ARGOS Identity)입니다.

아르고스에는 대표적으로 eKYC/AML, Biz document analyzer, FACE IDENTITY 서비스가 있습니다.

그중 오늘은 두 번째에 해당되는 Biz document analyzer(비즈 도큐먼트 애널라이저)에 대해 소개해 드리도록 하겠습니다.

Document analyzer? 도큐먼트 애널라이저?

Document analyzer는 어떤 서비스일까요?

직관적으로 ‘문서 분석기’ 이렇게 해석할 수 있는데요. 비슷하다고 볼 수 있습니다.

아르고스의 Document analyzer는 질문에 대해 사업자등록증, 영수증, 영업신고증, 주주명부 등 정형화되지 않은 문서에서 중요한 항목은 무엇인지 추출하고, 해석하여 결론까지 도출해 내는 솔루션입니다.

솔루션을 이용할 경우에 문서 검토 또는 검증 시간을 기존 대비 80% 단축시키며, 운영 효율성을 300%까지 향상시킵니다.

Document analyzer는 어떻게 가능할까? : OCR과 RAG & LLM이 핵심!

이 솔루션이 가능한 이유는 무엇일까요?

바로 OCR과 RAG & LLM을 통합해 수많은 형식의 문서를 자동으로 처리하는 것이죠.

그럼 지금부터OCR과 RAG & LLM의 개념에 대해 쉽게 살펴보겠습니다.

OCR에 대해서는 많이 들어보셨을 텐데요. 저희 블로그에서 여러 번 다루기도 했습니다.

OCR(Optical Character Reader/Recognition)은 광학 문자 판독기라는 뜻으로 일반적으로 이미지를 텍스트로 변환하는 기술을 말합니다. 주로 스캔 한 문서나 사진, PDF 파일 등에서 문자나 숫자를 인식해 텍스트 형식으로 변환하는 것을 말하죠. OCR은 대부분 이미지 전처리 ▶ 문자 분할 ▶ 문자 인식 ▶ 후처리 과정을 통해 작동이 됩니다.

OCR 기술은 다양한 분야에서 활용되고 있는데요. 예를 들어 살펴볼까요?

일상생활에서 사용하고 있는 번역 앱을 생각해 보겠습니다. 우리는 카메라를 통해 번역할 내용을 촬영하고 카메라를 통해 인식한 텍스트를 원하는 언어로 번역해 유용하게 사용하고 있습니다.

우리는 편리함과 익숙함에 인지하지 못하지만, 사실 이 프로세스에는 OCR 기술이 있기 때문에 가능한 것이었습니다.

이외에도 은행 및 금융 서비스, 스캐너, 스마트폰 카메라 등 OCR은 일상생활에서 매우 쉽게 접할 수 있습니다. 기술 덕분에 일일이 노동집약적으로 입력해야 했던 많은 작업들이 자동화되어 효율성이 크게 증가한 것이죠.

다음은 RAG와 LLM에 대해 살펴보겠습니다.

RAG (Retrieval-Augmented Generation)와 LLM (Large Language Model)은 자연어 처리 분야에서 중요한 두 가지 개념입니다. 여기서 자연어는 일상적으로 사용하는 언어를 말합니다.

RAG는 자연어 생성 모델과 정보 검색 기술을 결합한 모델입니다. RAG는 먼저 사용자의 질문에 맞는 적절한 정보를 대규모 데이터베이스에서 검색한 후 답변을 생성합니다. RAG는 대규모 데이터베이스에서 검색하기 때문에 보다 정확하고 정보가 풍부한 답변을 제공할 수 있습니다.

LLM은 대규모 텍스트 데이터로 훈련된 언어 모델로, 매우 방대한 변수를 가지고 있습니다. LLM은 텍스트 생성, 번역, 요약, 질문 응답 등 다양한 자연어 처리 작업에 뛰어난 성능을 보이는데요, 대표적으로 GPT-3, BERT, T5 등이 있습니다. 이러한 모델들은 주어진 텍스트 문맥을 이해하고 이에 맞는 결과를 생성하는 데 탁월합니다.

RAG와 LLM은 서로 보완적인 관계에 있습니다. 구체적으로, RAG 모델은 LLM의 언어 생성 능력을 사용하여 사용자가 묻는 질문에 대한 초기 응답을 생성하고, 이 응답을 보완하기 위해 관련 정보를 검색합니다. 데이터베이스에서 검색하기 때문에 LLM이 단독으로 생성하는 응답보다 더 정확하고 풍부한 정보를 제공할 수 있습니다.

*아르고스는 단순 OCR 기술을 넘어 RAG와 LLM을 기반으로 해 더 고차원적인 서비스를 제공하고 있습니다.

아르고스, Document analyzer를 활용해 보세요!

Document analyzer를 활용할 수 있는 곳은 당연히 복잡하거나 봐야 할 문서가 많은 기업이 해당되겠죠?

따라서 법률, 의료, 금융, 물류 등 이외에도 활용도가 매우 높은 편입니다.

실제로 Dcoument Analyzer를 사용한 사례는 다음 시간에 소개해 드리도록 하겠습니다!

☝️ 아르고스 Document Analyzer를 사용할 경우 고객사가 얻게 될 이점은 무엇일까요?

저희 아르고스 솔루션을 이용한다면 고객사는 비즈니스 과정을 100% 자동화하여 시간을 줄이고 효율성을 높여 본업에 집중하실 수 있습니다.

1. 문서를 해석하여 결과를 도출하고 상호 교차 검증을 지원합니다.

Document Analyzer는 문서 내용의 관계를 파악하고, 없는 정보나 도출이 불가능한 해석은 알아서 거절 처리합니다.

또한 결과에 대한 교차 검증을 통해 99.94% 이상의 신뢰도를 제공합니다.

2. 해석에 대한 결과값과 사유를 동시에 제공합니다.

결과값을 시스템과 연동하여 프로세스를 자동화하며, 결과가 나온 이유에 대해 설명이 가능합니다.

3. 비정형 문서에서 필요한 데이터를 원하는 형태로 자유롭게 추출할 수 있습니다.

한글, 영어뿐만 아니라 다양한 언어로 지원이 가능하며, 고객사가 요구하는 형태로 결과를 자유롭게 얻을 수 있습니다.

또한 여러 장의 페이지도 동시에 해석이 가능합니다.

하지만 본업에 집중하다 보면 이미 익숙해져 불편함을 모르고 비효율적으로 업무를 할 때가 많습니다. 알고 보면 더 합리적으로 작업을 할 수 있다는 사실! 이미 아르고스의 Doucment Analyzer 서비스를 듣고 다양한 분야의 기업들이 많은 관심이 쏟고 있습니다.

여러분도 아르고스의 Document Analyzer를 사용하고 불편함을 해결하세요!

Share article
Subscribe to our newsletter.
RSSPowered by inblog