![]() |
7일 한국정보통신연구원(이하 ETRI)에 따르면 언어지능연구실 연구진은 한글파일 등 오피스 문서 내용을 파악해 사용자의 질문에 답변을 주는 엑소브레인 API 2종을 개발하고 ETRI 공공 AI 오픈 API·데이터 서비스 포털에 서비스를 시작했다.
![]() |
행정문서 내 궁금한 정보를 문장 형식으로 물어보면 자세한 규정을 찾아 안내하는 행정문서 질의응답 API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식할 수 있다. 예를 들어 교통안전법 시행규칙에 따른 '교통안전관리규정 준수 여부의 확인·평가는 언제 실시하는가?'라고 질문하면 '매 5년이 지난날의 전후 100일 이내'라고 정답을 안내하고 판단 근거가 되는 단락을 제시하는 식이다.
![]() |
패러프레이즈(Paraphrase) 인식 API는 문장은 생김새는 다르지만 같은 의미를 파악할 수 있는 기술이다. 앞서 나온 행정문서QA API와 다른 한국어 AI 개발 등에도 쓰일 수 있다.
AI와 딥러닝 기술은 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 연구진이 개발한 기술은 '성탄 전야 미사를 집전하며 프란치스코 교황이 전한 메시지는 '어린이를 향한 관심'입니다'와 '프란치스코 교황의 올해 첫 성탄 메시지는 고통받는 어린이를 향한 관심이었습니다' 이 두 문장의 의미가 동등하다는 것을 인식할 수 있다.
![]() |
개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 현재는 한글 문서 대상으로만 서비스를 제공하지만 개발 기술 자체는 워드·PDF 등 다른 문서에도 범용적으로 쓰일 수 있다.
연구진은 앞으로 딥러닝을 사용해 인간과 유사한 텍스트를 생성하는 자동 희귀 언어모델 GPT-3에 대응해 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개할 계획이다.
![]() |
| 임준호(오른쪽) ETRI 책임연구원이 배용진 선임연구원에게 오피스문서에 활용할 수 있는 API 기술을 설명하고 있다. ETRI 제공 |
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지
임효인 기자










