![]() |
단국대는 고문헌에 표기된 흘림체 글자 등 복잡한 한자에 인공지능 기술을 적용, 한자를 자동으로 분할하고 인식하는 모델을 개발했다.
이를 바탕으로 3억 자 이상의 한자 이미지를 데이터베이스로 구축, 사용자가 사용할 경우 전체 한자의 90% 이상을 판별할 수 있게 됐다.
이 프로그램은 고문헌 이미지 파일의 한자 이미지를 자동으로 분할하고, 이후 추출된 한자 자형 이미지에 맞는 한자 유니코드를 부여해 검색과 활용이 용이한 신뢰도 높은 한자 자형 정보 데이터베이스에 구축된다.
김우정 소장은 "우리 민족의 지식 자산을 우리 기술로 처리하고 관리하는 시스템을 구축했다는 점에서 의미가 크다"며 "관련 앱을 만들어 국학을 연구하는 학생과 교수, 관련 연구자에게 제공할 계획"이라고 포부를 밝혔다.
한편, 단국대는 한국학중앙연구원의 허가를 받아 서비스를 제공한다는 계획이다.
천안=하재원 기자
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지
하재원 기자






