![]() |
| AI의 시각 성능을 높일 수 있는 범용 기술 '업샘플 애니띵(Upsample Anything)' 연구 개요도. (그래픽=KAIST 제공) |
KAIST(총장 이광형)는 전기및전자공학부 김창익 교수 연구팀이 미국 MIT 및 마이크로소프트 연구진과의 공동 연구를 통해, 제한된 GPU 메모리만으로도 AI의 시각 성능을 높일 수 있는 범용 기술 '업샘플 애니띵(Upsample Anything)'을 개발했다고 17일 밝혔다.
시각 분야의 거대 비전 파운데이션 모델(VFM)은 인간 수준의 뛰어난 이미지 이해 성능을 보여주고 있다. 그러나 이들 모델은 방대한 연산량을 감당하기 위해 입력 이미지를 내부적으로 약 14~16배 낮은 해상도로 압축하여 처리한다. 이러한 압축 과정은 계산 효율을 높여주지만, 물체의 정밀한 경계선, 아주 작은 객체, 미세한 균열이나 얇은 구조물 등 '픽셀 단위'의 핵심 정보들이 대거 손실되는 한계가 있다.
김창익 교수 연구팀 이러한 한계를 극복하기 위해 입력 이미지의 경계와 구조 정보를 활용해 저해상도 특징 정보를 고해상도로 복원하는 학습 없는(Training-free·추가 데이터 학습이 필요 없는) 업샘플링 기술을 개발했다.
기존 기술은 새로운 환경이나 데이터에 적용하기 위해 별도의 재학습이나 복잡한 최적화 과정을 거쳐야 했다. 반면 연구팀이 개발한 '업샘플 애니띵'은 입력 이미지 한 장만으로 최적의 복원 방식을 찾아낼 수 있어 다양한 환경에 즉시 적용할 수 있다.
모든 시각 정보를 고해상도로 저장·처리하지 않고 핵심 정보만 압축해 활용함으로써 GPU 메모리 사용량을 크게 줄였다. 연구팀은 AI 연구에서 널리 활용되는 224×224 크기 이미지(약 5만 개 픽셀) 기준 약 0.4초의 짧은 계산만으로 원본에 가까운 시각 정보를 복원했으며, GPU메모리 효율을 최대 16배까지 향상시키는 성과를 거뒀다.
김창익 교수는 "고해상도 특징맵을 효율적으로 복원해 작은 결함, 미세한 경계, 정밀한 위치 차이처럼 세부 정보가 중요한 현장에서 강점을 보이는데, 향후 반도체 제조 공정, 품질 검사, 정밀 로봇 제어 등 고해상도 시각 인식이 필요한 산업 현장에 활용될 가능성이 기대된다"라며 "성능뿐 아니라 계산 효율성과 연구 투명성까지 인정받았다는 점에서 더욱 의미가 크다"고 말했다.
이번 연구는 KAIST 서민석 박사과정 학생이 제1 저자로 참여했으며, 이번 성과는 인공지능 및 컴퓨터 비전 분야 세계 최고 권위 학회인 'CVPR 2026'에서 6월 7일 발표됐다.
임병안 기자
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지
임병안 기자
![[현장 사람들] 화마 속 진실을 쫓는 대전동부소방서 화재조사관들](https://dn.joongdo.co.kr/mnt/webdata/content/2026y/06m/17d/20260616010100083061.jpeg)
![[청년이 미래-2편] "자연스럽고 안전하게".. 대전시가 잇는 청년들의 인연](https://dn.joongdo.co.kr/mnt/webdata/content/2026y/06m/17d/crop118_2026061601001080300044211.jpg)




