[사이언스칼럼] 2025년, AI는 어떻게 진화했는가: 에이전트·평가·학습의 재정의

  • 오피니언
  • 사이언스칼럼

[사이언스칼럼] 2025년, AI는 어떻게 진화했는가: 에이전트·평가·학습의 재정의

황순욱 한국과학기술정보연구원(KISTI) 책임연구원

  • 승인 2025-12-04 17:04
  • 신문게재 2025-12-05 18면
  • 임효인 기자임효인 기자
clip20251204094100
황순욱 한국과학기술정보연구원(KISTI) 책임연구원
지난 1월 딥시크 R1 모델이 등장해 세상을 떠들썩하게 했다. 이 중국발 오픈소스 추론 모델은 오픈AI의 추론 모델인 o1과 견줄 만한 성능을 내며, 상대적으로 적은 비용과 알고리즘 효율화로도 최고 수준의 모델을 만들 수 있음을 보여주며 AI 산업의 판도를 뒤흔들었다. 그 충격파는 1년 내내 이어졌고, 2025년 AI는 눈부신 진화를 이루었다. 에이전트, 평가, 학습 및 스케일링의 진화라는 축에서 2025년을 되돌아보자.

첫째는 에이전트의 진화다. 3월 마누스 AI(Manus AI)의 등장은 AI 에이전트 시대의 신호탄이었다. 복잡한 작업을 자율적으로 수행하는 에이전트 개념은 새롭지 않았지만, 이를 구현하는 프레임워크들이 쏟아졌다. 랭체인, 랭그래프, 커서AI와 같은 도구들이 개발자 커뮤니티를 뜨겁게 달궜다. 이들 프레임워크는 LLM에 '작업 분해', '도구 사용', '자기 검증' 능력을 외부에서 부여하는 방식이었다.



그러나 하반기의 풍경은 달랐다. 7월 키미 K2, 8월 GPT-5, 11월 제미나이 3가 차례로 공개되며 멀티스텝 추론과 도구 사용 등 에이전트 기능이 모델 자체에 통합되기 시작했다. 외부 프레임워크 없이도 모델 스스로 작업을 분해하고 도구를 선택하며 결과를 검증하는 능력을 갖추게 된 것이다. 에이전트가 LLM의 래퍼(wrapper)로 기능을 덧붙이는 수준을 넘어, LLM 자체의 기본 작동 방식으로 자리 잡는 구조적 전환이 일어나고 있다.

둘째는 평가 패러다임의 전환이다. 그동안 모델 경쟁은 MMLU와 같은 벤치마크 점수로 줄 세우는 식이었다. 하지만 벤치마크는 모델이 '무엇을 알고 있는가'를 측정할 뿐, '사람들에게 얼마나 유용한가'를 보여주기에는 한계가 컸다. 이 간극이 커지면서 전문가 기반 평가가 핵심 지표로 부상했다. 오픈AI의 GPT-5.1이 벤치마크보다 휴먼 평가(human eval)를 전면에 내세운 것은 상징적이다. 오픈AI가 도입한, 경제적 가치가 있는 실제 작업에 대한 모델 성능을 측정하는 새로운 평가 지표인 GDPVal은 단순한 정답률이 아니라 AI가 내놓은 결과물이 전문가의 눈높이에서 얼마나 쓸모 있는지를 본다. 기술 경쟁의 초점이 '누가 더 문제를 잘 맞히나'에서 '누가 더 인간 전문가처럼 사고하고 협업하는가'로 옮겨가고 있는 것이다.



셋째는 학습 및 스케일링 방법론의 재발견이다. 지난 10여 년은 '데이터와 연산량을 더 넣으면 성능은 따라온다'는 스케일링 법칙의 시대였다. 더 이상 가용한 인터넷 데이터가 없다는 고갈론과 함께 "스케일링 법칙은 끝났다"는 회의론도 나왔다. 그러나 최근 출시된 제미나이 3는 스케일링 법칙이 여전히 유효하다는 쪽에 힘을 실었다. 프로젝트를 이끈 구글 딥마인드의 오리올 비냐스는 X(구 트위터)에 "The secret behind Gemini 3?"라는 글을 올려, 비밀은 단순하지만 강력하다며 "사전학습과 사후학습 모두를 개선했다"고 밝혔다. 구체적 레시피는 밝히지 않았지만, LLM 학습 단계에서 여전히 큰 도약이 가능하다는 메시지는 분명하다.

한편 스케일링 법칙 자체를 다시 묻는 움직임도 있다. 오픈AI 공동 창업자였다가 세이프 수퍼인텔리전스(SSI)를 세운 일리야 수츠케버는 최근 대담에서, 지금의 사전학습과 강화학습 조합만으로는 모델이 "기묘하게 똑똑하면서 동시에 멍청한" 상태에 머문다고 진단했다. 더 많은 데이터와 더 큰 모델보다 "어떻게 학습시킬 것인가"라는 질문이 중요해졌으며, 스케일링 시대를 지나 다시 연구와 발견의 시대로 돌아가야 한다고 주장한다.

결국 두 시각은 같은 지점으로 수렴한다. 단순 확장 스케일링의 시대는 저물고, 잘 설계된 스케일링과 새로운 학습 방법을 찾는 연구의 시대가 시작됐다는 것이다. 2025년은 딥시크 R1, 마누스 AI, 키미 K2, GPT-5, 제미나이 3로 이어진 파도 속에서 에이전트·평가·학습이 각각 새로운 방향으로 진화한 해였다. 2025년이 방향을 정립한 해였다면, 2026년은 그 방향을 향해 본격적으로 달려가는 해가 될 것이다. 에이전트·평가·학습 패러다임의 변화가 이론적 담론을 넘어, 우리가 일하고 배우고 살아가는 방식을 실질적으로 바꾸는 출발점이 되는 2026년 새해를 기대해 본다. 황순욱 한국과학기술정보연구원(KISTI) 책임연구원

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른기사 보기

랭킹뉴스

  1. 천안 식용곤충사육 축산농가 26명, 장기수 천안시장 예비후보 지지 선언
  2. 천안법원, 만취운전으로 정차한 차량 들이받은 혐의 50대 여성 징역형
  3. 천안시, 어린이날 기념식 무대 함께할 '104인 퍼포먼스단' 모집
  4. 남서울대-천안시, '탄소중립 실현을 위한 공동 교육과정' 출범
  5. 나사렛대, 품새 국가대표 배출…태권도학과 저력 입증
  1. 중진공 충청연수원-아산스마트팩토리마이스터고 MOU
  2. 천안시 서북구, 지적재조사사업 주민설명회 개최
  3. 충남혁신센터, 2026 창업-BuS '100번가의 톡' 참가기업 상시 모집
  4. 상명대 국어문화원, 전국 평가 최고 등급 '매우 우수' 선정
  5. 천안시, '네일아트 전문봉사자' 양성…현장 맞춤형 나눔 확산

헤드라인 뉴스


벼랑 끝 대전충남 통합 충청출신 與野 대표 `빅딜`만 남았다

벼랑 끝 대전충남 통합 충청출신 與野 대표 '빅딜'만 남았다

대전 충남 행정통합이 벼랑 끝에 선 가운데 여야 대표의 극적 합의 없이는 이와 관련해 꽉 막힌 정국을 풀기 어렵다는 지적이 나온다. 수도권 일극 체제 극복과 국가균형발전을 위한 행정통합 대의에 동의한다면 한 발씩 양보해 극적 합의점을 찾아야 한다는 것이다. 하지만, 여야 견해차가 크고 석 달도 채 남지 않은 6·3 지방선거 앞 정략적 셈법이 개입하면서 합의에 다다를지는 미지수다. 3월 국회에 돌입한 가운데 더불어민주당은 대전충남, 대구경북(TK) 특별법을 패키지로 처리해야 한다는 입장을 고수하고 있다. 여당은 국힘이 대전충남도 TK..

빨라지는 6·3 지방선거 시계… 여야 정당 & 후보자 `잰걸음`
빨라지는 6·3 지방선거 시계… 여야 정당 & 후보자 '잰걸음'

여야 정당과 출마 예정자들이 6·3 지방선거를 90여 일 앞두고 관련 행보에 박차를 가하고 있다. 정당에선 후보자 선출을 위한 공천 작업이 본궤도에 오르고, 출마 예정자들은 후원회를 차리면서 조직 정비와 함께 공약 구체화에 나서는 등 다가오는 경선 대비에 총력전을 나섰다. 이런 가운데 일부 지역에선 공천에 앞서 갈등과 신경전도 표면화돼 지선 분위기가 후끈 달아오르는 분위기다. 우선 여야 대전시당은 공천관리위원회를 가동해 후보 선출을 위한 작업들을 진행 중이다. 민주당 대전시당은 최근 첫 공천관리위원회 회의를 열어 예비후보자 자격심사..

"올릴땐 빠르게, 내릴땐 천천히" 대전시민들 주유소 불신하는 이유는?
"올릴땐 빠르게, 내릴땐 천천히" 대전시민들 주유소 불신하는 이유는?

미국·이스라엘과 이란 간 중동전쟁 여파로 대전지역 유류가격이 일주일 사이 300원 안팎 급등한 것으로 나타났다. 특히 대전은 판매가격이 빠르게 인상돼 전국 평균보다 높은 상승률을 기록하면서 시민들 사이에서 주유소 가격 인상에 대한 불신이 커지고 있다. 국제유가도 배럴당 90달러를 돌파하면서 기름값 고공행진은 한동안 지속될 전망이다. 8일 한국석유공사 유가정보시스템 '오피넷'에 따르면, 대전지역의 기름값 상승폭이 전국 평균보다 높은 것으로 나타났다. 중동전쟁 발발 직전인 지난달 28일 리터당 1677.81원이던 대전 휘발유 평균 가격..

실시간 뉴스

지난 기획시리즈

  • 정치

  • 경제

  • 사회

  • 문화

  • 오피니언

  • 사람들

  • 기획연재

포토뉴스

  • 어린이보호구역 과속 금지 어린이보호구역 과속 금지

  • 3.8민주의거 역사적 의미 살펴보는 시민들 3.8민주의거 역사적 의미 살펴보는 시민들

  • ‘더 오르기 전에…’ 붐비는 주유소 ‘더 오르기 전에…’ 붐비는 주유소

  • 즐거운 입학식…‘반갑다 친구야’ 즐거운 입학식…‘반갑다 친구야’