[사이언스칼럼] 거대언어모델, 오픈소스와 빅테크 간 대결의 최종 승자는

  • 오피니언
  • 사이언스칼럼

[사이언스칼럼] 거대언어모델, 오픈소스와 빅테크 간 대결의 최종 승자는

황순욱 한국과학기술정보연구원(KISTI) 책임연구원

  • 승인 2023-07-20 16:57
  • 신문게재 2023-07-21 18면
  • 임효인 기자임효인 기자
황순욱 사이언스칼럼 사진
황순욱 한국과학기술정보연구원(KISTI) 책임연구원
챗GPT 이후 거대언어모델(LLM)에 기반한 챗봇, 번역, 이미지 및 비디오, 코드 생성 등 생성 AI 서비스가 점점 일상화되고 있다. 최근에는 하루가 멀다 하고 개인 PC에서도 실행할 수 있는 소형의 가성비 좋은 오픈소스 LLM이 쏟아져 나오고 있다. 마이크로소프트(MS), 오픈AI, 구글과 같은 빅테크들의 LLM 기술 독점과 유로 API 서비스에 따른 오픈소스 진영의 반격이다.

오픈소스 LLM 움직임은 오픈 AI가 GPT-3을 공개하지 않은 데서 비롯됐다. 지난해 GPT-3 크기의 '블룸'과 'OPT'과 오픈소스로 출시되어 각광을 받았다. 모델 가중치, 코드, 훈련 데이터 등은 공개됐지만 수천 대의 GPU를 사용할 여력이 없는 대학이나 스타트업들에게는 그림의 떡이었다. MS와 오픈AI는 GPT-3와 챗GPT 출시할 때만 해도 훈련데이터와 모델 아키텍쳐 등 일부 기술은 공유했으나 GPT-4를 출시하면서는 공개하지 않았다. 구글도 지난 5월 최신 LLM 팜2(PaLM)를 출시하면서 자세히 공개하지 않았다. 빅테크들의 LLM 기술 장벽이 점점 높아지고 있다는 것이다.

지난 2월 오픈소스 LLM 진영에 반가운 소식이 있었다. 메타에서 LLM 민주화라는 명목하에 '라마'라는 LLM을 오픈소스로 공개한 것이다. 매개변수 70억(7B), 130억(13B), 330억(33B), 650억(65B)개 총 4개 체급으로 출시됐다. 비상업용 연구목적이라면 누구나 용도에 따라 적절한 크기의 라마를 선택해서 자유롭게 사용할 수 있다.

3월에 스탠포드대 연구팀이 라마-7B를 인스트럭션 튜닝한 '알파카'를 공개해서 노트북에서도 챗봇을 즐길 수 있게 되었다. 4월에는 UC 버클리대와 CMU 등의 공동연구팀이 라마-13B를 인스트럭션 튜닝한 '비쿠나'를 공개했다. 비쿠나는 모델 크기가 10배 이상 큰 구글 바드와는 성능이 비슷하고, 챗GPT의 90%의 성능을 보임으로써 훨씬 작은 비용과 모델 크기를 갖는 가성비 좋은 오픈소스 LLM의 가능성을 활짝 열었다.



라마가 쏘아 올린 가성비 좋은 오픈소스 LLM의 잠재력이 알파카와 비쿠나를 거치면서 폭발했다. GPT-3가 쏘아 올린 LLM의 가능성이 챗GPT를 거치면서 폭발한 것과 비슷하다. 오픈소스 LLM 출시 러시가 이어져서 지금까지 깃허브에 공개된 것만 해도 수십 개에 달한다. 아쉽게도 비상업용 라이센스 라마를 기반으로 튜닝한 오픈소스 LLM은 상업적으로 사용할 수 없다. 이에 대해 "라마를 풀어라"라는 오픈소스 커뮤니티의 목소리가 거세다. 라마를 그대로 재현해서 라마의 매개변수 가중치를 상업용으로 쓸 수 있게 하는 움직임도 있다. '오픈라마' 프로젝트가 대표적이다. 오픈라마-7B, GPT-J-6B, MPT-7B, 팰컨-40B 등 라마 기반이 아닌 상용으로 쓸 수 있는 다수의 오픈소스 LLM들이 공개돼 있다.

챗GPT와 GPT-4와 같은 빅테크 기업의 LLM은 챗봇, 문장 및 코드 생성 등에 있어 전반적으로 성능이 더 좋고, API 호출만으로 쉽게 이용할 수 있다. 오픈소스 LLM도 큰 장점이 있다. 첫째, 개인 PC나 노트북에 설치함으로써 빅테크 클라우드로의 데이터 유출 문제를 걱정하지 않아도 된다. 둘째, 적절한 데이터로 튜닝할 수 있음으로써 특정 태스크에 있어서는 빅테크 LLM보다 성능이 더 좋을 수 있다.

사용자들에게 빅테크 LLM의 강력한 대안이 하나 생긴 셈이다. 두 달 전쯤에 오픈소스 AI에 비해서 "구글은 더 이상 경쟁우위(moat)가 없다. 오픈AI도 마찬가지다"라는 구글 내부 문서가 유출됐다. 구글딥마인드 CEO 데미스 하사비스는 최근 한 인터뷰에서 구글의 혁신 문화를 강조하면서 오픈소스 AI가 구글을 앞설 것이라고 생각하지 않는다"라고 말했다. 구글 내에 이처럼 상반된 의견이 존재한다는 것이 흥미롭다.

오픈소스와 빅테크 간에 LLM 전쟁이 시작됐다. 오픈소스 LLM들이 엄청난 속도로 진화하고 있지만 아직은 초반 탐색전이라 향방을 가름할 수 없다. 마침 이번 주에 상업적으로 사용 가능한 라마2가 출시되었다. 이제부터 본격적으로 펼쳐질 오픈소스와 빅테크의 대결을 흥미롭게 한번 지켜보자. 어쩌면 두 진영은 서로의 영역을 인정하며 상생의 길을 모색할지도 모른다. 황순욱 한국과학기술정보연구원(KISTI) 책임연구원

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른기사 보기

랭킹뉴스

  1. 충남서 양심불량 주유소가 많은 지역은?
  2. ADHD 치료제 청소년 처방…사교육비 증가세 높은 충청권 급증
  3. 대전경찰, 추석 특별방범 중 절도 피의자 현장 검거
  4. 대전문화재단, 가을밤 물들이는 ‘뮤직토크쇼’…테이·변진섭 출연
  5. AI의 빛과 그림자…기술의 편리함이 낳은 함정
  1. 민속 최대 명절 추석, 해미읍성서 이틀간 문화행사 개최
  2. 대전시립연정국악단, 유럽 5개 도시서 국악으로 관객 사로잡아
  3. 천안법원, 부정한 방법 파견사업 허가받은 60대 벌금 500만원
  4. 천안문화재단, 제3기 정책자문위원회 출범
  5. 천안시의회, 미국 PG 카운티 대표단과 교류 협력 다져

헤드라인 뉴스


미래 대통령실·국회 찍GO, `세종시 한바퀴` 참여해볼까

미래 대통령실·국회 찍GO, '세종시 한바퀴' 참여해볼까

"걷GO(도보), 뛰GO(러닝), 타GO(자전거) 세종 국가상징구역 찍GO 나성동 차 없는 거리로 GO!" 중도일보가 오는 10월 18일 토요일 오전 세종시 행복도시 일대에서 '걷GO! 뛰GO! 타GO! 세종시 '국가상징구역' 찍GO 한바퀴' 행사를 진행한다. 국가상징구역은 미래 대통령실과 국회, 시민 공간 등 모두 3곳을 포함하는 행정수도의 상징으로 통한다. 참가(무료) 희망자는 오는 17일 오후 6시까지 중도일보 카카오채널 채팅창()을 통해 '참가자 전원 이름과 대표 연락처', '이동 방식 택일(걷기 또는 러닝 또는 자전거)'로..

옛 사진으로 보는 추억의 `풍요기원 전통놀이`
옛 사진으로 보는 추억의 '풍요기원 전통놀이'

추석 명절에는 오랜 세월동안 이어진 다양한 전통놀이를 즐기는 문화가 있다. 전통놀이는 단순히 즐기기만을 위한 놀이가 아니라 조상에게 감사하고 풍요를 기원하며 가족과 이웃이 하나 되는 의미를 담고 있다. 그러나 빠른 도시화와 아파트 문화의 확산 등 넓은 공간을 필요로 하는 전통놀이가 하기 어려워지고 공동체보다 개인 중심의 문화로 변화되며 전통놀이를 즐기는 사람들의 모습을 찾기 어려워졌다. 그래도 명절에 전통놀이가 빠질 수 없는 법. 사진을 통해 어떤 전통놀이가 있는지 알아보도록 하자. 먼저 네 개의 윷을 던져 나온 결과로 말을 움직이..

천안법원, 음주운전으로 수감됐다가 재범한 40대 남성 `징역 1년 6월`
천안법원, 음주운전으로 수감됐다가 재범한 40대 남성 '징역 1년 6월'

대전지법 천안지원 형사9단독은 음주운전으로 수감됐다가 재범한 혐의로 기소된 A(47)씨에게 징역 1년 6월을 선고했다. 7일 법조계에 따르면 A씨는 2025년 4월 20일 당진시 삽교호 주차장에서 천안시 서북구 불당동까지 약 34km 구간에서 혈중알코올농도 0.127%의 만취한 상태로 운전한 혐의로 재판에 넘겨졌다. 박혜림 부장판사는 "피고인은 자신의 잘못을 인정하고 있으나 동종 범죄로 실형 처벌까지 받은 전력이 있음에도 재범한 점, 음주운전은 자신뿐만 아니라 타인의 생명과 재산에 심각한 위험을 초래할 수 있는 범죄이므로 엄히 처벌..

실시간 뉴스

지난 기획시리즈

  • 정치

  • 경제

  • 사회

  • 문화

  • 오피니언

  • 사람들

  • 기획연재

포토뉴스

  • ‘전통시장의 변화는 무죄’…시장의 역사와 발전 ‘전통시장의 변화는 무죄’…시장의 역사와 발전

  • 민족 대이동 시작…안전한 귀성·귀경길을 위한 체크포인트 민족 대이동 시작…안전한 귀성·귀경길을 위한 체크포인트

  • 한복 입고 배우는 큰절 한복 입고 배우는 큰절

  • 다 같이 외치는 ‘청렴 동구’ 다 같이 외치는 ‘청렴 동구’