[사이언스칼럼] 거대언어모델, 오픈소스와 빅테크 간 대결의 최종 승자는

  • 오피니언
  • 사이언스칼럼

[사이언스칼럼] 거대언어모델, 오픈소스와 빅테크 간 대결의 최종 승자는

황순욱 한국과학기술정보연구원(KISTI) 책임연구원

  • 승인 2023-07-20 16:57
  • 신문게재 2023-07-21 18면
  • 임효인 기자임효인 기자
황순욱 사이언스칼럼 사진
황순욱 한국과학기술정보연구원(KISTI) 책임연구원
챗GPT 이후 거대언어모델(LLM)에 기반한 챗봇, 번역, 이미지 및 비디오, 코드 생성 등 생성 AI 서비스가 점점 일상화되고 있다. 최근에는 하루가 멀다 하고 개인 PC에서도 실행할 수 있는 소형의 가성비 좋은 오픈소스 LLM이 쏟아져 나오고 있다. 마이크로소프트(MS), 오픈AI, 구글과 같은 빅테크들의 LLM 기술 독점과 유로 API 서비스에 따른 오픈소스 진영의 반격이다.

오픈소스 LLM 움직임은 오픈 AI가 GPT-3을 공개하지 않은 데서 비롯됐다. 지난해 GPT-3 크기의 '블룸'과 'OPT'과 오픈소스로 출시되어 각광을 받았다. 모델 가중치, 코드, 훈련 데이터 등은 공개됐지만 수천 대의 GPU를 사용할 여력이 없는 대학이나 스타트업들에게는 그림의 떡이었다. MS와 오픈AI는 GPT-3와 챗GPT 출시할 때만 해도 훈련데이터와 모델 아키텍쳐 등 일부 기술은 공유했으나 GPT-4를 출시하면서는 공개하지 않았다. 구글도 지난 5월 최신 LLM 팜2(PaLM)를 출시하면서 자세히 공개하지 않았다. 빅테크들의 LLM 기술 장벽이 점점 높아지고 있다는 것이다.



지난 2월 오픈소스 LLM 진영에 반가운 소식이 있었다. 메타에서 LLM 민주화라는 명목하에 '라마'라는 LLM을 오픈소스로 공개한 것이다. 매개변수 70억(7B), 130억(13B), 330억(33B), 650억(65B)개 총 4개 체급으로 출시됐다. 비상업용 연구목적이라면 누구나 용도에 따라 적절한 크기의 라마를 선택해서 자유롭게 사용할 수 있다.

3월에 스탠포드대 연구팀이 라마-7B를 인스트럭션 튜닝한 '알파카'를 공개해서 노트북에서도 챗봇을 즐길 수 있게 되었다. 4월에는 UC 버클리대와 CMU 등의 공동연구팀이 라마-13B를 인스트럭션 튜닝한 '비쿠나'를 공개했다. 비쿠나는 모델 크기가 10배 이상 큰 구글 바드와는 성능이 비슷하고, 챗GPT의 90%의 성능을 보임으로써 훨씬 작은 비용과 모델 크기를 갖는 가성비 좋은 오픈소스 LLM의 가능성을 활짝 열었다.



라마가 쏘아 올린 가성비 좋은 오픈소스 LLM의 잠재력이 알파카와 비쿠나를 거치면서 폭발했다. GPT-3가 쏘아 올린 LLM의 가능성이 챗GPT를 거치면서 폭발한 것과 비슷하다. 오픈소스 LLM 출시 러시가 이어져서 지금까지 깃허브에 공개된 것만 해도 수십 개에 달한다. 아쉽게도 비상업용 라이센스 라마를 기반으로 튜닝한 오픈소스 LLM은 상업적으로 사용할 수 없다. 이에 대해 "라마를 풀어라"라는 오픈소스 커뮤니티의 목소리가 거세다. 라마를 그대로 재현해서 라마의 매개변수 가중치를 상업용으로 쓸 수 있게 하는 움직임도 있다. '오픈라마' 프로젝트가 대표적이다. 오픈라마-7B, GPT-J-6B, MPT-7B, 팰컨-40B 등 라마 기반이 아닌 상용으로 쓸 수 있는 다수의 오픈소스 LLM들이 공개돼 있다.

챗GPT와 GPT-4와 같은 빅테크 기업의 LLM은 챗봇, 문장 및 코드 생성 등에 있어 전반적으로 성능이 더 좋고, API 호출만으로 쉽게 이용할 수 있다. 오픈소스 LLM도 큰 장점이 있다. 첫째, 개인 PC나 노트북에 설치함으로써 빅테크 클라우드로의 데이터 유출 문제를 걱정하지 않아도 된다. 둘째, 적절한 데이터로 튜닝할 수 있음으로써 특정 태스크에 있어서는 빅테크 LLM보다 성능이 더 좋을 수 있다.

사용자들에게 빅테크 LLM의 강력한 대안이 하나 생긴 셈이다. 두 달 전쯤에 오픈소스 AI에 비해서 "구글은 더 이상 경쟁우위(moat)가 없다. 오픈AI도 마찬가지다"라는 구글 내부 문서가 유출됐다. 구글딥마인드 CEO 데미스 하사비스는 최근 한 인터뷰에서 구글의 혁신 문화를 강조하면서 오픈소스 AI가 구글을 앞설 것이라고 생각하지 않는다"라고 말했다. 구글 내에 이처럼 상반된 의견이 존재한다는 것이 흥미롭다.

오픈소스와 빅테크 간에 LLM 전쟁이 시작됐다. 오픈소스 LLM들이 엄청난 속도로 진화하고 있지만 아직은 초반 탐색전이라 향방을 가름할 수 없다. 마침 이번 주에 상업적으로 사용 가능한 라마2가 출시되었다. 이제부터 본격적으로 펼쳐질 오픈소스와 빅테크의 대결을 흥미롭게 한번 지켜보자. 어쩌면 두 진영은 서로의 영역을 인정하며 상생의 길을 모색할지도 모른다. 황순욱 한국과학기술정보연구원(KISTI) 책임연구원

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른기사 보기

랭킹뉴스

  1. 개학 코앞인데, 공사장 통학로에 무단 태극기 게양까지
  2. TK까지 올라탄 행정통합 열차…대전·충남만 골든타임 놓치나
  3. [라이즈人] 정철호 목원대 라이즈사업단장 "인문·사회·문화예술 강점으로 지역 풍요롭게"
  4. [중도일보-세종선관위 공동기획 '지방선거 포커스①'] 사전투표 장비 점검
  5. [사이언스칼럼] 유연한 '두쫀쿠', 엄격한 '한쫀쿠'
  1. 헌신·희생 실천 교정인의 이름 새긴 대전교도소, '명예의 벽' 설치
  2. 대전중심 회생법원시대 개원…도산사건 빠르고 전문성 높여
  3. 충남·대전 공공기관 이전 빨간불?…통합 무산 우선권 차질
  4. '할머니-아버지-딸' 3대 뜻 이어 KAIST에 50억 익명 기부 화제
  5. 대전교육청 2026년 주요 정책은? 민주시민교육·돌봄 확대·국제교육원 설립 등

헤드라인 뉴스


개학 코앞인데, 공사장 통학로에 무단 태극기 게양까지

개학 코앞인데, 공사장 통학로에 무단 태극기 게양까지

새 학기를 일주일도 채 남기지 않은 가운데 대전 일부 초등학교 주변 환경이 여전히 정비되지 않아 학생 안전과 면학 분위기에 대한 우려가 제기되고 있다. 26일 대덕구 화정초등학교 정문 앞 도로에서는 오정동 하수관로 정비사업이 한창이다. 개학을 앞둔 시점임에도 공사 자재와 장비가 도로변에 남아 있고, 학교 방향 보행 동선도 제한된 상태다. 해당 사업은 오정동과 홍도동 일원 3139가구를 대상으로 추진되며 2026년 8월까지 진행될 예정이다. 다만 구간별 세부 일정은 명확히 안내되지 않아 학부모들의 불안이 이어지고 있다. 화정초 정문..

민주당 대전시당, 대전충남 통합 결의대회…"통합 기회 다시 찾아오겠다"
민주당 대전시당, 대전충남 통합 결의대회…"통합 기회 다시 찾아오겠다"

더불어민주당 대전시당은 27일 "앞에선 찬성 뒤로는 반대, 충청홀대 중단하라"며 대전충남 통합 결의대회를 시작했다. 더불어민주당 대전 지역 기초의원들과 당원들은 이날 대전시청 북문 국기게양대 앞에서 '20조 지원·공공기관 이전 걷어찬 매향노 5적 규탄 및 대전충남 통합 결의대회'를 열고 단식농성에 돌입했다. 단식농성은 내달 4일까지 6일간 35명이 참가할 예정이다. 이들은 "우리 청년들의 미래와 지역의 명운이 걸린 '통합의 길'을 결코 포기하지 않겠다"며 "지역의 미래와 20조를 걷어찬 무책임한 정치를 규탄하고, 통합의 불씨를 다시..

대화와 타협 사라진 정치, 여의도에 다시 등장한 ‘운정 김종필’
대화와 타협 사라진 정치, 여의도에 다시 등장한 ‘운정 김종필’

김종필기념사업재단과 백제개발문화연구원을 통합한 ‘김종필문화재단’이 26일 공식 출범하며 한 치의 양보도 없이 극에 달한 정치권을 향해 고 김종필 전 국무총리의 ‘대화와 타협의 정치’를 강조했다. 2025년 통합한 재단은 이날 서울 여의도 모처에서 통합 후 처음으로 공식 행사인 ‘김종필문화재단 새출발, 재도약 다짐 오찬’을 열고 정식 출범을 알렸다. 행사에는 조부영 재단 이사장과 김희용·나경원 부이사장, 추재엽 사무총장을 비롯해 96세인 권노갑 김대중재단 이상과 정대철 대한민국헌정회장, 더불어민주당 박수현 국회의원 등 JP를 기억하는..

실시간 뉴스

지난 기획시리즈

  • 정치

  • 경제

  • 사회

  • 문화

  • 오피니언

  • 사람들

  • 기획연재

포토뉴스

  • ‘태극기를 게양합시다’ ‘태극기를 게양합시다’

  • 파크골프 인기에 파크골프장 주변 불법주정차 극성 파크골프 인기에 파크골프장 주변 불법주정차 극성

  • 특이민원 대응 모의훈련 특이민원 대응 모의훈련

  • 장 담그기 가장 좋은 시기 장 담그기 가장 좋은 시기