[세상읽기] 생성형 AI의 환각

  • 오피니언
  • 세상읽기

[세상읽기] 생성형 AI의 환각

  • 승인 2024-09-18 17:00
  • 신문게재 2024-09-19 18면
  • 우창희 기자우창희 기자
2024042301001828500072041
뉴스디지털부 우창희 부국장
대한민국은 AI세상에 빠져있다. 회사 업무를 처리할 때도, 논문을 쓰거나 리포트를 작성할 때는 물론 일상생활 곳곳에서 AI와 함께하고 있다. 휴대전화가 가장 대표적인 예다. 아이폰이 인공지능 개인비서 시리(Siri)를 서비스한 이후 몇 년이 흘러 삼성전자가 갤럭시 휴대전화에 AI를 탑재하면서 인공지능 시대가 열렸다. 삼성의 혁신은 경이롭다. 스마트폰 외에도 TV, 가전제품에 이르기까지 AI라이프를 제공한다. 세계에서 디지털 거부감이 가장 적은 나라여서일까. 빠른 것을 좋아하는 국민성도 크게 작용했을 것으로 생각한다.

디지털의 발달은 기술을 벗어나 인간과 같이 판단하고, 행동하거나 생각할 수 있는 인공지능을 고도화하기 위해 끊임없는 연구를 거듭하고 있다. 그 결과물이 생성형 인공지능 또는 생성형 AI다. 우리가 느끼지 못하는 사이 실생활에서 사용되고 있다. 의료, 마케팅, 패션, 게임, 예술 등 다양한 산업 부문에 걸쳐 응용된다.

국내 대표 포털사이트인 네이버는 지난해 8월 대형 언어 모델(LLM)을 활용해 만든 한국형 대화형 인공지능 'HyperCLOVA X' 서비스를 시작했다. 대형언어 모델을 구축하기 위해 방대한 양의 학습데이터를 활용했다. 네이버가 서비스하는 블로그, 카페, 뉴스, 쇼핑 댓글, 지식인 데이터가 사용됐는데 이중 블로그가 가장 많은 48.7%, 뉴스가 13.1%였다.

네이버 클로버X는 오픈AI 챗GPT보다 한국의 문화와 맥락을 가장 잘 이해하는 생성형 AI로 AI 생태계와의 연결성 및 확장성을 기반으로 새로운 사용자 경험과 비즈니스 기회를 만들어 준다고 홍보한다. 그래서 검색해 봤다. 검색어는 '중도일보 연혁은?'. 결과는 실망이었다. 1965년 9월 18일 창간되었다는 글로 시작되었는데 처음부터 잘못된 정보다. 중도일보는 1951년 8월 24일 창간호를 발간했다. 검색어를 조금씩 바꿔서 넣으면 나오는 정보도 달라졌다. 일부의 내용은 일치하기도 했다. 그럴싸한 글의 전개와 내용을 보면 필자가 물어본 말에 AI가 정답을 알려주는 것 같아 보인다. 하지만 이것은 AI가 제공하는 일종의 '환각 현상'이다. 중도일보에 몸담고 있는 필자는 오류라는 것을 알지만 다른 사용자들은 신뢰할 수 있는 정보로 인식할 여지가 크다. 정보의 바다인 인터넷 세상에서 일일이 검색하고 정보를 취득하던 번거로움을 AI가 단 몇 초 만에 결과처럼 알려주기에 사용자는 편리함을 느낄 것이다. 그 정보가 오류가 있을 수 있다는 것을 모른 채. 네이버는 환각 현상을 방지하기 위한 작업을 몇 차례 진행했지만 여전히 엉뚱한 대답을 내놓거나 존재하지 않는 것에 대해 언급하는 모습을 보이고 있다. 이 같은 현상은 네이버뿐 아니라 오픈AI인 챗GPT도 마찬가지다.

올해 초부터 중도일보가 챗GPT를 활용한 기사작성 도우미를 개발 중이다. 기술력이 뛰어난 외부업체와 함께 공동작업을 이어가고 있다. 처음에는 생성형 AI의 우수성과 결과물에 신세계를 경험한 것처럼 놀람의 연속이었다, 하지만 개발을 지속할수록 '환각 현상'의 늪에 빠졌다, 그럴싸한 글의 전개를 읽다 보면 수긍이 될 만큼 맞는 말을 늘어놓는다. AI가 자연스러운 답변 생성에 최적화된 만큼 잘못된 정보도 그럴 듯하게 포장을 잘 해서 보여준다, 개발에 오랜 시간이 걸리던 이유가 이것 때문이었다, '환각 현상'을 제거하기 위해.

오픈AI 챗GPT가 인공지능 학습을 위해 슈퍼컴퓨터 플랫폼에서 사용한 데이터를 알 수는 없으나 네이버가 클로버X를 학습시킨 데이터 공개내용을 보면 환각 현상이 발생하는 이유를 조금은 짐작해 볼 수 있다. 정보성과 신뢰성, 시대적 흐름 등을 담고 있는 언론기사(약 70개 매체의 10년 데이터)가 전체 학습에서 차지하는 비중이 13.1%뿐이다. 일반 사용자들이 온라인에 업로드한 블로그, 카페, 소셜댓글, 지식인 등의 데이터가 약 87% 달한다. AI학습 단계에서부터 답변의 정확성을 담보하기 어려운 구조지 않았나 싶다. 생성형 인공지능이 고도화되기 위해서는 뉴스 비중을 신뢰할 만큼 높이고, AI가 정상 구동할 수 있도록 지속적인 학습이 필요해 보인다.
우창희 기자 jdnews00@

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른기사 보기

랭킹뉴스

  1. [르포] "짠, 대전한화생명볼파크로!" 선양오크소맥, 한화팬심 저격하다
  2. '영원한 2인자' 고 김종필 탄생 100주년, 중용·통합의 정신 기린다
  3. 천안법원, 보관 중인 돈을 돌려주지 않은 60대 변호사 '벌금 2000만원'
  4. 천안시, 공무원 기후위기 대응 역량 강화 특강
  5. 천안시, '손 씻기·위생관리' 수족구병 예방수칙 당부
  1. 천안직산도서관, '손 끝에서 살아나는 작은 세상' 운영
  2. 천안시, 26일 '제16회 작은도서관 학교' 운영
  3. 서산 해미천서 여중생 2명 익수 사고, 1명 끝내 숨지고 1명 회복 중
  4. [문화 톡]현대적 관점에서 바라본, 여성 공무원 사기 앙양방안-중도일보 게재된 박노승씨 석사학위 논문을 바탕으로
  5. [2026 월드컵] 한국,남아공전 비기기만 해도 32강 진출… 확률 91% 전망

헤드라인 뉴스


허태정 호(號) 긴축재정 공식화 하나…트램 0시축제 뇌관

허태정 호(號) 긴축재정 공식화 하나…트램 0시축제 뇌관

22일 허태정 대전시장 당선인 인수위원회 1차 브리핑이 예정된 가운데 지역 사회의 이목이 집중되고 있다. 대전시가 당면한 각종 현안에 대해 허태정 호(號) 노선을 가늠하고 인수위 업무보고 과정 등에서 드러난 민선 8기 민낯에 대해 메스를 들이댈지 여부도 관심사다. 허태정 인수위는 이날 오전 11시 중구 선화동 옛 충남도청 대회의실에서 지난 9일 가동 이후 인수위원장이 시행하는 첫 기자회견을 연다. 이 자리엔 박정현 인수위원장, 이은구 부위원장, 박노동 운영간사 등이 참석한다. 인수위 핵심 관계자는 21일 중도일보와 통화에서 "업무보..

국내 `동전주` 219개 상장폐지 기로…대전 3~5개 기업 `위기`
국내 '동전주' 219개 상장폐지 기로…대전 3~5개 기업 '위기'

7월부터 상장폐지 대상에 포함되는 1000원 미만의 '동전주'가 국내 증시의 8%를 차지하는 것으로 나타났다. 대전지역에서도 3~5곳의 상장사의 주가가 1000원 안팎에 머물고 있어 투자자들의 각별한 주의가 요구된다. 21일 한국거래소에 따르면 이달 19일 기준 국내 증시 상장사 중 주가 1000원 미만인 종목은 총 219개로 집계됐다. 전체 2877개 상장사 중 7.6%에 해당하는 수치다. 코스닥 상장사가 148개로 가장 많았고, 코스피 상장사가 42개, 코넥스 상장사 29개였다. 대전지역 소재의 주가 1000원 미만 종목은 3개..

2027년 최저임금 업종별 차등 부결에 소상공인 `탄식`... "처지 외면한 처사" 비판
2027년 최저임금 업종별 차등 부결에 소상공인 '탄식'... "처지 외면한 처사" 비판

2027년 최저임금을 업종별 차등 적용안이 최저임금위원회 표결 끝에 무산되면서 소상공인들의 탄식이 이어지고 있다. 어려운 경기 상황에 직격탄을 맞은 숙박·음식업 등은 다른 업종보다 최저임금을 다르게 적용해야 하지만, 이 같은 주장이 받아들여지지 않자 소상공인들의 처지를 외면한 처사라고 비판하고 있다. 21일 업계에 따르면 최저임금위원회는 최근 정부세종청사에서 제7차 전원회의를 열어 내년 최저임금을 업종별로 달리 적용할지를 놓고 표결했지만, 반대 14표, 찬성 11표, 무효 1표로 출석위원 과반에 미치지 못해 부결됐다. 노사는 최저임..

실시간 뉴스

지난 기획시리즈

  • 정치

  • 경제

  • 사회

  • 문화

  • 오피니언

  • 사람들

  • 기획연재

포토뉴스

  • 하지(夏至)맞은 주말농장 ‘구슬땀’ 하지(夏至)맞은 주말농장 ‘구슬땀’

  • 나라를 위한 희생 ‘잊지 않겠습니다’ 나라를 위한 희생 ‘잊지 않겠습니다’

  • 여름철 풍수해 대비 장비 점검 여름철 풍수해 대비 장비 점검

  • 수족구 예방…‘꼼꼼하게 손 씻어요’ 수족구 예방…‘꼼꼼하게 손 씻어요’