[사이언스칼럼] 국가 R&D 디지털자산, 우리도 페어(FAIR) 운동을 벌이자

  • 오피니언
  • 사이언스칼럼

[사이언스칼럼] 국가 R&D 디지털자산, 우리도 페어(FAIR) 운동을 벌이자

황순욱 한국과학기술정보연구원(KISTI) 책임연구원

  • 승인 2021-10-14 15:04
  • 신문게재 2021-10-15 18면
  • 임효인 기자임효인 기자
황순욱 NEW
황순욱 한국과학기술정보연구원(KISTI) 책임연구원
2019년 국가 연구개발(R&D) 예산이 20조 원을 넘은 이후 내년에는 30조 원에 육박할 것이라고 한다. 디지털 전환 시대에 이처럼 막대한 국가 예산이 투입된 R&D 디지털 산출물 활용에 대한 국가 차원의 관리가 점점 중요해지고 있다. 2016년 네이처 자매지인 사이언티픽 데이터(Scientific Data)를 통해 산·학·연 50여 명의 저자가 "공공 예산이 투입된 연구 산출물의 공유와 재사용을 위한 페어(FAIR) 원칙"을 주창했다. 연구 산출물은 학술논문·연구데이터·소프트웨어 등 디지털 자산을 망라한다. 페어 원칙이란 "디지털 자산은 찾을 수 있고(Findable), 접근 가능하고(Accessible), 상호운용 가능하며(Interoperable), 재사용할 수 있어야(Reusable)한다"는 4가지 지침을 말한다.

전통적인 연구 성과물인 학술논문의 경우에는 특별히 페어 원칙을 강조하지 않더라도 그 생태계가 잘 작동되고 있다. 출판사들이 제공하는 다양한 서비스 및 구글 검색 등을 통해서 누구나 원하는 논문을 쉽게 찾을 수 있고 접근할 수 있으며, 인용을 통해 저자에게 적절한 보상이 주어진다. 최근 오픈엑세스 운동을 통해 학술논문 활용 문턱이 더 낮아지고 있다. 우리나라도 지난 6월 국가 차원의 오픈엑세스 정책 포럼을 개최하였고 8월에는 KISTI, 국립중앙도서관 등 6개 기관이 오픈엑세스 공동선언하는 등 국가 차원의 오픈엑세스 논의가 활발하다.

페어 원칙은 디지털 자산 중 특히 연구데이터의 공유·활용에 초점을 맞추고 있다. 학술논문 생태계와는 달리 연구데이터 생태계 작동은 아직 요원하다. 데이터 생산자는 데이터를 어디에 어떻게 게시할지에 모를 때가 많으며, 이에 대한 보상도 거의 없다. 데이터 소비자는 원하는 데이터를 어떤 툴을 사용해 어디서 어떻게 검색할지, 다운로드할 수 있는지, 데이터는 어떤 형식으로 저장돼 있고 그 의미는 무엇인지, 라이센스는 있는지 등에 대해 고민해야 한다. 대부분의 연구데이터는 기관별 또는 분야별로 다양한 형태(텍스트·그림), 다양한 저장형식(파일·데이터베이스), 다양한 접근방법(포털·API) 등 각자 나름대로 지침에 의해 관리·유통되고 있다.

이처럼 커뮤니티별 파편화된 연구데이터 관리 때문에 발생하는 데이터 통합·재사용의 근본적인 문제를 해결하고자 페어 원칙이 나온 것이다. 페어 원칙에서 특히 필자의 눈길을 끈 것은 '머신 실행성'(machine-actionability)을 강조한다는 점이다. 사람의 개입 없이 기계 스스로 데이터를 찾고 접근하며 새롭게 생성된 데이터와의 상호운용 및 재사용을 통해 새로운 지식을 통합·창출할 수 있는 기계의 자율적인 실행력을 의미한다. 인공지능에서의 '머신 러닝'이라는 용어와 일맥상통한다. 머신 실행성과 머신 러닝 둘 다 데이터가 너무 많고 복잡해서 기계의 처리 능력에 의존해야 하는 21세기 디지털 전환 시대의 빅데이터 속성을 잘 반영한다. 인공지능에서 머신이 학습하기 위해 데이터 레이블링 작업이 필요하듯이, 연구데이터 생태계에서 기계 자율적인 실행을 위해선 페어 원칙을 지키는 데이터 관리체계가 필수적이다.

국가 R&D 예산의 지속적인 증가에 따라 미래 소중한 디지털 자산인 국가 연구데이터가 점점 더 많이(Volume), 더 빠른 속도(Velocity)로, 더 다양한 형태(Variety)로 생산되고 있다. EU와 미국에서는 페어 전담 그룹(force11.org, go-fair.org 등)을 중심으로 R&D 디지털 자산 전반에 걸쳐 페어 원칙 실천 운동이 활발하다. 이에 우리도 페어 전담 그룹이 조직돼서 페어 원칙에 대해 활발한 논의와 글로벌 페어 커뮤니티와도 연대하는 국가 차원의 디지털 자산 페어 운동(movement)을 벌여야 한다. 황순욱 한국과학기술정보연구원(KISTI) 책임연구원

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른기사 보기

랭킹뉴스

  1. '반도체 홀대' 충청, 李 정부 장관 인사서도 푸대접
  2. 민선 9기 대전시 첫 인사 단행
  3. 오석진 대전교육감 취임… "학교 중심 교육행정 실현"
  4. 대전 시내버스 사고 수 속여 성과금 더 받은 관계자들, 벌금형
  5. 민선 9기 대전 5개 구청장 취임…첫날 민생 지원·현장 중심 행보 눈길
  1. 대전시장 취임식장 단상에 난입한 로봇개! 너 누구니?
  2. 건양사이버대, 독일 심리운동협회와 맞손
  3. 김종일 대전세무서장 취임 "공정하고 합리적인 세무서 만들것"
  4. [인사] 충남대·충남대병원·을지대병원 등
  5. 본격적인 장마철의 시작

헤드라인 뉴스


박수현 "충청권이 AI 반도체 중심"…392조원 규모 투자 환영

박수현 "충청권이 AI 반도체 중심"…392조원 규모 투자 환영

박수현 충남지사가 2일 '충청권 첨단산업 발전비전 국민보고회'에서 공개된 충청권 반도체·디스플레이·이차전지·바이오 분야 약 392조 원 투자 계획에 대해 환영의 뜻을 밝혔다. 다만, 정부의 '3대 메가프로젝트'를 두고 일각에서 불거진 충청권 소외론에 대해선 "투자 금액의 상대적 비교는 중요하지 않다"며 단호히 선을 그었다. 도에 따르면 삼성그룹과 SK하이닉스, 셀트리온 등은 이날 충청권 내 반도체, 디스플레이, 이차전지, 바이오 등 미래 첨단 산업 핵심 분야에 392조 원을 투자하기로 결정했다. 이중 도내 투자금은 202조 원이다...

대전 선도지구 발표 임박…몇 개 구역 선정될까?
대전 선도지구 발표 임박…몇 개 구역 선정될까?

대전 노후계획도시정비 선도지구 발표가 임박하면서 최대 몇 개 구역이 선정될지 관심이 쏠린다. 둔산지구의 경우 최대 3개 구역까지 선정 가능하며, 송촌지구는 1개 구역만 신청해 사실상 선정이 확정된 상황이다. 현재 대전시는 국토교통부와 사전 협의를 마친 상태로, 2~3주 내 선도지구 선정 결과를 발표할 것으로 전망된다. 2일 시에 따르면 대전 노후계획도시정비 선도지구 공모에 둔산지구 9곳, 송촌(중리·법동)지구 1곳 등 총 10개 구역이 도전장을 내밀었다. 신청구역은 특별정비예정구역 27곳 중 1구역(상록수·상아·초원·강변) 3899..

[MSI 2026] 대전 뜨겁게 달군 T1… 이제 우승 향해 달린다! 브래킷 스테이지 대진 확정
[MSI 2026] 대전 뜨겁게 달군 T1… 이제 우승 향해 달린다! 브래킷 스테이지 대진 확정

대전에서 열리고 있는 이스포츠 게임축제 2026 미드 시즌 인비테이셔널(MSI 2026)이 순조롭게 진행되고 있는 가운데 한국 대표로 출전한 T1이 승승장구하며 본선 라운드 브래킷 스테이지에 진출했다. '페이커' 이상혁의 소속팀인 T1은 1일 진행된 MSI 플레이-인 스테이지 최종전에서 강팀 '리퀴드(TL.북미)'를 세트 스코어 3대 0으로 완파하며 단 1팀에 주어지는 브래킷 스테이지 진출권을 따냈다. 이로써 T1은 세계 최정상급 8개 팀과 함께 우승을 향한 본격적인 레이스를 시작하게 됐다. T1의 본선 과정은 그야말로 '압도적'이..

실시간 뉴스

지난 기획시리즈

  • 정치

  • 경제

  • 사회

  • 문화

  • 오피니언

  • 사람들

  • 기획연재

포토뉴스

  • 이재명 대통령, 충청권 첨단산업 발전비전 국민보고회 참석 이재명 대통령, 충청권 첨단산업 발전비전 국민보고회 참석

  • ‘개문냉방 안돼요’ ‘개문냉방 안돼요’

  • ‘함께하는 가치, 소비자의 힘’ ‘함께하는 가치, 소비자의 힘’

  • 본격적인 장마철의 시작 본격적인 장마철의 시작