저작권 리셋(Copyright Reset) 토큰과 국민 주도의 소버린 AI 펀드, 데이터 주권을 구축할 수 있는 마지막 퍼즐
한국의 디지털 자산이 외형적으로는 풍성하지만 아직은 AI산업에 쓰이기에는 데이터들의 디지털 형태로는 턱없이 부족한 형편이다. 공공문서와 연구보고서, 특허·데이터베이스, 그리고 창작자들이 생산해 온 음악·영상·웹툰 등은 모두 산업과 사회의 근간을 이루는 무형자산이다.
그러나 대한민국의 가계, 기업, 정부가 보유한 지식 자산의 실질적 주권과 보상 체계는 제대로 정비되지 못한 채 해외 플랫폼과 클라우드에 맥없이 동기화되어 있다. 결과적으로 외부의 무단 학습이나 데이터 징발이 현실화되면 정책 자문·산업 경쟁력·창작자의 생계가 한순간에 흔들릴 수 있다.
이 위협을 기회로 바꾸려면 정부와 국민, 창작자가 함께 설계하는 제도적 전환이 반드시 필요하다. 그 핵심 해법이 바로 ‘저작권을 리셋(Copyright Reset)’해서 표적 관리와 보상을 동시에 할 수 있는 토큰 발행과 이를 기초 자산으로 한 정부, 가계, 기업이 하나되는 국민 주도의 소버린 AI 펀드가 대안이 될 수 있다.
우선 산적한 문제부터 정리해 보자. 현재 대한민국 정부와 산하 기관들이 만들어낸 공공문서의 상당수는 저작권법상 공공재로 분류되어 등록과 자산화가 어렵다.
동시에 많은 핵심 문서와 창작물은 MS, 구글, 어도비(PDF 문서 서비스) 등 해외 플랫폼과 클라우드에 동기화되어 있다.
이 구조는 평시에는 전 세계인에게 편리함을 제공하지만, 비상시에 미국의 법률(클라우드 법안)에 따른 자료 제출 명령이나 대형 플랫폼의 정책 변화 앞에서 국가의 데이터 주권을 크게 훼손할 위험을 안고 있다. 또한 창작자들은 자신들의 저작물이 AI 학습에 이용될 때 정당한 보상을 받기 어렵고, 공동저작물의 경우 소수 권리자의 반대로 전체 이용이 차단되는 ‘holdout’ 즉, 데이터 소유주들의 3자 대항력이 없다는 심각한 저작권법 침해라는 구조적 문제를 태생부터 가지고 있다.
그렇다면 어떻게 위협을 자산으로 전환할 수 있을 것인가. 핵심은 세 가지이다.
첫째, 권리를 국가부터 권리를‘선(先)확립’하는 것, 둘째, 경제적 권리(받을 권리)를 분리·유동화하는 것, 셋째, 국가 신용과 민간의 지식재산권들이 결합해 안정적이고 투명한 보상·거버넌스 구조를 만드는 것이다. 이를 구현하는 수단이 정부 소유의 대부분의 문서들을 디지털화하는 과정의 전처리 기반의 편집저작물화와 로열티 분리·토큰화, 그리고 CoReset 토큰을 중심으로 한 소버린 AI 펀드 설계다.
구체적인 실행 로드맵은 다음과 같다.
정부 산하 연구기관과 공기업, 민간 전문가들이 협업해 공공문서를 전처리하는 과정에 해당 원문에 주석·용어사전·시맨틱 태깅·N-gram 요약을 더해 창작성 있는 편집저작물로 재가공하면, 저작권을 등록할 수 있는 법적 근거가 생긴다. 전처리 과정의 로그·버전·참여자 기록을 블록체인 등 불변 원장에 남기면 권리의 증거력이 확보되어 국제 소송이나 외교 대응에서 의미 있는 근거가 된다. 다음으로 편집저작물에서 발생할 장래 로열티를 ‘받을 권리’로 분리해 디지털 채권(토큰)으로 발행하면 소수 권리자의 반대로 전체 이용이 차단되는 ‘holdout’현상을 원천적으로 차단할 수 있다.
위 방식으로 IPRs를 토큰화하면 데이터 접근권·수익배분권·거버넌스권을 결합한 복합 자산으로 설계되어 창작자와 국민, 투자자가 모두 동시에 자유롭게 AI용 학습 데이터를 자유롭게 이용할 수 있는 상태가 된다.
받을 권리의 분리·토큰화가 왜 실무적으로 타당한지 다시 짚어 보면, 공동저작물이나 대규모 데이터풀은 한 명의 반대만으로 전체 사업이 멈출 수 있다. 그래서 권리와 로열티를 분리하여 권리지분을 나누는 것이 아니라 장래에 받을 로열티(민법, 받을 채권)만을 따로 분리해서 토큰화하는 방식이다.
창작자나 저작권자들에게 로열티를 선지급하거나 저작권이 리셋된 토큰으로 분배하면 반대 유인을 줄이고, 권리자는 즉시 현금을 확보해 창작·활동 자금으로 쓸 수 있다. 동시에 저작권자 입장에선 블록체인에 기록된 토큰 보유 내역은 제3자 대항력을 제공해 외국의 강제적 데이터 접근 요구에 대응할 때 손해액 산정과 보상 청구의 훌륭한 근거가 된다. 중요한 것은 소유권(특히 저작인격권)은 보전된다는 점이다. 경제적 권리만 분리해 유동화 함으로서 창작자의 창작 통제권과 명예는 지켜진다는 점이다.
이로 인해 예상되는 경제적 효과는 사회 각계 각층으로 다층적으로 일어나게 될 것이다. 우선 이번 정부가 그 동안 국민들의 세금으로 구축된 수 천조원의 공공의 무형자산들을 가치 평가를 통해 펀드의 담보 바스켓으로 편입하면 국민 상생 펀드의 신용이 강화되어 대규모 자금을 조달이 용이하게 될 수 있다.
동시에 이 토큰 재원은 나아가 국민연금 대체 자산, 국민상생펀드의 기초 자산으로 활용되어 공공의 재원을 확충하고 일반 창작자에게 돌아가는 보상으로 벨류체인이 구축되어 사회 전반에 순환 경제의 모멘텀을 제공하게 될 것이다.
또한 경제 주체들의 저작권을 리셋할 수 있는 범 국민 오디션 플랫폼에서 보상이 이뤄지는 집단지성들을 편입하게 될 경우 시장에서의 경쟁과 경합에 의해 K데이터 센터의 데이터 품질이 올라가고 고품질의 학습셋이 축적되어 국내 LLM 경쟁력이 빠르게 향상될 수 있다. 아울러 2차 저작물과 K-콘텐츠의 합법적 재생산은 로열티 수익을 창출해 펀드로 환수되고, 다시 창작자와 국민에게 배분되는 선순환 구조를 제공하게 될 것이다.
하지만 기술적·계약적 방어도 병행해야 한다. 디지털 데이터의 핵심 원본의 온쇼어 저장을 의무화하고 BYOK(Bring Your Own Key)를 도입해 키 관리를 국내에 두면 된다. 해외 클라우드 공급자와의 계약에는 해외 당국의 자료요구에 대해 사전 통지·심사·거부권을 포함시켜야 하며, 상업적 딥러닝을 위한 사전 라이선스 의무와 무단 이용에 대한 징벌적 손해배상 규정을 마련해야만 할 것이다. 이로써 토큰화된 가치와 블록체인 증빙은 국제적 분쟁과 외교 협상에서 한국의 주장에 실질적 무게를 더해 주는 효과를 가지게 된다.
한편 범 정부와 국민들의 저작권을 리셋하는 실행을 위한 로드맵은 명확하다.
첫 단계에서는 특정 부처·영역을 선정해 파일럿을 진행하고 법률·회계·기술적 검증을 마쳐야 한다. 두 번째 단계에서 디지털 자산을 구축하는 데이터 셋의 표준 전처리·편집저작물화 규범, 표준 DPA(데이터 처리계약), 온쇼어 저장 의무 등을 확립하고 민관이 하나되어 지식재산권을 모으는 카피라이트 리셋 오디션 플랫폼을 시범적으로 개시하며 그 운영을 확대하는 전략이다. 세 번째 단계에서는 이렇게 해서 선별되고 저장된 빅데이터들을 저작권 리셋(Copyright Reset)토큰화하고 동시에 이를 교환할 수 있는 코인을 발행하여 해당 코인만 보유해도 데이터센터의 모든 IPRs로부터 파생되는 로열티 수입을 펀드의 기초자산으로 편입해 공적 자금과 연계하고 국제 규제당국과 사회적 협의를 도출해서 전 국민들의 미래를 설계하면 한다.
맺음말
데이터 징발의 위협은 전 세계 정부와 가계 그리고 기업들이 직면해 있는 현실이다. 그러나 정부의 의지와 민관의 협력, 그리고 창의적 제도 설계로 우리는 이러한 절대적 위협을 창의적 기회로 바꿀 수 있다.
또한 공공문서를 ‘저작권화’하고, 국민 오디션형 플랫폼으로 집단 지성을 데이터 자산으로 연결하며, 전 국민들이 참여하는 카피라이트 리셋(CoReset) 운동으로 토큰을 발행하면 대한민국은 데이터 주권을 지키는 동시에 새로운 국부를 창출할 수 있다.
지금 필요한 것은 법 해석의 논쟁을 넘는 실행 의지와 국민적 결집이다. AI산업은 위기와 기회가 동시에 공존하는 동전의 양면이며 데이터 안보와 주권을 세우기 위해서는 민간에게만 맞길 문제가 아니며 제일 먼저 정부가 먼저 나서야만 한다. 민관이 하나되어 범 국민 ‘카피라이트 리셋’ 시대를 여는 것이 세계 최초로 이 대한민국이 진정한 의미의 소버린 AI의 교두보를 구축하는 가장 빠른 지름길과 해법이 될 수 있다.
상지대학교 사회공헌 얼라이언스 ICT, AI 특임 교수 카네어스㈜ 양홍선 회장
