[양홍선교수칼럼 ] 연재 2편, 데이터 징발을 경계하라!
미국 국가비상사태, 전 세계로 번질 수 있는 최악의 시나리오
국내에서는 일부 AI 스타트업과 이를 지지하는 정치권 일각에서 저작권에서 자유로운 TDM(Text and Data Mining) 면책을 도입해야 한다는 주장이 나오고 있다. 그들은 면책으로 학습 데이터를 신속히 확보해야 외국과의 경쟁에서 뒤처지지 않는다고 말한다.
그러나 바로 이 시점에 정작 우리가 더 심각하게 주목해야 할 현실은 따로 있다. 바로 21세기 형 데이터 징발이 그것이다.
최근 미국 내부에서는 ‘MAGA(미국을 다시 위대하게)’ 구호를 앞세운 정치적 갈등이 격화되고 있으며, ‘안티파(Antifa, Anti-fascist Action)’를 미국의 테러조직으로 지정하는 조치까지 단행되며 사회 불안이 가중되고 있다.
이러한 미국내 극우·극좌 갈등 속에서 국제 정세 또한 갈수록 불안정해지고 있으며 대만해협과 한반도의 군사적 긴장, 중동 지역 분쟁에 더해 최근 베네수엘라 해역에서 발생한 선박 폭격 사건과 미국 핵잠수함의 긴급 파견 조치로 이어지는 베네수엘라의 계엄령 선포 등 아메리카 대륙 발 긴장 모드로 인해 미국의 국지적 충돌이 언제든 세계적 위기로 확산될 수 있다는 우려를 낳고 있다.
이 불안정한 국제 정세 속에서 지난 5월 미 트럼프 대통령이 AI 기업의 저작권 있는 콘텐츠를 학습 데이터로 사용하는 '공정 이용' 여부를 주장하던 펄머터 미국 저작권청 청장을 해임한 사건은 미국이 AI 패권을 위해 글로벌 저작권 질서를 의도적으로 무력화할 수 있음을 잘 드러내고 있다.
이 사건은 미국은 국제 지식재산권 협정을 다루는 WTO 체제(특히 TRIPS협정)에서의 탈퇴를 검토하며, 베른협약과 WIPO 체제를 근간으로 한 글로벌 저작권 보호 장치 자체를 흔들고 있는 상황으로 보아야 한다.
만약 미국의 대내외 급변 사태로 해외에서 활약하고 있는 미국 빅테크 기업들의 데이터 회수 명령 같은 클라우드 법안 같은 것이 발효가 된다면 대한민국은 물론 전 세계 경제 주체들의 정책 보고서, 산업 기술 문서, 금융 계약서, 의료 자료, 언론 기사, 개인 생활 기록까지 강제로 학습 데이터로 전환되고, 그 동안 미국계 AI 모델에 흡수된 이상 비가역적으로 남아 회수·배상이 불가능한 상태로 고착될 위험성이 현실화되고 있다는 뜻이다.
CLOUD Act를 주의하라!
설상가상으로 최근 미국은 일리노이 주에서 트럼프 행정부가 주방위군을 배치하고 연방 권한을 확대하려는 시도가 법적 분쟁으로 비화하는 등, 국가비상사태 권한 남용 가능성은 미국 내부에서 조차도 글로벌 정부, 가계, 기업들의 데이터 징발에 대한 위기감이 조성되고 있으며,
주방위군의 투입과 연방 차원의 시위 진압, 그리고 지난 18일 미국 전역에서 700백만 명이 운집한 노킹스(No Kings)시위대의 대규모 충돌과 함께 일각에서는 주지사들의 독자 비상 령 선포 가능성까지 거론되고 있음은 이미 미국이 내전의 문턱에 서 있음을 국제 사회에 보여주고 있다.
만약 이러한 혼란 도중 비상계엄령을 선언한 베네주엘라 측의 미사일 한 발이라도 미국 영토를 스쳐가게 되면, 대통령은 즉시 ‘국가비상사태(National Emergency)’를 선포할 법적 명분을 갖게 된다.
문제는 그 이후에 발생한다.
미국 전역으로 국가비상사태가 선포되면, 미국 대통령은 IEEPA(국제비상경제권한법)와 CLOUD Act, 그리고 국가안보서한(NSL)을 근거로, 아마존, MS, 어도비, 구글, 애플, 메타 등 미국계 클라우드 기업에 해외에서 취급하고 있는 데이터들에 대한 징발 명령을 내릴 수 있는데 이 명령은 단순히 미국 내 서버만이 아니라, 이들 기업의 글로벌 리전에 저장된 모든 데이터를 포함할 수 있다는 것이 세계 최대의 리스크로 작용된다는 점이다.
그 이유는 전 세계의 정부 문서, 기업 보고서, 계약서, 연구 논문, 의료 기록, 그리고 국민의 개인 문서와 생활 로그까지도 “미국 안보에 필요한 정보”라는 명분 아래 강제 제출될 수 있는 체계가 2018년 클라우드 법안(Could Act, 합법적 해외 데이터 활용의 명확화 법률)에 이미 준비되어 있기 때문이다.
미국 입장에서는 합법적으로 해외 데이터를 가져갈 수 있지만 당하는 국가들 입장에서는 데이터를 징발 당하는 것이어서 이 클라우드 법안이 효력을 갖게 되면 전 세계 정부, 가계, 기업들의 데이터들은 단순 로그가 아니라 정책 보고서, 산업 기술 문서, 금융 계약서, 의료 자료, 언론 기사, 개인의 생활 기록까지 포함될 수 있고 한 번 모델에 학습되면 비가역적으로 남게 된다.
비가역(非可逆)'의 뜻은 '되돌릴 수 없다'는 의미로, 어떤 상태나 과정이 진행된 후 다시 이전 상태로 돌아갈 수 없음을 뜻한다.
더하여 WTO의 실효성에 의문을 제기하며 국제 지식재산권 침해에 대한 협정을 포함하고 있는 WTO를 탈퇴하겠다는 트럼프 행정부의 리스크와 클라우드 법안이 병행이 된다면 WIPO·베른 체제 국가의 저작권·개인정보 보호 장치가 실효를 잃을 위험이 커지며 전 세계는 그야말로 아수라장이 되고 말 것이다.
이런 중차대한 시점에 누가 대한민국에서 헌법이 보장한 개인의 사유재산을 ‘TDM 면책’이라는 허울로 강탈하려 하는가?
대한민국 창작자들의 저작물은 헌법 제23조가 보장하는 재산권의 한 유형이다. 그럼에도 불구하고 이를 ‘AI 산업 육성’이라는 미명 아래 무단 희생시키겠다는 발상은 국민의 기본권을 정면으로 부정하는 것이다.
여기서 법적·헌법적 쟁점을 분명히 짚고 넘어가야 한다.
첫째, 헌법 제23조가 보장하는 재산권은 단순한 이익상의 권리가 아니다. 헌법은 재산권의 침해를 허용할 때 정당한 보상을 전제로 하는 ‘공용수용’의 절차를 요구한다. 그러나 TDM 면책은 사전 동의나 정당한 보상 없이 저작물의 경제적 이용권을 공공적·시장적 목적으로 사실상 전용하게 만든다.
말만 다를 뿐이지 창작자의 입장에서는 ‘강제 수용’이나 ‘징발’과 본질적으로 다를 바 없다.
둘째, 법률유보(입법권 보장)의 원칙 문제다. 개인의 재산권과 같이 본질적 권리의 제한은 국회의 입법을 통해 엄격히 규율 되어야 한다. 집행령·지침·가이드라인 수준에서 광범위한 면책을 허용한다면, 입법부의 권한을 우회하여 행정이 실질적 재산권 이전을 초래할 수 있다. 이는 권력분립의 원리에 반하며 법치주의의 후퇴를 초래하게 할 수 있다.
셋째, 비례의 원칙과 본질적 내용 침해 문제다. 헌법은 권리 제한이 불가피할 때에도 그 수단이 목적에 적합하고 필요한 범위에 한정되어야 한다. TDM 면책이 ‘산업 발전’이라는 추상적 목적을 이유로 저작권의 본질적 내용을 손질한다면, 제한의 목적·수단·효과를 종합적으로 따져도 비례성을 충족하기 어렵다. 특히 회복 불가능한 ‘지식의 내재화(irreversible learning)’를 초래하는 점은 결과적으로 창작자의 권리를 회복 불능 상태로 만든다.
넷째, 인격권·학문 및 표현의 자유와의 충돌 가능성이다. 저작권은 단지 경제적 권리에 그치지 않고 창작자의 명예·정체성, 나아가 학문·예술의 자유와 연결된다. 동의 없는 대규모 학습·재생산은 창작자의 창작권 및 학문적 성취의 통제권을 침해할 소지가 있다. 이는 헌법상 인간의 존엄과 가치(헌법 제10조), 학문·예술의 자유와도 충돌할 여지가 크다.
다섯째, 구제수단의 실효성 상실이다. 권리자가 침해를 당했을 때 법적 구제를 청구할 수 있어야 실효적 권리 보호가 가능하다. 그러나 이미 해외 데이터센터에 흡수되어 모델로 내부화된 지식은 소송으로도 실질적 회복이 거의 불가능하다는 점에서, 면책을 통한 사전적 권리 박탈은 사실상 구제 불가능한 피해를 만들어내게 된다.
마지막으로, 국제법적·외교적 위험도 고려해야 한다. 미·중 간 기술 패권 경쟁과 국가비상권 행사 가능성, 그리고 타국의 데이터 접근 명령(예: CLOUD Act 계열의 제도)은, 국내 저작권 체계를 약화시키는 정책이 단순히 국내 문제를 넘어 국가 안보·외교적 부담을 가중시킨다는 점을 시사한다.
이러한 헌법적·안보적 위험을 방지하려면 입법적·제도적 대응이 필요하다. 특히 주목해야 할 것은 상업적 딥러닝에 대한 엄격한 사전허가 의무화와 징벌적 손해배상 규정 도입이다.
유럽연합 등에서 논의되는 원칙을 참고하면, 상업적 목적의 대규모 학습은 저작권자의 사전 동의(라이선스)를 필수 요건으로 삼고, 무단 이용이 적발될 경우 실효성 있는 징벌적 배상을 통해 침해 비용을 크게 높이는 방식이 권리 보호에 효과적일 수 있다.
이런 제도는 두 가지 차원에서 소버린 주권을 강화한다.
첫째, 국내 저작권자에 대한 실효적 권리 보호를 통해 해외 플랫폼이 ‘무임승차’하지 못하도록 제도적 장벽을 세우는 것이다.
둘째, 사전허가·징벌적 배상 규정은 해외에서 자국법을 근거로 데이터 징발을 시도할 때 국제적 협상·법적 대응에서 강력한 근거로 작용한다.
다시 말해, 단지 국내에서 규제를 완화하는 것이 아니라, 오히려 권리의 국제적 보호를 강화하는 입법으로 무장할 때만이 미국의 클라우드 법안과 같은 외국의 강제적 데이터 접근 요구에 대해 실질적인 저항력을 갖출 수 있다.
따라서 입법과 정책의 우선순위는 다음과 같아야 한다.
첫째, 상업적 딥러닝을 포함한 대규모 데이터 이용에 대해서는 저작권자의 사전 동의(라이선스) 없이는 금지하고, 예외를 인정할 때에는 명확한 보상 메커니즘을 법으로 규정할 것.
둘째, 무단 이용에 대해서는 실효성 있는 징벌적 손해배상과 신속한 집행 절차를 마련하여 침해 비용을 높일 것.
셋째, 핵심 공공데이터에 대해서는 온쇼어(국내) 저장 의무 및 접근 통제 장치를 강화하고, 해외 저장·이용 시에는 사전 협의·허가를 필수화할 것.
넷째, 국제무대에서의 대응력을 높이기 위해 관련 국가들과의 상호법적 보호 조치 및 다자 협약 체결을 적극 추진할 것.
결국 TDM 면책은 단순한 규제 완화가 아니다.
절차적 정당성, 보상 원칙, 권력분립과 법률유보, 비례성·본질적 내용 보호, 표현·학문의 자유, 실효적 구제 가능성 등 헌법적 가치들에 대한 총체적 침해 가능성을 내포하고 있다. 이 모든 점을 간과한 채 속도와 편의만으로 정책을 밀어붙인다면, 대한민국의 지식 주권은 스스로 포기 당하는 역사적 과오로 기록될 것이다.
지금 필요한 것은 무책임한 면책이 아니라, 권리자 보호를 전제로 한 신중하고 강력한 법·제도 마련이다. 이 선택은 단순히 기술적 규제를 완화하는 문제가 아니라, 대한민국의 지식 주권을 스스로 포기하는 역사적 과오가 될 것이다.
역사를 돌아보면, 1905년 일제에 의해 강제로 체결된 을사늑약이 떠오른다.
당시 이른바 을사오적이라 불린 소수의 권력자들은 조국의 근대화라는 미명 하에 나라의 주권을 일본에 팔아 넘겼고 결국 한일합방으로 이어졌다.
지금 논의되는 TDM 면책 역시 다르지 않다.
외형은 “산업 발전”을 명분으로 내세우지만, 실제로는 한국의 지식 자산과 창작물이 딥러닝을 하기도 전에 그 동안 무차별적으로 우리의 주권에 대해 딥러닝을 마친 외국 AI 기업들의 기름통에 데이터 연료로 전락하는 면책의 길을 먼저 열어주는 행위일 뿐이다.
이는 선열들의 희생으로 되찾은 이 나라를 이번에는 디지털 식민지로 다시 내주는 꼴이며 더욱 심각한 점은, 한 번 해외 AI 모델에 학습된 데이터는 결코 되돌릴 수 없다는 점이다.
아무리 창작자들이 법적 소송을 건다 해도 이미 모델에 내재된 지식은 삭제할 수도, 보상받을 수도 없다. 정부 보고서, 산업 기술 문서, 학계 논문, 개인의 창작물과 생활 기록까지 모두 “학습 데이터”라는 이름으로 흡수되고, 대한민국은 외산 API와 구독 서비스에 의존하는 21세기형 데이터 식민지로 전락하게 될 것이다.
지금이야 말로 냉철한 선택이 필요하다. 자칫 잘못된 단 한 번의 입법이 과거 을사늑약처럼 후대에 씻을 수 없는 치욕으로 기록될 수도 있다.
TDM 면책은 산업 발전의 지름길이 아니라 데이터 주권을 스스로 포기하는 길이다. 대한민국이 AI 3대 강국을 향해 나아가려면, 무엇보다 저작권을 강화하고 대한민국 정부, 가계, 기업의 데이터 주권을 지키는 일이 최우선이다.
상지대학교 사회공헌 얼라이언스 ICT, AI 특임 교수 카네어스㈜ 양홍선 회장