거대 정보기술 기업들의 인공지능 언어 서비스가 확대되는 가운데 유명 작가들의 작품 속 내용이 무단으로 도용되는 문제가 심각하게 제기되고 있다. 사진은 호주 최고 인기 작가 중 한 명인 플레러 맥도널드(Fleur McDonald)씨. 그녀는 본인 작품 내용이 무단 도용된 것에 대해 분노를 느낀다고 말했다. 사진은 배우이자 사진작가인 댄 패리스(Dan Paris)씨가 ABC 방송에 제공한 것을 발췌한 것임.
미 실리콘 기반의 AI 데이터베이스 사, 전 세계 작가 수천 권의 내용 ‘훔쳐내’
맥도널드 작가 “절반의 저서 속 내용, AI 언어 소프트웨어 개발에 도난당했다”
유명 소프트웨어 회사들의 인공지능(Artificial intelligence) 기반 서비스가 확대하는 가운데 전 세계 유명 작가들의 작품 내용이 무단으로 도용되는 문제가 심각하게 제기되고 있다.
이는 호주 작가들도 예외는 아니다. 최근 호주에서 가장 많은 독자를 확보한 작가 중 하나인 플레러 맥도널드(Fleur McDonald)씨가 자신의 저작권을 되찾기 위해 실리콘 밸리에 기반을 둔 거대 인공지능 기업들과 맞서는, ‘다윗과 골리앗(David and Goliath)의 싸움’에 직면했음을 토로했다.
서부호주, 에스퍼런스(Esperance, Western Australia)에 거주하는 맥도널드 작가는 현재까지 21권의 작품을 출간했으며, 이 모든 소설이 호주에서 75만 부 이상 판매된, 최고 인기 반열의 소설가이다.
최근 그녀는 자신의 소설 중 절반 넘는 작품의 특정 내용이 동의 없이 AI 교육 프로그램에 업로드 되었다는 사실을 알게 된 후 자신의 창작이 한순간 수포로 돌아간 느낌을 받았다고 말했다. 그 사실(작품 내용의 무단 도용) 자체가 충격이었지만 그녀는 그 ‘도용’의 규모를 깨닫자 곧 분노로 바뀌었다.
맥도널드 작가는 “도용 상황을 파악하고자 필터링을 하는 데만도 엄청난 시간이 소요됐다”고 털어놓았다.
현재까지 드러난 문제(작가들의 작품 내용 무단 도용)의 데이터베이스인 ‘Books3’에는 18만 개 이상의 문헌이 포함되어 있으며, 이 내용들이 작가의 허가 없이 AI 언어 소프트웨어 개발에 사용된 것으로 추정된다.
맥도널드 작가는 본인이 집필해 출간한 21권의 작품 중 12개 작품에서 상당 부분의 내용이 도용되었지만 전체 카탈로그가 활용됐을 가능성도 높다고 말했다. 이어 “이런 일을 행하는 꽤 많은 사이트가 있다”는 그녀는 “아직 명확하게 파악하지 못했기에 어떤 책의 내용이 도난당했는지 알리지 않고 있다”고 덧붙였다.
맥도널드 작가에 따르면 그녀가 내놓은 21권의 작품 가운데 12권의 작품 속 내용이 AI 기업에 의해 무단으로 사용됐다. 사진 : ABC 방송
또한 그녀는 AI의 도용이 너무도 널리 퍼져 있어 이달 말 출간 예정인 22번째 작품의 초기 사본 내용 역시 AI 기업들에 의해 수집되었을 가능성도 있다면서 “이 인공지능은 너무 빠르게 진화하는 야수와 같아서 앞으로 어떤 일이 일어날지 모르겠다”고 호소했다.
인공지능 언어 기술,
새로운 윤리 영역으로 ‘부각’
플레러 맥도널드씨 외에도 팀 윈튼(Tim Winton), 마일스 프랭클린(Miles Franklin), 제인 하퍼(Jane Harper)씨를 포함한 수십 명의 호주 저명 작가들도 실리콘밸리 기반의 AI 기업 및 인공지능 언어를 다루는 사람들의 윤리의식에 의문을 제기했다.
왕립 멜번공과대학(Royal Melbourne Institute of Technology) 정보과학부의 리사 기븐(Lisa Given) 교수는 AI의 급속한 발전으로 업계에서 오랫동안 간과되었던 윤리적 결함이 드러나고 있다고 말했다.
기븐 교수는 “나는 이 문제를 제기한 창작자들이 마키아벨리안(Machiavellian. 술수에 능한 이를 상징)이거나 의도적으로 AI 산업에 해를 끼치려는 게 아님을 알고 있다”며 “보다 폭넓게 접근해보면 사회적 이익을 염두에 두지 않고 이런 시스템을 사용하는 이들이 있음을 알게 될 것”이라고 지적했다.
이어 기븐 교수는 작가들이 자신의 작품 내용을 무단으로 사용하는 거대 기술기업과의 힘겨운 싸움에 직면하게 됐다고 말했다. “그들(기술 기업들)이 ‘병 밖으로 나온 요정’(genies out of the bottle)이라 말한 것처럼 이미 (AI 언어가) 널리 사용되고 상황에서, 그리고 사람들이 이를 기반으로 창의력을 발휘하기 시작하면 그 싸움(지적재산권)은 매우 어렵다”는 것이다.
호주의 저작권법(copyright laws)이 미국과 같은 다른 국가에서는 시행 불가능하기 때문에 지적재산권 보호를 받는 저작물을 광범위하게 공동 선택하는 것은 복잡하다.
왕립 멜번공과대학(RMIT) 정보과학부의 리사 기븐(Lisa Given. 사진) 교수. 그녀는 AI의 급속한 발전으로 업계에서 오랫동안 간과되었던 윤리적 결함이 드러나고 있다고 지적했다. 사진 : RMIT
‘Books3’ 제작자 숀 프레서(Shaun Presser)씨는 보스턴(Boston) 기반의 매거진 ‘The Atlantic’과의 인터뷰에서 “OpenAI와 같은 거대 기술기업과 경쟁하기 위한 훈련 리소스로 데이터 세트를 개발했다”고 밝힌 바 있다.
ChatGTP를 선보인 OpenAI는 Books1과 Books2라는 두 개의 미스테리한 데이터 세트를 사용해 AI 시스템을 훈련한 것으로 추정된다.
“미국에서의 관련 소송,
선례가 될 것”
호주 출판협회(Australian Publishers Association)의 정책 및 대정부 관계 책임자인 스튜어트 글로버(Stuart Glover) 박사는 “이 같은 분쟁의 국제적 특성은 배상을 요구하는 이들이 이용할 수 있는 통로가 거의 없다는 것을 의미한다”며 안타까움을 드러냈다.
이 부분에 대해 글로버 박사는 “호주의 출판사들이 호주 내에서 출간한 도서들, 그리고 호주에서 호주판으로 출간한 국제 저작 도서들이 직면한 상황에 법적 조치를 취하는 방법은 일종의 관할권 문제”라고 설명했다.
그는 미국 작가들이 미국 내에서 AI 및 정보기술 회사들을 상대로 제기하는 소송이 (작가에 대한) 어떤 보호조치가 가능한지의 한계를 시험하게 될 것이며, 이(보호조치)는 자국 내 작가들에게 적용될 수 있을 것으로 보았다.
그러면서 “(미국 내에서의) 소송 결과는 다음 단계가 무엇인지, 가령 업계(출판계)와 작가가 호주에서 무엇을 할 수 있는지, 정부가 어떤 조치를 취하는 게 적절한지를 결정하는 데 도움이 되리라 본다”고 덧붙였다.
김지환 기자 herald@koreanherald.com.au
- |
- Copyright 1.jpg (File Size:84.7KB/Download:29)
- Copyright 2.jpg (File Size:56.4KB/Download:29)
- Copyright 3.jpg (File Size:38.2KB/Download:29)