[IP Law] AI 저작권 보호

-학습 데이터 저작권을 중심으로

AI 시대가 본격적으로 도래하면서 지식재산권 관련 법, 특히 저작권이 세계 법조계에서 화제의 중심에 섰다. 미국에서 AI와 관련한 소가 다수 제기되고 있는 와중에 워싱턴DC 연방지방법원은 2023. 8. 18. 인간의 개입 없이 AI를 이용해서만 제작한 예술 작품의 저작권 보호를 부인하는 판결을 내렸다. 해당 사건에서 원고인 스티븐 탈러는 크리에이티비티 머신이라는 AI로 제작한 저작물의 창작자를 AI로, 업무상저작물 법리에 따라 본인을 저작권자로 지정하여 미국 저작권청에 등록 신청을 하였으나, 사람의 개입이 없다는 이유로 거절당했다. 이에 불복하여 소를 제기했으나 결국 기각된 것이다.

AI의 저작권법 관련 쟁점은 위와 같이 AI가 생성한 산출물의 저작권 보호 가능성의 측면도 있지만, 현재 더욱 관심의 대상이 되고 있는 측면은 AI 개발 훈련 과정과 산출물의 제3자의 저작권 침해 여부에 대한 판단에 관한 것이다. AI의 성능에는 학습된 데이터의 양이 결정적인 역할을 하는바 충분한 양의 학습용 데이터 확보가 관건인데, 방대한 양의 학습용 데이터에 대하여 일일이 사전 이용 허락을 받는 것이 현실적으로 어려운 경우가 많아 AI 개발 및 산출 과정에 저작권 침해의 위험이 상시 내포되어 있다.

2022년 하반기부터 생성형 AI 서비스가 대중에 보편화되면서 미국에서는 화가, 소설가 등 창작자들은 물론 이미지 플랫폼 업체, 프로그래머 등 권리자 측에서 AI 개발사를 상대로 저작권 침해소송을 다수 제기하고 있다.

AI 개발사 상대 소송 다수

Github 이용자들은 2022. 11.경 GitHub, MS, 오픈AI 등을 상대로 생성형 AI인 Codex를 이용해 만들어진 코딩 지원 프로그램인 Copilot의 산출물에 출처, 저작권 표시 등이 삭제되었다는 이유로 오픈소스 라이선싱 정책 위반, 디지털 밀레니엄 저작권법 위반 등을 주장하며 소를 제기하였다[Doe 1 et al. v. GitHub, Inc. et al. (N.D. Cal.)].

2023. 1.에는 3명의 화가들이 이미지 생성형 AI 모델인 스테이블 디퓨전의 학습용 데이터로 자신들의 미술 저작물이 무단으로 사용되었다고 주장하며 3개의 AI 이미지 생성툴 제공 회사(스태빌리티 AI, 미드저니, 디비언트 아트)를 상대로 집단소송을 제기하였다[Anderson et al. v. Stability AI Ltd. et al. (N.D. Cal.)]. 원고들은 자신들의 미술 저작물이 허락 없이 웹 스크래핑 등을 통하여 복제되고 압축본으로 저장되어 AI 학습용 이미지로 사용되었다고 주장하였다. 또한 이를 통해 스테이블 디퓨전이 만들어낸 산출물은 이러한 학습용 이미지에 기반한 것으로, 특정한 이미지의 2차적 저작물에 해당하며, 따라서 스테이블 디퓨전은 복잡한 콜라주 도구에 불과하다고 주장하였다. 이와 같은 AI의 작업을 통해 특정 화가 스타일의 이미지가 산출되는데, 해당 산출물은 원 저작물과 시장에서 경쟁하게 되고, 이미 인터넷에서 그러한 산출물이 판매되어 피고들이 수익을 얻고 있으므로 원고들의 손해는 실재한다고 주장하였다.

구체적으로 원고들은, 피고가 저작물 이미지를 다운로드 및 저장 복제하고, AI 학습에 사용함으로써 저작권을 침해하였고, 산출물은 원저작물의 대체물로서 시장에서 경쟁하고 있다며 저작권 직접 침해를 주장하였다(Direct Copyright Infringement). 또한 피고들이, 사용자가 AI 생성툴을 이용하여 생성한 이미지(가품)를 판매하는 등 어떤 식으로 사용될지 알거나 부주의하게 묵인하였다(knowingly or in reckless disregard)고 하여 피고들의 저작권 침해의 대위 책임(Vicarious Copyright Infringement)이 있다고 주장하였으며, 저작물 제목, 창작자 및 저작권자 정보 등을 포함한 저작권관리정보(CMI)를 무단으로 제거하여 디지털 밀레니엄 저작권법을 위반하였다고 주장하였다.

피고들의 항변

이에 대하여 피고 스태빌리티 AI는 다음과 같이 항변하였다. 먼저 스테이블 디퓨전은 이미지를 저장하지 않아 복제에 해당하지 않고, 완전히 새로운 이미지를 생성하는 것이지 단순히 기존 저작물을 조합하는 콜라주 도구가 아니라고 하였다. 스태빌리티 AI는 저작권을 침해하는 것이 아니라 창조를 하고 있다는 것이다. 또 원고 Andersen의 작품은 16개만 미국 저작권청에 등록되었고 나머지 2명의 원고들의 작품은 소 제기 전 등록되지도 않았다고 하였다.

나아가 피고는, 원고들은 저작권 침해라고 주장하는 산출물을 특정하지 아니하였고, 소장에 따르면 스테이블 디퓨전의 산출물은 학습용 데이터에 포함된 어떠한 특정한 이미지와도 밀접하게 매치되지 않는다고 하므로 이는 실질적 유사성이 없음을 자인하는 것이며, 따라서 2차적 저작물 침해 등의 직접 침해가 없음을 주장하였다.

저작권 침해의 대위 책임과 관련하여서는, 책임 성립의 전제로서 직접 침해에 해당하는 특정한 행위를 주장하지 못하였다는 점, 디지털 밀레니엄 저작권법과 관련해서는 원고들이 CMI가 변형되거나 제거된 원본 사례를 제시하지 못하였을 뿐만 아니라, 원고의 실제 작품 또는 동일한 사본으로부터의 CMI 제거 또는 변형이 아니라고 주장하였다.

나머지 피고인 미드저니와 디비언트 아트 역시 불특정, 실질적 유사성 등과 관련해 위와 유사한 취지로 주장하였고, 스테이블 디퓨전을 학습시킨 것은 스태빌리티 AI이므로 나머지 피고들과는 무관하다고 주장하였다.

게티이미지도 소 제기

이후 위 화가들이 제기한 소송과 유사한 소송들이 제기되었는데, 2023. 2.경 이미지 플랫폼인 게티이미지는 스태빌리티 AI가 약 1,200만개의 이미지를 복제하거나 2차적저작물을 작성하고, 원본 이미지의 워터마크를 제거, 훼손하여 CMI를 제거, 훼손하였다는 이유로 저작권 침해소송을 제기하였고[Getty Images (US), Inc. v. Stability AI, Ltd. et al. (D. Del.)], 피고는 관할권 등을 이유로 소 각하 또는 이송 신청을 한 상태이다.

최근에는 소설가 폴 트램블레이와 모나 아와드가 2023. 6. 28. 오픈AI를 상대로, 사라 실버맨을 비롯한 3명의 작가들이 2023. 7. 7.경 메타 및 오픈 AI를 상대로, 작가들이 저작권을 보유하고 있는 책을 무단으로 사용하여 저작권을 침해하였다는 유사한 내용의 집단소송을 제기하였다[Tremblay et al. v. OpenAI, Inc. et al. (N.D. Cal.), Kadrey et al. v. Meta Platforms, Inc. (N.D. Cal.), Silverman et al. v. OpenAI, Inc. et al. (N.D. Cal)]. 2023. 7. 11.경에는 개인 저작권자들이 알파벳, 구글, 딥마인드를 상대로 유사한 내용의 집단소송을 제기하였다[L. et al. v. Alphabet Inc. et al(N.D. Cal)].

관건은 저작권법상 공정이용 여부

저작권법으로 보호 받는 저작물을 사전 이용 허락 없이 AI 학습용 데이터로 사용하는 경우 저작권 침해의 책임을 면하기 위해 검토할 수 있는 가장 대표적인 저작권 조항은 공정이용 규정일 것이다(저작권법 제35조의 5 등).

미국은 저작권자의 허락 없이 종이책을 디지털 복제하여 검색 가능한 데이터베이스로 구축한 사안들에서 변형적 이용을 인정하여 공정이용을 긍정하는 입장을 보여 왔다[Authors Guild, Inc. v. Haithitrust, 755 F.3d 87 (2d Cir. 2014) 및 Authors Guild v. Google, Inc., 804 F.3d 202 (2d Cir. 2015)].

그런데 최근 미국 연방대법원은 공정이용을 다소 좁게 보아 부정하는 판결을 내렸다[Andy Warhol Foundation for the Visual Arts, Inc. v. Goldsmith, 598 U.S.…(2023)]. 이 사안은 앤디워홀 재단이 라이선싱한 '오렌지 프린스' 작품이 사진작가 골드 스미스의 저작권을 침해하는지 여부가 다투어진 저작권 비침해 확인소송으로, 제1심 판결은 2019년 앤디워홀 재단 측의 공정이용을 인정하였고, 항소심 판결은 2021년 공정이용을 부정하였으며, 미국 연방대법원은 2023. 5. 18. 공정이용을 부정하여 저작권 침해를 인정했다.

미국 연방대법원은 공정이용의 요건 중 앤디워홀 재단이 다투고 있는 '이용의 목적 및 성격'에 관하여만 판단하였는데, 이러한 이용의 목적 및 성격 판단에 있어 중요한 것은 원저작물과 비교하였을 때 새로운 다른 목적이나 성격이 부가되는지 여부이고, 그 정도가 상업성과 같은 다른 고려 요소들과 비교하였을 때 더 커야 할 것이라고 판시했다. 또 대부분의 2차적저작물이 원저작물을 재구성 또는 변형한다는 점을 볼 때 새로운 표현, 의미, 메시지가 있다고 하여 무조건 공정이용이 인정되는 것은 아니며, 변형적 이용에서의 변형은 그 정도가 2차적저작물로 성립될 수 있는 것 이상을 요구한다고 판시했다. 결론적으로 원저작물과 동일하거나 매우 유사한 목적이면서 상업적 목적까지 있다면 공정이용에 대한 부정적인 판단을 받을 가능성이 높다고 판시하면서, 앤디워홀 재단의 복제는 원 작품과 실질적으로 같은 목적을 가지고 있고 상업적인 성격을 가진다고 보아 공정이용을 부정하였다.

위 판결은 이와 같이 공정이용을 이전 판결보다 엄격하게 해석하였는바, 이러한 연방대법원의 입장은 학습용 데이터의 복제, 2차적저작물 작성 등이 문제되는 생성형 AI에서의 학습용 데이터의 사용이 변형적 이용으로 공정이용에 해당하는지 여부에 관한 쟁점에도 영향을 미칠 것으로 보인다.

日, 유럽, 英은 면책 규정 입법화

미국이 공정이용으로 해결을 꾀하고 있다면 일본, 유럽, 영국에서는 TDM(Text and Data Mining) 면책 규정을 입법화하였다. 가깝게는 일본의 경우 저작물의 표현된 사상 또는 감정을 향수하지 않고 저작권자의 이익을 부당하게 침해하지 않는 이용인 경우에는 영리 · 비영리 목적과 관계없이 데이터 마이닝 목적의 이용이 가능하다(일본 저작권법 제30조의4).

우리나라와 미국엔 아직 TDM 면책 규정이 도입되지 않았다. 우리나라도 현재 관련하여 저작권법 개정안 3개 안이 발의되어 위원회 심사 단계에 있는데, 모두 '컴퓨터를 이용한 자동화 분석 기술을 통하여 대량의 정보를 분석하여 추가적인 정보 또는 가치를 생성하기 위한 것으로 저작물에 표현된 사상이나 감정을 향유하지 않고 저작물에 적법하게 접근할 수 있는 경우에는 필요한 한도 안에서 저작물을 복제 · 전송할 수 있다'는 내용을 골자로 하고 있다(도종환 의원 등 발의 의안번호 제2107440호, 이용호 의원 등 발의 의안번호 제2117990호, 황보승희 의원 등 발의 의안번호 제22537호).

이와 같이 해외에서는 저작권 제한의 법리 및 TDM 면책 규정의 입법 등을 통해 새로운 AI 시대에 걸맞은 입법, 사법적 변화를 꾀하고 있는바, 우리나라에서도 역시 AI라는 시대적 흐름에 부합하기 위해 지속적인 고민을 해 나갈 필요가 있다. 생성형 AI의 저작권 침해와 관련하여 아직 우리나라에서 선례가 나오지 않았지만, 미국을 포함하여 실무적으로 연이어 소가 제기되고 판결이 내려지고 있어 관련 소송의 경과 및 개정법, 그리고 AI의 저작물 활용 기술에 대하여 정부 및 법조계에서 지속적인 관심을 갖고 살펴볼 필요가 있겠다.

김형지 · 김효정 변호사(김앤장 법률사무소, hyungji.kim@kimchang.com)

리걸타임즈다른기사 보기