CWN(CHANGE WITH NEWS) - 기성 작품을 사용하는 빅테크 AI 학습

  • 흐림대전23.1℃
  • 흐림고산23.7℃
  • 구름많음북강릉21.5℃
  • 흐림서청주21.8℃
  • 구름많음강화20.0℃
  • 구름많음인천23.3℃
  • 구름많음북춘천18.9℃
  • 흐림이천21.0℃
  • 구름많음부안23.0℃
  • 흐림태백16.9℃
  • 흐림보성군24.1℃
  • 흐림순창군22.7℃
  • 흐림부여21.6℃
  • 흐림해남23.8℃
  • 흐림고흥23.4℃
  • 흐림정읍23.0℃
  • 흐림장흥24.0℃
  • 흐림영덕22.5℃
  • 흐림진주23.2℃
  • 구름많음안동21.2℃
  • 흐림창원23.8℃
  • 흐림고창군23.0℃
  • 구름조금속초22.0℃
  • 흐림영광군23.4℃
  • 흐림울진21.1℃
  • 구름많음춘천18.9℃
  • 구름많음추풍령20.3℃
  • 구름조금파주18.6℃
  • 흐림충주21.2℃
  • 흐림밀양23.6℃
  • 흐림흑산도23.0℃
  • 비여수24.1℃
  • 흐림합천23.3℃
  • 흐림진도군23.0℃
  • 구름조금백령도23.1℃
  • 구름많음성산24.5℃
  • 흐림제천18.8℃
  • 구름많음완도23.5℃
  • 구름많음서귀포25.0℃
  • 흐림산청22.5℃
  • 흐림북창원25.0℃
  • 흐림거창21.2℃
  • 흐림남해23.7℃
  • 흐림양평20.2℃
  • 흐림보은21.2℃
  • 흐림영주19.0℃
  • 구름많음수원20.7℃
  • 흐림고창23.0℃
  • 흐림남원22.4℃
  • 구름많음순천21.4℃
  • 흐림금산22.1℃
  • 구름많음홍천20.1℃
  • 흐림원주20.2℃
  • 구름많음구미22.2℃
  • 구름조금동두천19.3℃
  • 흐림함양군21.9℃
  • 흐림장수19.7℃
  • 흐림통영23.7℃
  • 흐림천안20.8℃
  • 흐림세종21.9℃
  • 흐림포항24.2℃
  • 흐림정선군18.9℃
  • 구름많음상주22.3℃
  • 흐림영월19.9℃
  • 흐림군산22.4℃
  • 흐림대구23.1℃
  • 구름많음동해21.1℃
  • 구름많음목포24.6℃
  • 흐림대관령18.2℃
  • 흐림김해시24.4℃
  • 흐림경주시22.3℃
  • 흐림보령21.9℃
  • 흐림양산시25.4℃
  • 안개홍성20.7℃
  • 흐림임실21.7℃
  • 구름많음인제18.7℃
  • 구름많음서울22.7℃
  • 구름많음서산20.2℃
  • 구름많음제주25.9℃
  • 흐림청주24.2℃
  • 맑음철원18.1℃
  • 구름많음청송군19.7℃
  • 흐림강진군24.0℃
  • 구름많음광주24.2℃
  • 구름많음전주23.2℃
  • 구름많음의성20.9℃
  • 구름많음강릉25.2℃
  • 흐림부산25.4℃
  • 흐림의령군22.7℃
  • 구름많음울릉도23.6℃
  • 흐림봉화17.9℃
  • 흐림문경20.7℃
  • 비북부산24.7℃
  • 흐림광양시24.3℃
  • 흐림영천21.5℃
  • 흐림거제23.3℃
  • 흐림울산23.5℃
  • 2025.09.15 (월)

기성 작품을 사용하는 빅테크 AI 학습

조하민 / 기사승인 : 2023-08-22 10:55:38
  • -
  • +
  • 인쇄
최근 출간된 책 포함한 AI가 이미 점령한 예술 세계

페이스북 모회사 메타가 개발하는 생성형 인공지능(AI)의 기반이 되는 대규모 언어모델(LLM) ‘라마(LLaMA)’ 학습에 쓰인 작품의 작가 중 일부다. 미국 시사매체 디애틀랜틱은 이 작가들의 작품이 무단 사용됐다고 19일(현지 시간) 보도했다. 앞서 미 일부 작가가 자신들의 책이 동의 없이 챗GPT 훈련에 사용됐다고 오픈AI를 상대로 소송을 냈는데 방대한 양의 저작권이 있는 자료가 무단 사용된 사실이 드러난 것이다.

디애틀랜틱이 라마 학습에 사용된 데이터세트 ‘북3(Books 3)’를 입수해 분석한 결과 최근 20년간 출간된 17만 권 넘는 책이 포함된 것으로 나타났다. 미 출판사 펭귄랜덤하우스 책 3만 권, 영국 출판사 하퍼콜린스와 맥밀런 책 각각 1만4000권과 7000권, 영국 옥스퍼드대 출판부 책 1800권 등이다. 3분의 1은 픽션이고, 3분의 2는 논픽션이었다. 디애틀랜틱은 “AI가 약속한 미래는 훔친 말들(stolen words)로 쓰여 있었다”고 지적했다.

북3는 오픈AI의 챗GPT 학습과 올 3월 블룸버그통신이 출시한 생성형 AI ‘블룸버그GPT’ 학습에도 쓰였다. AI 커뮤니티에서 인기를 끌던 북3는 올 6월 오픈AI에 대한 저작권 집단소송이 제기되면서 접근이 어려워졌다고 디애틀랜틱은 설명했다. 빅테크 기업들은 저작권 위반 소송 제기에 “생성형 AI는 훈련받은 책을 복제하는 것이 아니라 새 작품을 생산하는 것”이라며 맞서고 있다.

디애틀랜틱은 “완성작의 복제와 배포를 규제하겠다는 보장 없이 몇 년 동안 소설을 쓰거나 역사를 연구할 사람은 없을 것”이라며 “오늘날 대표 기술이 대량 절도에 의해 작동하고 있다는 것은 불편하지만 적절한 말이다”라고 꼬집었다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue