CWN(CHANGE WITH NEWS) - 英 연구팀 "AI 생성 콘텐츠로 학습하는 AI, 정보 왜곡 문제 악화할 것"

  • 맑음금산1.3℃
  • 맑음여수5.8℃
  • 구름많음울릉도0.3℃
  • 구름조금고창군1.7℃
  • 구름많음보령-0.4℃
  • 맑음강릉-0.5℃
  • 맑음장수-1.0℃
  • 맑음경주시4.3℃
  • 맑음순창군1.8℃
  • 맑음밀양6.2℃
  • 맑음동두천-5.3℃
  • 맑음창원5.7℃
  • 구름조금양평-2.5℃
  • 맑음구미2.2℃
  • 맑음울산5.0℃
  • 맑음서청주-1.8℃
  • 맑음천안-1.8℃
  • 맑음진도군3.9℃
  • 맑음고흥5.0℃
  • 맑음울진1.6℃
  • 맑음남해5.9℃
  • 맑음안동-0.4℃
  • 구름조금광주3.0℃
  • 맑음영월-2.7℃
  • 구름조금서산-1.7℃
  • 맑음충주-2.5℃
  • 맑음북춘천-4.4℃
  • 맑음함양군2.8℃
  • 구름조금제주8.0℃
  • 맑음문경-1.7℃
  • 맑음원주-2.6℃
  • 구름많음흑산도4.2℃
  • 맑음부여0.4℃
  • 맑음고산7.8℃
  • 맑음북창원6.3℃
  • 구름조금정읍1.0℃
  • 맑음영천2.7℃
  • 맑음순천3.1℃
  • 맑음대전0.0℃
  • 맑음영주-2.4℃
  • 맑음청주-1.3℃
  • 맑음보성군4.9℃
  • 맑음임실0.4℃
  • 구름조금강화-4.4℃
  • 구름많음영광군1.8℃
  • 맑음청송군-0.5℃
  • 맑음북부산6.9℃
  • 구름많음백령도-3.5℃
  • 구름조금파주-4.9℃
  • 맑음양산시7.0℃
  • 맑음춘천-3.7℃
  • 구름많음목포2.6℃
  • 구름조금홍성-1.1℃
  • 맑음남원2.1℃
  • 맑음철원-5.9℃
  • 맑음정선군-3.8℃
  • 맑음해남4.1℃
  • 맑음진주5.6℃
  • 맑음세종-1.0℃
  • 맑음산청2.8℃
  • 맑음군산0.3℃
  • 맑음대관령-8.7℃
  • 맑음홍천-3.5℃
  • 맑음서귀포9.9℃
  • 맑음봉화-2.8℃
  • 맑음거제6.5℃
  • 맑음장흥4.7℃
  • 맑음서울-2.8℃
  • 구름조금성산7.6℃
  • 맑음동해0.4℃
  • 맑음대구4.1℃
  • 맑음부산6.9℃
  • 맑음속초-2.0℃
  • 구름조금이천-2.5℃
  • 맑음보은-1.3℃
  • 맑음상주-0.4℃
  • 맑음통영6.4℃
  • 맑음영덕1.9℃
  • 맑음추풍령-0.4℃
  • 맑음강진군4.5℃
  • 맑음수원-2.7℃
  • 맑음포항4.2℃
  • 맑음태백-6.3℃
  • 맑음의성1.1℃
  • 맑음거창2.9℃
  • 맑음인제-4.4℃
  • 맑음부안1.9℃
  • 맑음합천5.5℃
  • 구름조금고창1.3℃
  • 맑음완도5.6℃
  • 맑음의령군4.5℃
  • 맑음김해시6.2℃
  • 맑음북강릉-1.3℃
  • 맑음전주1.0℃
  • 맑음광양시5.5℃
  • 맑음인천-3.8℃
  • 맑음제천-3.2℃
  • 2026.01.13 (화)

英 연구팀 "AI 생성 콘텐츠로 학습하는 AI, 정보 왜곡 문제 악화할 것"

최은희 / 기사승인 : 2023-06-19 18:23:53
  • -
  • +
  • 인쇄

블록체인 전문 매체 디크립트가 인공지능(AI)이 생성한 콘텐츠로 학습하는 AI의 등장 가능성을 경고한 논문이 발표된 사실을 보도했다.

영국 임페리얼 칼리지 런던, 케임브리지대학교, 옥스퍼드대학교, 토론토대학교 소속 전문가로 구성된 합동 연구팀은 ‘재귀의 저주: 생성된 데이터를 이용한 훈련으로 모델을 잊는다(The Curse of Recursion: Training on Generated Data Makes Models Forget)’라는 제목의 연구 논문을 통해 “AI로 생성한 데이터가 가 차세대 모델의 학습 집합에 피해를 줄 때 이른바 ‘모델 붕괴’ 현상이 발생할 수 있다고 주장했다.

한 마디로 말하자면, AI로 생성한 콘텐츠가 온라인에 널리 확산된다면, AI 시스템으로 다시 흡수되어 정보 왜곡과 부정확한 정보 생성과 같은 문제가 더 심각해질 수 있다는 의미이다.

연구팀은 시간이 지나면서 AI 모델이 실제 기본 데이터 분포를 잊고, 원본 정보가 너무 왜곡되어 실제 데이터와 AI 훈련 데이터가 달라지기 때문에 현실을 부정확하게 표현하게 된다고 지적했다. 모델 붕괴는 대규모 언어 모델, 가우시안 혼합 모델(Gaussian Mixture Model)을 포함한 생성형 AI 모델에서 주로 발견될 수 있는 문제이다.

연구팀은 모델 붕괴 현상의 주된 원인으로 두 가지를 언급했다. 바로 데이터 샘플의 유한한수와 관련된 '통계적 근사 오차'와 AI 학습 중에 사용되는 오차 범위가 제대로 설정되지 않은 ‘기능적 근사 오차'이다. 두 가지 문제 모두 여러 세대에 걸쳐 누적되어 부정확성을 악화시키는 연쇄적인 효과를 일으킬 수 있다.

연구팀은 모델 붕괴 방지 방법으로 AI 모델 학습을 위한 '선점자 우위'를 제시했다. 인간이 생성한 원본 데이터 출처 접근성을 유지할 수 있다면, 해로운 분포 변화와 그에 따른 모델 붕괴를 방지할 수 있다고 보는 이론이다.

그러나 연구팀은 AI 생성 콘텐츠를 대규모로 구분하는 일은 어려운 일이며, 커뮤니티 전반에 걸친 협력이 필요하다고 덧붙여 전했다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue