CWN(CHANGE WITH NEWS) - 캔자스대학교 연구팀 "챗GPT가 작성한 논문 99% 잡아낼 수 있어"...AI 콘텐츠 탐지 소프트웨어 공개

  • 흐림대전2.0℃
  • 맑음제주9.7℃
  • 맑음경주시-2.2℃
  • 흐림통영4.5℃
  • 흐림백령도1.7℃
  • 흐림보성군1.2℃
  • 흐림진도군11.4℃
  • 흐림이천-0.3℃
  • 흐림영월-1.7℃
  • 흐림제천-0.9℃
  • 흐림보령10.5℃
  • 흐림광양시4.4℃
  • 흐림흑산도12.4℃
  • 구름많음울진2.5℃
  • 구름많음장수7.3℃
  • 구름많음전주7.8℃
  • 구름많음진주0.8℃
  • 흐림광주7.2℃
  • 흐림고흥3.0℃
  • 구름많음함양군-2.5℃
  • 구름많음거창-2.3℃
  • 흐림북부산3.8℃
  • 구름많음영덕0.3℃
  • 흐림청주1.7℃
  • 구름많음대구-0.6℃
  • 맑음영천-1.0℃
  • 구름많음의령군-0.9℃
  • 흐림목포7.1℃
  • 흐림충주0.3℃
  • 흐림금산1.3℃
  • 흐림세종1.5℃
  • 구름많음고창7.7℃
  • 흐림보은0.8℃
  • 흐림남원2.0℃
  • 흐림인제-2.7℃
  • 맑음의성-2.9℃
  • 흐림거제3.9℃
  • 흐림양평-0.2℃
  • 구름조금구미-1.5℃
  • 흐림속초1.9℃
  • 흐림부여1.5℃
  • 구름많음태백3.0℃
  • 흐림천안1.7℃
  • 흐림서청주0.8℃
  • 흐림홍성1.6℃
  • 흐림강진군3.1℃
  • 흐림군산6.1℃
  • 흐림문경1.5℃
  • 흐림부산6.8℃
  • 맑음성산14.0℃
  • 흐림동두천-1.4℃
  • 구름많음밀양1.2℃
  • 흐림원주-1.0℃
  • 흐림순천-0.2℃
  • 흐림서울0.8℃
  • 구름많음산청-1.7℃
  • 구름많음대관령-1.4℃
  • 구름많음영광군6.5℃
  • 구름많음순창군1.4℃
  • 구름조금서귀포14.8℃
  • 흐림완도5.3℃
  • 흐림파주-2.5℃
  • 흐림북춘천-3.0℃
  • 맑음고산14.6℃
  • 흐림철원-3.2℃
  • 구름많음동해3.6℃
  • 구름조금포항2.6℃
  • 흐림인천1.6℃
  • 흐림양산시5.2℃
  • 흐림여수5.3℃
  • 구름많음창원5.1℃
  • 흐림안동-0.3℃
  • 흐림영주-0.6℃
  • 구름많음정선군-2.9℃
  • 구름조금청송군-4.1℃
  • 흐림상주1.1℃
  • 구름많음임실3.6℃
  • 흐림울산3.6℃
  • 구름많음고창군9.5℃
  • 흐림남해3.4℃
  • 구름많음북강릉0.8℃
  • 흐림봉화-2.5℃
  • 구름많음북창원5.3℃
  • 흐림수원1.9℃
  • 흐림장흥1.8℃
  • 흐림울릉도4.8℃
  • 구름많음부안7.2℃
  • 구름많음정읍8.4℃
  • 흐림강화-0.9℃
  • 흐림해남10.3℃
  • 흐림서산3.1℃
  • 흐림김해시4.4℃
  • 흐림홍천-1.6℃
  • 흐림춘천-2.4℃
  • 구름많음합천-0.9℃
  • 구름많음강릉3.0℃
  • 구름조금추풍령-0.3℃
  • 2026.01.15 (목)

캔자스대학교 연구팀 "챗GPT가 작성한 논문 99% 잡아낼 수 있어"...AI 콘텐츠 탐지 소프트웨어 공개

고다솔 / 기사승인 : 2023-06-09 16:22:06
  • -
  • +
  • 인쇄

오픈AI의 인공지능(AI) 기반 챗봇 챗GPT가 인간이 작성한 듯한 자연스러운 대화와 스크립트, 시, 논문 등 다양한 글을 작성할 수 있는 능력을 선보이면서 생성형 AI 열풍을 불러일으켰다. 그러나 일각에서는 자연스럽고, 거짓이 진실인 것처럼 보이는 글을 작성한다는 점과 표절 논란 등 챗GPT의 텍스트 생성 능력에 우려의 목소리를 냈다.

이에, 테크익스플로어, 더레지스터 등 복수 외신은 챗GPT와 같은 AI 툴로 작성한 글을 찾아낼 소프트웨어가 공개된 사실을 보도했다.

히더 디자이어(Heather Desaire) 캔자스대학교 교수가 이끈 연구팀은 최근, 학술지 셀 리포트 피지컬 사이언스(Cell Reports Physical Science)에 게재한 논문을 통해 AI가 작성한 글과 인간이 작성한 글을 구분할 수 있는 소프트웨어를 소개했다.

연구팀은 과학자와 챗GPT가 작성한 논문을 분류하도록 알고리즘 훈련과 테스트를 진행할 데이터세트를 압축했다. 연구팀은 알고리즘 훈련을 위해 생물학 분야부터 물리학 분야까지 여러 주제를 다룬 논문 64편을 엄선하여 같은 주제를 다룬 가짜 논문 128편을 챗GPT로 생성했다. 연구팀은 AI로 총 1,276문단을 생성하고, 인간이 작성한 논문과 AI가 작성한 논문을 분류하도록 훈련했다.

이후 알고리즘을 테스트하기 위해 각각 30개의 실제 관점 논문과 챗GPT로 작성한 논문 60편, 총 1,210개의 단락이 포함된 두 개의 데이터 세트를 추가로 수집했다.

연구팀은 초기 실험 결과, 소프트웨어가 인간이 작성한 논문과 AI로 작성한 논문을 100% 정확하게 구분할 수 있다는 사실을 확인했다. 다만, 개별 단락 수준에서의 정확도는 92%로 줄어들었다.

연구팀은 소프트웨어가 인간과 AI가 작성한 글의 다양한 문체적 차이에 초점을 맞추어 분석한다는 점에서 AI 논문을 잡아내는 데 효과적이라고 판단했다. 일례로, 인간 과학자는 기계보다 더 풍부한 어휘력과 다양한 단어를 포함하는 긴 문단을 작성할 확률이 높다. 또, 인간은 따옴표에 사용되는 음성 부호를 제외하고 물음표, 괄호, 세미콜론과 같은 문장 부호를 더 많이 사용한다.

게다가 챗GPT로 작성한 연구 논문의 정확도가 비교적 더 낮고, 논문 작성 시 인용한 다른 논문의 저자나 과학자 이름을 구체적으로 제공하지 않는 것으로 드러났다.

한편, 영국 IT 전문 매체 더레지스터는 연구팀의 논문이 제시한 AI 논문 구분 정확도 결과를 더 신중하게 받아들여야 한다고 주장했다. 또, 연구팀이 연구 과정에서 생성한 AI 논문 대부분 챗GPT로 작성했다는 점도 지적했다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue