CWN(CHANGE WITH NEWS) - 인공지능, 논문 작성하에 도움 될까?

  • 맑음밀양4.9℃
  • 맑음포항4.4℃
  • 맑음안동0.1℃
  • 맑음남해3.9℃
  • 맑음부산7.7℃
  • 맑음창원6.4℃
  • 구름많음보령3.8℃
  • 맑음북강릉5.4℃
  • 맑음수원0.1℃
  • 구름많음부여2.1℃
  • 맑음광양시6.4℃
  • 구름조금속초1.8℃
  • 구름조금순창군4.1℃
  • 구름많음영광군4.3℃
  • 맑음여수4.4℃
  • 흐림홍천-3.8℃
  • 흐림철원-5.2℃
  • 맑음경주시4.9℃
  • 맑음통영7.9℃
  • 맑음울진6.1℃
  • 맑음김해시6.0℃
  • 맑음정선군-1.8℃
  • 맑음거창4.4℃
  • 구름조금서귀포14.0℃
  • 구름조금군산2.6℃
  • 맑음문경0.7℃
  • 맑음보은0.3℃
  • 맑음거제5.4℃
  • 맑음울릉도4.0℃
  • 흐림고창4.8℃
  • 구름많음전주5.5℃
  • 맑음고산13.1℃
  • 맑음강진군7.9℃
  • 구름조금원주-2.3℃
  • 맑음대관령-3.6℃
  • 맑음고흥7.4℃
  • 맑음진도군7.7℃
  • 맑음제천-3.3℃
  • 맑음양평-3.3℃
  • 맑음양산시6.9℃
  • 맑음남원3.6℃
  • 맑음영천3.4℃
  • 구름많음광주4.7℃
  • 맑음장수5.7℃
  • 맑음이천-2.2℃
  • 맑음북창원6.0℃
  • 구름많음인제-3.1℃
  • 구름조금정읍5.0℃
  • 맑음태백0.3℃
  • 흐림동두천-4.0℃
  • 맑음순천7.6℃
  • 구름많음홍성2.1℃
  • 구름많음파주-3.6℃
  • 맑음충주-1.8℃
  • 맑음상주2.1℃
  • 맑음부안3.6℃
  • 맑음성산12.7℃
  • 맑음흑산도7.8℃
  • 맑음영월-1.8℃
  • 맑음세종1.7℃
  • 맑음완도6.4℃
  • 흐림춘천-3.9℃
  • 맑음서청주-0.2℃
  • 맑음영주-1.8℃
  • 맑음강릉4.4℃
  • 맑음합천4.7℃
  • 맑음영덕3.5℃
  • 맑음울산5.4℃
  • 맑음보성군5.7℃
  • 맑음인천0.4℃
  • 맑음추풍령2.7℃
  • 맑음함양군5.8℃
  • 맑음해남9.0℃
  • 맑음장흥7.4℃
  • 맑음목포6.4℃
  • 흐림백령도-0.6℃
  • 맑음천안-0.2℃
  • 맑음청송군1.0℃
  • 맑음임실4.4℃
  • 맑음청주1.2℃
  • 맑음대구3.6℃
  • 맑음서산2.2℃
  • 맑음서울-1.1℃
  • 맑음금산3.4℃
  • 맑음의성2.2℃
  • 흐림북춘천-5.1℃
  • 구름많음고창군5.2℃
  • 맑음봉화-1.9℃
  • 맑음진주5.0℃
  • 맑음구미3.5℃
  • 맑음대전2.2℃
  • 맑음산청5.4℃
  • 맑음의령군4.2℃
  • 맑음강화-2.8℃
  • 맑음동해6.3℃
  • 맑음제주11.4℃
  • 맑음북부산6.9℃
  • 2026.01.14 (수)

인공지능, 논문 작성하에 도움 될까?

안하영 / 기사승인 : 2022-11-04 18:06:02
  • -
  • +
  • 인쇄
인공지능에 기반한 LLM(대형 언어 모델)이 논문을 작성하는 보조자로까지 발전했다. [사진출처=삼성전자]
인공지능에 기반한 LLM(대형 언어 모델)이 논문을 작성하는 보조자로까지 발전했다. [사진출처=삼성전자]

인공지능에 기반한 대규모 언어 모델이 논문을 작성하는 보조자 역할까지 가능한 수준으로 발전했다고 네이처가 보도했다. 대규모 언어 모델은 언어를 생성하기 위해 방대한 텍스트 본문에 대해 훈련된 신경망이다.

현재 인공지능에 기반한 대규모 언어 모델은 연구원들이 과학 논문을 분석, 작성하고 코드를 생성하며 아이디어를 브레인스토밍하는 데 도움이 될 정도로 발전했다.

오픈AI(OpenAI)는 2020년에 가장 잘 알려진 대규모 언어 모델인 GPT-3을 만들었다. 네트워크를 훈련해 이전 내용을 기반으로 다음 텍스트를 예측할 수 있는 프로그램이다. 오픈AI 프로그래밍 인터페이스를 통해 프롬프트를 기반으로 텍스트를 생성하는데 사용할 수 있다.

레이캬비크에 있는 아이슬란드 대학의 컴퓨터 과학자 하프스타인 에이나르손은 “거의 매일 GPT-3를 사용한다. GPT-3를 사용해 논문의 초록에 대한 피드백을 생성한다”고 말했다. 뉴욕 브루클린에 있는 기술 스타트업인 에스사이트의 컴퓨터 과학자 도메닉 로사티도 대규모 언어 모델을 사용해 생각을 정리하고 있다.

오픈AI 연구원들은 책, 뉴스, 위키피디아 항목과 소프트웨어 코드를 포함한 방대한 텍스트를 대상으로 GPT-3을 훈련시켰다. 이후 연구팀은 GPT-3가 다른 텍스트와 마찬가지로 코드 조각을 완성할 수 있음을 알아냈다. 연구원들은 코덱스(Codex)라는 알고리즘의 미세 조정 버전을 만들어 코드 공유 플랫폼 깃허브의 150GB가 넘는 텍스트에서 훈련시켰다.

AI2의 세만틱 스콜러(Semantic Scholar) 검색 엔진은 TLDR이라는 언어 모델을 사용해 논문에 대한 트윗 길이를 설명하고 있다. TLDR은 소셜 미디어 플랫폼 페이스북의 연구원들이 사람이 작성한 요약을 미세 조정한 BART라는 초기 모델에서 파생됐다.

TLDR은 과학 논문을 보강하는 애플리케이션인 AI2의 세만틱 리더(Semantic Reader)에서도 활용한다. 사용자가 세만틱 리더에서 텍스트 내 인용을 클릭하면 TLDR 요약을 포함하는 정보가 있는 상자가 나타난다.

엘리키트는 캘리포니아 샌프란시스코에 있는 기계 학습 비영리 조직인 오트에서 출시한 프로그램이다. 엘리키트에게 “마음 챙김이 의사결정에 미치는 영향은 무엇인가?”라고 물어보면 10개의 종이로 된 표가 출력된다. 사용자는 연구 참가자, 방법론, 결과에 대한 정보는 물론 추상 요약과 메타데이터와 같은 콘텐츠로 열을 채우도록 소프트웨어에 요청할 수 있다.

인간-컴퓨터 상호 작용을 연구하는 칼리지 파크의 메릴랜드 대학의 조엘 찬은 프로젝트를 시작할 때마다 엘리키트를 사용하고 있다. 스톡홀름 카롤린스카 연구소의 신경과학자 구스타브 닐슨은 엘리키트를 사용해 통합 분석에 추가할 수 있는 데이터가 포함된 논문을 찾고 있다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue