CWN(CHANGE WITH NEWS) - 美 소프트웨어 기업, 오픈소스 대규모 언어 모델 ′돌리 2.0′ 공개

  • 구름조금원주23.0℃
  • 구름많음제주25.3℃
  • 구름많음거제24.2℃
  • 구름많음강진군25.3℃
  • 구름많음여수22.9℃
  • 구름많음의령군23.2℃
  • 구름많음순창군23.3℃
  • 맑음보령24.9℃
  • 구름많음대구23.6℃
  • 구름많음양산시25.0℃
  • 흐림함양군23.8℃
  • 구름조금서산23.5℃
  • 맑음서울23.4℃
  • 구름많음서귀포28.1℃
  • 구름조금보은22.4℃
  • 흐림태백16.7℃
  • 구름많음세종21.7℃
  • 구름많음진도군23.7℃
  • 구름많음부안23.9℃
  • 구름조금제천21.9℃
  • 구름조금천안23.5℃
  • 구름많음상주23.1℃
  • 구름조금인천23.2℃
  • 구름많음봉화21.5℃
  • 구름많음장흥25.7℃
  • 구름많음광양시24.8℃
  • 구름많음영월22.9℃
  • 구름조금청송군23.0℃
  • 구름조금속초21.6℃
  • 구름많음밀양24.7℃
  • 구름많음강릉21.4℃
  • 구름많음해남24.8℃
  • 구름조금이천22.9℃
  • 맑음울릉도21.4℃
  • 구름많음남원23.0℃
  • 구름많음정선군20.9℃
  • 구름많음북창원24.5℃
  • 구름많음군산22.8℃
  • 구름조금인제21.7℃
  • 구름많음순천24.1℃
  • 구름조금울진23.8℃
  • 구름조금전주24.4℃
  • 구름조금홍천22.4℃
  • 흐림울산21.8℃
  • 맑음철원22.2℃
  • 구름조금홍성23.1℃
  • 구름많음부산25.1℃
  • 맑음백령도21.9℃
  • 구름많음합천24.2℃
  • 구름많음목포23.2℃
  • 구름조금안동23.6℃
  • 구름조금영덕22.8℃
  • 구름많음청주23.4℃
  • 구름조금양평23.0℃
  • 구름많음북부산24.5℃
  • 흐림동해18.3℃
  • 구름많음고창23.7℃
  • 구름많음성산25.2℃
  • 흐림경주시23.3℃
  • 구름많음영천23.2℃
  • 구름많음구미24.1℃
  • 구름많음장수21.9℃
  • 맑음파주22.3℃
  • 맑음강화22.3℃
  • 구름많음고산25.0℃
  • 흐림부여22.6℃
  • 구름조금고창군23.2℃
  • 구름많음광주23.8℃
  • 구름많음창원23.9℃
  • 맑음의성24.2℃
  • 구름많음북강릉20.7℃
  • 구름많음진주22.1℃
  • 구름많음영광군23.5℃
  • 구름많음서청주22.1℃
  • 구름많음통영24.3℃
  • 구름많음흑산도24.5℃
  • 구름많음김해시25.4℃
  • 구름많음대전23.2℃
  • 흐림산청22.4℃
  • 구름많음금산22.9℃
  • 구름많음남해22.8℃
  • 구름많음고흥25.1℃
  • 구름조금임실23.0℃
  • 흐림대관령15.0℃
  • 구름조금충주23.7℃
  • 구름조금영주21.7℃
  • 구름많음포항22.9℃
  • 구름조금수원23.4℃
  • 구름많음보성군25.3℃
  • 구름조금동두천23.1℃
  • 구름많음북춘천22.5℃
  • 구름많음거창22.2℃
  • 구름조금정읍22.5℃
  • 구름조금문경23.6℃
  • 구름조금춘천22.6℃
  • 구름많음완도26.1℃
  • 구름많음추풍령21.4℃
  • 2025.09.21 (일)

美 소프트웨어 기업, 오픈소스 대규모 언어 모델 '돌리 2.0' 공개

고다솔 / 기사승인 : 2023-05-12 12:05:22
  • -
  • +
  • 인쇄

미국 엔터프라이스 소프트웨어 개발사 데이터브릭스(Databricks)가 오픈AI(OpenAI)의 경쟁을 선언했다.

벤처비트, 인포월드 등 복수 외신은 데이터브릭스가 챗GPT처럼 인간과 상호작용이 가능한 대규모 언어 모델인 ‘돌리 2.0(Dolly 2.0)’을 배포했다고 보도했다.

돌리 2.0은 데이터브릭스가 최초로 공개하는 오픈소스 지시 복종형 대규모 언어 모델이다. 투명성과 자유로운 접근성을 갖춘 데이터세트 ‘데이터브릭스-돌리-15k(databricks-dolly-15k)’를 개선하여 개발되었다. 데이터세트는 데이터브릭스 직원 수천 명이 생성한 1만 5,000여 가지 말뭉치 기록으로 구성됐다.

데이터브릭스는 돌리 2.0이 상업적 목적으로도 사용할 수 있도록 오픈소스로 공개돼, 누구나 무료로 API 사용이 가능하며, 외부 기관과 데이터를 공유하지 않아도 된다고 전했다.

데이터브릭스 CEO 알리 고드시(Ali Ghodsi)는 “상업용으로 사용할 수 있는 대규모 언어 모델이 이미 여럿 존재하지만, 모두 돌리 2.0과 같은 대화 능력을 갖추지 않았다. 오픈소스라는 특성 덕분에 사용자는 돌리 2.0의 훈련 데이터를 수정하거나 개선할 수도 있다. 또, 사용자가 직접 자신만의 돌리 버전을 제작할 수도 있다”라고 말했다.

고드시는 개방형 모델 상당수가 상업적 사용을 제한한다는 약관을 준수하는 데이터세트를 바탕으로 훈련된 점에 주목했다. 이에, 데이터브릭스는 자사 직원이 생성한 소규모 오픈 소스 명령어 말뭉치만 변경하고, 돌리 2.0을 오픈소스 Eleuther AI 파이티아 모델 제품군을 기반으로 하는 120억 개의 매개변수 언어 모델로 개발했다.

데이터브릭스는 공식 블로그를 통해 “돌리 2.0은 최첨단 언어 모델은 아니지만, "훈련 말뭉치의 규모를 고려할 때 사용자의 명령 처리 능력이 놀라울 정도로 훌륭하다”라며, “돌리 2.0 개발 비용은 기존 언어 모델 개발에 필요한 비용보다 훨씬 적다”라고 강조했다.

한편, 고드시는 돌리 2.0 배포 후 사용 범위가 확장되면서 AI 커뮤니티의 많은 구성원이 돌리 2.0 개발 및 개선 작업에 참여하는 등 더 우수한 대규모 언어 모델 개발을 위한 대안을 제시할 것으로 기대한다고 전했다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue