CWN(CHANGE WITH NEWS) - 텍스트만으로 원하는 그림 얻는다?…카카오브레인, ′AI 이미지 생성모델′ 깃허브에 공개

  • 맑음홍천25.5℃
  • 구름조금수원26.0℃
  • 맑음백령도23.0℃
  • 구름조금이천26.5℃
  • 맑음동두천25.0℃
  • 맑음부안26.6℃
  • 구름조금강진군26.9℃
  • 구름조금합천26.8℃
  • 구름조금원주26.4℃
  • 구름많음북창원26.4℃
  • 구름조금군산26.3℃
  • 구름많음함양군25.3℃
  • 구름많음구미25.4℃
  • 구름많음보령26.0℃
  • 맑음상주26.3℃
  • 구름조금문경24.6℃
  • 맑음완도29.2℃
  • 구름많음흑산도24.8℃
  • 구름많음장수25.4℃
  • 구름조금남해26.5℃
  • 구름조금대구24.8℃
  • 구름많음순천26.2℃
  • 구름조금인제23.8℃
  • 흐림태백16.7℃
  • 맑음북춘천25.2℃
  • 흐림성산25.2℃
  • 구름많음세종24.3℃
  • 구름조금장흥26.1℃
  • 구름많음고창군26.7℃
  • 맑음강화25.3℃
  • 구름조금순창군27.8℃
  • 맑음남원26.8℃
  • 흐림청송군23.6℃
  • 구름조금진도군24.6℃
  • 구름조금강릉23.0℃
  • 구름조금영덕22.6℃
  • 맑음진주25.9℃
  • 구름조금철원25.0℃
  • 구름조금서청주25.7℃
  • 맑음파주25.6℃
  • 맑음광양시26.9℃
  • 구름많음의성25.0℃
  • 흐림영주24.1℃
  • 맑음울릉도21.4℃
  • 맑음양평25.0℃
  • 맑음속초21.7℃
  • 맑음충주26.3℃
  • 맑음춘천25.7℃
  • 구름많음추풍령23.8℃
  • 구름조금정선군24.3℃
  • 맑음제천24.2℃
  • 구름많음제주26.6℃
  • 구름많음밀양25.2℃
  • 구름조금천안25.0℃
  • 구름많음대관령15.9℃
  • 구름많음울산22.3℃
  • 구름조금창원25.3℃
  • 구름조금홍성26.0℃
  • 구름많음양산시25.8℃
  • 구름조금대전27.0℃
  • 구름많음보은23.1℃
  • 맑음보성군29.3℃
  • 구름많음포항23.4℃
  • 구름조금해남27.5℃
  • 구름많음부산25.9℃
  • 구름많음금산26.1℃
  • 구름많음봉화20.8℃
  • 구름많음영광군26.2℃
  • 흐림경주시23.4℃
  • 구름많음울진23.4℃
  • 구름조금광주27.5℃
  • 구름많음고창26.0℃
  • 구름많음안동24.4℃
  • 구름많음산청24.5℃
  • 구름많음김해시25.8℃
  • 구름조금통영26.9℃
  • 구름많음거제24.8℃
  • 구름조금북부산25.1℃
  • 구름조금목포25.9℃
  • 구름많음임실25.1℃
  • 구름조금영월24.8℃
  • 구름많음전주26.8℃
  • 구름조금청주26.7℃
  • 구름많음영천24.0℃
  • 구름조금정읍26.7℃
  • 구름많음부여24.6℃
  • 맑음서울26.9℃
  • 구름조금서산25.8℃
  • 맑음고흥27.8℃
  • 구름많음거창24.3℃
  • 구름많음고산26.1℃
  • 맑음여수25.5℃
  • 구름조금인천25.2℃
  • 구름조금의령군25.7℃
  • 구름조금북강릉21.8℃
  • 구름많음동해21.2℃
  • 구름많음서귀포27.7℃
  • 2025.09.21 (일)

텍스트만으로 원하는 그림 얻는다?…카카오브레인, 'AI 이미지 생성모델' 깃허브에 공개

온라인뉴스팀 / 기사승인 : 2022-04-19 13:29:35
  • -
  • +
  • 인쇄
카카오브레인이 공개한 이미지 생성 AI모델 'RQ-Transformer'에 '사막에 있는 에펠탑'을 입력하자 생성된 샘플 이미지(카카오브레인 제공)© 뉴스1

카카오브레인이 초거대 멀티모달 인공지능(AI) '민달리(minDALL-E)'의 업그레이드 버전 'RQ-Transformer'를 깃허브에 공개했다.

19일 카카오브레인에 따르면, 이번에 공개된 RQ-Transformer는 39억개의 매개변수로 구성돼 있으며 3000만쌍의 '텍스트-이미지' 데이터셋을 학습한 text-to-image AI모델이다. 처음 보는 텍스트의 조합을 이해하고 이에 대응하는 이미지를 만들어낼 수 있다.

이를테면 '사막에 있는 에펠탑'이란 텍스트 입력 시 그 뜻을 헤아려 관련 그림을 다수 생성한다.

RQ-Transformer는 기존에 공개한 이미지 생성모델 민달리와 비교해 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘어났다.

특히 민달리가 미국의 인공지능 개발 기업 오픈AI가 공개한 'DALL-E'를 재현하는 것에 가까웠다면 RQ-Transformer는 카카오브레인 만의 독자적인 기술로 개발됐다는 점에서 의미가 더욱 크다.

카카오브레인은 이번 AI모델의 기술성을 인정받아 오는 6월 세계적인 학술대회 'CVPR 2022'에 해당 논문을 발표할 예정이다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue