CWN(CHANGE WITH NEWS) - 텍스트만으로 원하는 그림 얻는다?…카카오브레인, ′AI 이미지 생성모델′ 깃허브에 공개

  • 맑음합천27.2℃
  • 구름많음청송군23.6℃
  • 구름많음홍성26.9℃
  • 구름많음강릉23.9℃
  • 맑음양산시27.2℃
  • 구름많음추풍령24.1℃
  • 구름조금보성군27.5℃
  • 구름많음인천26.5℃
  • 구름많음영주23.9℃
  • 구름많음양평24.7℃
  • 구름조금금산27.0℃
  • 흐림창원27.6℃
  • 구름조금영광군27.8℃
  • 구름조금세종25.9℃
  • 구름많음서산25.9℃
  • 흐림정선군24.3℃
  • 맑음고산29.7℃
  • 흐림봉화23.4℃
  • 구름조금부안27.4℃
  • 맑음장흥27.1℃
  • 구름조금진도군26.2℃
  • 흐림강화25.0℃
  • 흐림파주24.7℃
  • 구름조금춘천26.2℃
  • 구름조금보은24.1℃
  • 구름조금보령29.0℃
  • 맑음순천26.0℃
  • 구름많음북창원27.9℃
  • 구름조금완도29.6℃
  • 흐림동두천24.8℃
  • 구름조금울산24.4℃
  • 흐림울진24.0℃
  • 구름조금경주시25.1℃
  • 맑음남해26.7℃
  • 구름많음제천23.7℃
  • 맑음산청26.3℃
  • 맑음해남27.7℃
  • 구름조금영덕23.3℃
  • 구름조금임실26.5℃
  • 구름조금거창25.8℃
  • 구름조금천안26.0℃
  • 구름조금북부산27.8℃
  • 흐림원주25.9℃
  • 구름많음이천25.8℃
  • 구름조금함양군26.6℃
  • 구름많음문경25.1℃
  • 구름조금북춘천26.7℃
  • 맑음광주28.2℃
  • 맑음의령군26.6℃
  • 흐림동해21.9℃
  • 구름조금광양시26.8℃
  • 흐림영월24.8℃
  • 구름조금남원27.2℃
  • 구름조금대전26.7℃
  • 흐림백령도22.5℃
  • 구름많음울릉도22.0℃
  • 구름많음철원26.3℃
  • 구름조금속초23.1℃
  • 구름많음고창28.5℃
  • 구름조금의성26.2℃
  • 구름많음충주26.7℃
  • 구름조금구미27.1℃
  • 구름많음홍천26.5℃
  • 구름많음거제26.7℃
  • 구름조금부여27.5℃
  • 구름조금서청주26.1℃
  • 구름조금부산27.5℃
  • 맑음대구25.5℃
  • 비제주26.2℃
  • 구름많음군산26.9℃
  • 맑음장수25.1℃
  • 구름조금통영27.7℃
  • 맑음인제24.8℃
  • 구름많음서울26.2℃
  • 구름많음북강릉23.0℃
  • 구름조금청주27.7℃
  • 구름조금전주28.8℃
  • 맑음밀양28.1℃
  • 구름조금포항24.2℃
  • 구름많음상주26.6℃
  • 구름조금순창군27.7℃
  • 맑음강진군28.0℃
  • 흐림대관령17.1℃
  • 구름조금영천24.7℃
  • 맑음목포28.4℃
  • 구름조금고흥28.3℃
  • 맑음정읍28.9℃
  • 맑음여수25.4℃
  • 흐림성산25.7℃
  • 구름조금고창군27.7℃
  • 구름많음서귀포28.0℃
  • 구름많음수원24.8℃
  • 구름조금김해시26.5℃
  • 흐림태백18.7℃
  • 맑음진주26.2℃
  • 구름많음안동25.6℃
  • 맑음흑산도27.7℃
  • 2025.09.23 (화)

텍스트만으로 원하는 그림 얻는다?…카카오브레인, 'AI 이미지 생성모델' 깃허브에 공개

온라인뉴스팀 / 기사승인 : 2022-04-19 13:29:35
  • -
  • +
  • 인쇄
카카오브레인이 공개한 이미지 생성 AI모델 'RQ-Transformer'에 '사막에 있는 에펠탑'을 입력하자 생성된 샘플 이미지(카카오브레인 제공)© 뉴스1

카카오브레인이 초거대 멀티모달 인공지능(AI) '민달리(minDALL-E)'의 업그레이드 버전 'RQ-Transformer'를 깃허브에 공개했다.

19일 카카오브레인에 따르면, 이번에 공개된 RQ-Transformer는 39억개의 매개변수로 구성돼 있으며 3000만쌍의 '텍스트-이미지' 데이터셋을 학습한 text-to-image AI모델이다. 처음 보는 텍스트의 조합을 이해하고 이에 대응하는 이미지를 만들어낼 수 있다.

이를테면 '사막에 있는 에펠탑'이란 텍스트 입력 시 그 뜻을 헤아려 관련 그림을 다수 생성한다.

RQ-Transformer는 기존에 공개한 이미지 생성모델 민달리와 비교해 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘어났다.

특히 민달리가 미국의 인공지능 개발 기업 오픈AI가 공개한 'DALL-E'를 재현하는 것에 가까웠다면 RQ-Transformer는 카카오브레인 만의 독자적인 기술로 개발됐다는 점에서 의미가 더욱 크다.

카카오브레인은 이번 AI모델의 기술성을 인정받아 오는 6월 세계적인 학술대회 'CVPR 2022'에 해당 논문을 발표할 예정이다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue