CWN(CHANGE WITH NEWS) - 메타의 영상 생성 AI 시스템, 아직 넘어야 할 산 있다

  • 맑음김해시3.5℃
  • 맑음제주6.8℃
  • 맑음봉화-4.8℃
  • 맑음보은-2.9℃
  • 맑음춘천-5.2℃
  • 맑음백령도-3.3℃
  • 맑음동해-1.4℃
  • 맑음북춘천-8.8℃
  • 맑음여수3.5℃
  • 맑음양산시3.6℃
  • 맑음추풍령-2.5℃
  • 맑음정읍-0.7℃
  • 맑음보령-2.6℃
  • 맑음임실-1.4℃
  • 구름조금울릉도-0.2℃
  • 맑음남해4.3℃
  • 맑음흑산도2.9℃
  • 맑음의성-1.0℃
  • 맑음동두천-7.4℃
  • 맑음충주-4.2℃
  • 맑음영천0.3℃
  • 맑음북창원4.6℃
  • 맑음순창군-0.4℃
  • 맑음천안-2.9℃
  • 맑음완도1.8℃
  • 맑음경주시1.1℃
  • 맑음북부산4.2℃
  • 맑음서귀포6.9℃
  • 맑음합천1.6℃
  • 맑음산청0.9℃
  • 맑음고흥2.2℃
  • 맑음거제4.7℃
  • 맑음서울-4.8℃
  • 맑음진주3.9℃
  • 맑음북강릉-2.4℃
  • 맑음대전-2.9℃
  • 맑음세종-2.7℃
  • 맑음고산7.0℃
  • 맑음이천-4.3℃
  • 맑음울진-1.5℃
  • 맑음파주-7.9℃
  • 맑음금산-1.2℃
  • 맑음서청주-3.4℃
  • 맑음보성군2.1℃
  • 맑음양평-4.2℃
  • 맑음해남1.4℃
  • 맑음영월-4.7℃
  • 맑음성산3.8℃
  • 맑음밀양3.4℃
  • 맑음홍천-5.2℃
  • 맑음남원-0.8℃
  • 맑음부산4.8℃
  • 맑음목포1.3℃
  • 맑음함양군0.1℃
  • 맑음제천-5.1℃
  • 맑음포항1.6℃
  • 맑음의령군0.4℃
  • 구름조금강화-6.1℃
  • 맑음대구1.8℃
  • 맑음고창군-0.5℃
  • 맑음고창-1.0℃
  • 맑음강진군1.8℃
  • 맑음서산-3.2℃
  • 맑음창원4.1℃
  • 맑음상주-1.9℃
  • 맑음원주-4.3℃
  • 맑음철원-7.7℃
  • 맑음인천-5.4℃
  • 맑음영주-4.0℃
  • 맑음광양시2.2℃
  • 맑음정선군-6.0℃
  • 맑음수원-4.2℃
  • 맑음울산2.4℃
  • 맑음순천0.3℃
  • 맑음안동-2.8℃
  • 맑음진도군2.3℃
  • 맑음청송군-2.8℃
  • 맑음장흥1.8℃
  • 맑음강릉-2.2℃
  • 맑음광주0.9℃
  • 맑음문경-3.4℃
  • 맑음영덕-0.4℃
  • 맑음구미0.0℃
  • 맑음군산-1.5℃
  • 맑음대관령-10.4℃
  • 맑음전주-1.0℃
  • 맑음거창-0.3℃
  • 맑음속초-3.4℃
  • 맑음태백-7.6℃
  • 맑음영광군0.2℃
  • 맑음통영4.0℃
  • 맑음장수-2.9℃
  • 맑음인제-5.9℃
  • 맑음부여-1.8℃
  • 맑음홍성-2.5℃
  • 구름조금부안-0.2℃
  • 맑음청주-2.6℃
  • 2026.01.13 (화)

메타의 영상 생성 AI 시스템, 아직 넘어야 할 산 있다

안하영 / 기사승인 : 2022-10-12 11:48:29
  • -
  • +
  • 인쇄
최근 메타(Meta, 구 페이스북)는 텍스트 명령어를 입력하면 짧은 영상을 생성하는 AI 시스템을 공개했다. [사진출처=메타]
최근 메타(Meta, 구 페이스북)는 텍스트 명령어를 입력하면 짧은 영상을 생성하는 AI 시스템을 공개했다. [사진출처=메타]

텍스트에서 이미지를 생성하는 인공지능(AI)을 뛰어넘어 영상을 생성하는 AI가 등장했다. 최근 메타(Meta, 구 페이스북)는 텍스트 명령어를 입력하면 짧은 영상을 생성하는 AI 시스템 ‘메이크 어 비디오(Make-A-Video)’를 공개했다.

‘메이크 어 비디오’는 ‘빨간 망토가 달린 슈퍼히어로 복장을 하고 하늘을 날고 있는 강아지’와 같은 텍스트를 입력하면, 5초짜리 짧은 클립을 생성한다. 영상은 텍스트를 꽤 충실하게 재현하지만, 화질이 선명하지 않아 옛날 홈비디오 같은 느낌을 준다.

메타는 메이크 어 비디오를 대중적으로 공개할 계획을 구체적으로 밝히지 않았다. 그러나 AI 연구소들의 자체적인 ‘영상 생성’ AI 개발도 속도를 높일 전망이다.

지난달 AI 연구소 오픈AI(OpenAI)는 텍스트 기반 이미지 생성을 지원하는 AI 시스템 DALL-E를 대중적으로 공개했다. 또, AI 스타트업 스태빌리티AI(Stability.AI)는 오픈소스 이미지 생성 시스템 ‘스테이블 디퓨전(Stable Diffusion)’을 출시했다.

이러한 AI 시스템은 기대가 큰 만큼 과제 또한 안고 있다. 우선 영상 생성 AI는 엄청난 컴퓨터 성능을 필요로 한다. 짧은 영상 하나를 제작하려 해도 이미지 수백 가지가 필요하다. 영상 생성 AI는 이미지 생성 AI 모델보다 훈련에 필요한 데이터 규모가 훨씬 더 크다.

영상 생성 AI 모델은 훈련 과정도 까다롭다. 텍스트와 짝지을 수 있는 고화질 영상으로 구성된 대규모 데이터 세트가 없기 때문이다. 이에, 메타는 세 종류의 오픈소스 이미지 및 영상 데이터 세트를 결합하여 훈련 과정을 거쳤다.

메타는 설명이 포함된 스틸 이미지로 구성된 텍스트-이미지 데이터 세트를 이용해, AI가 사물의 명칭과 생김새를 학습하게 했다. 이어 영상 데이터베이스를 바탕으로 사물들이 실제 세상에서 어떻게 움직여야 하는지 학습시켰다. 이 두 가지 접근 방식을 결합해, 메이크 어 비디오는 텍스트 입력을 기반으로 영상을 생성한다.

앨런 인공지능 연구소(Allen Institute for Artificial Intelligence)의 컴퓨터 비전 연구 과학자 탄마이 굽타(Tanmay Gupta)는 메타의 연구 결과가 유망하다며 기대감을 드러냈다. 굽타는 “메타가 공유한 영상은 AI 모델이 카메라 회전에 따라 삼차원 형태를 포착할 수 있음을 보여준다”며, “깊이 개념과 조명도 이해하는 듯하며, 일부 세부 사항과 움직임이 꽤 적절하고 설득력 있게 표현됐다”라고 말했다.

이어 그는 “하지만 영상 편집과 전문적인 콘텐츠 제작에 사용되려면 아직 개선해야 할 부분이 상당히 많다”며, “특히 아직 사물 간의 복잡한 상호작용을 모델링하는 것은 어려운 일”이라고 설명했다.

메타는 이번 기술이 창작자와 예술가들에게 새로운 기회를 열어줄 수 것이라고 말한다.

하지만 기술이 발전함에 따라 거짓 정보 및 ‘딥페이크(deepfake)’ 콘텐츠 생성 및 유포 수단으로 악용돼, 온라인에서 실제와 가짜 콘텐츠를 구별하는 것이 훨씬 더 어려워질 우려가 있다.

메이크 어 비디오 개발팀은 불쾌한 이미지와 단어를 필터링한다고 설명했으나 셀 수 없이 많은 단어와 이미지로 구성된 데이터 세트에서 편향과 유해한 콘텐츠를 완전히 제거하려면 갈 길이 멀다.

한편, 메타의 대변인은 이번 모델을 대중에게 아직 공개할 계획이 없으며 연구를 통해 잠재적인 위험성을 개선하고 완화핢 방법을 계속해서 모색할 것이라고 밝혔다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue