CWN(CHANGE WITH NEWS) - 제로샷 러닝, 데이터 없이도 AI가 학습하도록 한다?

  • 맑음상주-9.4℃
  • 맑음세종-10.2℃
  • 흐림진도군-2.2℃
  • 맑음보은-10.7℃
  • 맑음밀양-6.9℃
  • 맑음충주-12.1℃
  • 맑음파주-16.4℃
  • 맑음금산-9.2℃
  • 맑음통영-5.4℃
  • 눈서귀포0.9℃
  • 맑음의성-8.7℃
  • 맑음청주-10.7℃
  • 구름많음홍성-9.5℃
  • 맑음의령군-11.6℃
  • 흐림고창군-7.6℃
  • 맑음순천-8.1℃
  • 흐림고창-7.5℃
  • 맑음김해시-6.8℃
  • 맑음수원-12.1℃
  • 흐림대관령-17.6℃
  • 맑음남해-5.6℃
  • 맑음진주-6.6℃
  • 맑음제천-12.8℃
  • 맑음함양군-7.5℃
  • 맑음여수-5.9℃
  • 흐림철원-16.1℃
  • 구름조금대전-10.1℃
  • 눈울릉도-4.1℃
  • 맑음영월-12.3℃
  • 흐림흑산도-0.6℃
  • 흐림정선군-13.0℃
  • 맑음영천-8.1℃
  • 흐림백령도-8.2℃
  • 맑음영덕-7.9℃
  • 흐림이천-12.3℃
  • 맑음춘천-14.7℃
  • 맑음울산-6.8℃
  • 흐림영광군-7.5℃
  • 맑음영주-11.1℃
  • 맑음부여-7.9℃
  • 흐림해남-4.2℃
  • 맑음산청-7.7℃
  • 눈제주1.0℃
  • 맑음천안-11.4℃
  • 흐림고산0.9℃
  • 흐림홍천-12.5℃
  • 맑음창원-5.9℃
  • 눈목포-3.5℃
  • 맑음속초-8.5℃
  • 맑음울진-7.9℃
  • 맑음군산-8.1℃
  • 맑음고흥-6.1℃
  • 흐림완도-3.5℃
  • 맑음북창원-6.1℃
  • 맑음강화-12.1℃
  • 맑음광주-7.0℃
  • 맑음구미-8.3℃
  • 맑음동해-7.0℃
  • 맑음거창-9.5℃
  • 맑음서청주-12.3℃
  • 맑음서울-12.0℃
  • 맑음북부산-6.0℃
  • 흐림서산-7.8℃
  • 맑음인천-11.6℃
  • 맑음봉화-12.0℃
  • 맑음대구-7.3℃
  • 맑음거제-4.9℃
  • 흐림인제-13.9℃
  • 맑음안동-10.2℃
  • 맑음북강릉-9.8℃
  • 맑음합천-6.6℃
  • 맑음순창군-7.4℃
  • 흐림장흥-5.3℃
  • 맑음문경-11.0℃
  • 구름많음보성군-5.4℃
  • 맑음포항-6.9℃
  • 맑음추풍령-10.2℃
  • 흐림강진군-4.8℃
  • 맑음경주시-7.8℃
  • 흐림동두천-14.4℃
  • 흐림장수-10.5℃
  • 구름많음보령-7.5℃
  • 맑음남원-8.8℃
  • 맑음양평-11.5℃
  • 맑음양산시-4.9℃
  • 흐림태백-13.0℃
  • 맑음광양시-6.2℃
  • 흐림원주-12.9℃
  • 맑음임실-8.9℃
  • 맑음강릉-8.8℃
  • 흐림성산-0.3℃
  • 맑음북춘천-15.9℃
  • 맑음전주-8.3℃
  • 흐림정읍-7.9℃
  • 맑음부산-5.9℃
  • 맑음청송군-10.6℃
  • 흐림부안-6.8℃
  • 2026.01.22 (목)

제로샷 러닝, 데이터 없이도 AI가 학습하도록 한다?

최지홍 / 기사승인 : 2021-02-01 21:37:11
  • -
  • +
  • 인쇄

Pixabay

딥러닝은 많은 데이터를 분류해서 같은 집합들끼리 묶고 상하의 관계를 파악하는 기술이다. 데이터양이 많을수록 딥러닝의 정확도가 높아진다.

그러나 하나의 개념을 학습시킬 때마다 매번 많은 양의 데이터가 있어야 한다는 것은 큰 걸림돌이 될 수 있다. 양질의 데이터가 많은 경우에는 괜찮지만, 항상 학습하고자 하는 개념에 대한 데이터가 충분히 많으리라는 보장은 없기 때문이다. 소량의 데이터만으로 학습할 수는 없는 것일까?

이에 대한 해답이 바로 ‘퓨샷 러닝(few-shot learning)’이다. 퓨샷 러닝은 말 그대로 적은(few) 양의 데이터를 가지고 학습하는 것을 의미한다. 퓨샷 러닝 모델이 완전히 새롭게 주어진 데이터에서도 잘 작동하도록 만들기 위해서는 에피소딕 훈련(episodic training) 방식의 메타러닝(Meta learning, 사람이 통제하던 기계학습 과정을 자동화함으로써 기계 스스로 학습 규칙을 익힐 수 있게 하는 방법)이 필요하다. 에피소딕 훈련은 퓨샷 작업과 유사한 형태의 훈련 작업을 통해 모델 스스로 학습 규칙을 찾아낼 수 있도록 하여 일반화 성능을 향상하는 역할을 한다.

그렇다면 데이터가 아예 없는 상태에서도 학습할 수 있을까? 가능하다. 제로샷 러닝(Zero-shot learning, ZSL)덕분이다. 제로샷 러닝은 머신러닝의 문제 설정으로, 시험 시간에 학습자(learner)는 훈련 중 관찰되지 않은 클래스의 샘플을 관찰한다. 그리고, 이를 기반으로 샘플이 속하는 범주를 예측한다. 제로샷 러닝은 컴퓨터 비전, 자연어 처리, 기계 인식 등에서 폭넓게 연구되고 있다.

자연어 처리에서 개발된 핵심 기술 방향은 “라벨을 이해하는 능력(분류할 문서와 동일한 의미적 공간에 있는 라벨을 나타냄)”을 기반으로 한다. 이 덕분에 제로샷 분류가 가장 순수한 형태인 주석이 달린 데이터를 관찰하지 않고도 단일 예제를 분류할 수 있다.

제로샷 러닝 모델은 관찰된 클래스에 대한 매개변수를 클래스 표현과 함께 학습한다. 또, 추론 중에 인스턴스를 새로운 클래스로 분류할 수 있도록 클래스 라벨 사이의 표현적 유사성에 의존한다. 참고로 객체 지향 프로그래밍(OOP)에서 인스턴스(instance)는 해당 클래스의 구조로 컴퓨터 저장공간에서 할당된 실체를 의미한다. 여기서 클래스는 속성과 행위로 구성된 일종의 설계도이다.

물론 이러한 제로샷 클래스에 대한 몇 가지 형태의 부가 정보가 제공되어야 한다. 부가 정보의 유형은 다음과 같이 분류할 수 있다.

① 속성이 있는 학습: 클래스에는 미리 정의된 구조 설명이 수반된다. 이러한 속성은 종종 구조화된 구성 방식으로 구성되며, 그 구조를 고려하는 것은 학습을 향상시킨다.
ex) 새를 설명할 때 "빨간 머리", "긴 부리"와 같은 정보

② 텍스트 설명으로부터의 학습: 자연어 처리에서 추구하는 핵심 방향이다. 여기서 클래스 라벨은 의미를 가지기 위해 취해지고 종종 정의 또는 자유 텍스트 자연어 설명으로 강화된다.
ex) 클래스에 대한 위키피디아의 설명

③ 계급적 유사성: 여기서 클래스는 연속된 공간에 내장되어 있다. 제로샷 분류기는 샘플이 해당 공간의 어떤 위치에 해당한다고 예측할 수 있으며, 훈련 중에 그러한 샘플이 관찰되지 않았더라도 가장 비슷한 내장형 클래스를 예측된 클래스로 사용한다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue