CWN(CHANGE WITH NEWS) - 인공지능 로봇, 인간의 목소리를 따라한다?

  • 구름조금춘천0.7℃
  • 맑음포항6.3℃
  • 맑음고흥7.4℃
  • 맑음울릉도9.6℃
  • 구름조금이천1.2℃
  • 맑음진도군7.6℃
  • 흐림인천3.7℃
  • 맑음보성군6.2℃
  • 맑음고창군7.4℃
  • 맑음목포6.9℃
  • 맑음의성3.5℃
  • 맑음부산7.0℃
  • 맑음안동1.0℃
  • 맑음정읍6.9℃
  • 맑음통영7.6℃
  • 구름많음대관령0.8℃
  • 맑음서청주2.6℃
  • 맑음순창군0.7℃
  • 맑음북부산6.5℃
  • 맑음장흥6.1℃
  • 맑음순천6.4℃
  • 맑음장수1.7℃
  • 맑음완도8.1℃
  • 구름조금천안2.8℃
  • 구름조금정선군0.1℃
  • 맑음부안6.9℃
  • 맑음구미2.2℃
  • 맑음영광군5.4℃
  • 구름조금속초9.0℃
  • 흐림강화3.5℃
  • 맑음남원1.2℃
  • 맑음동해8.3℃
  • 맑음상주4.1℃
  • 맑음경주시7.3℃
  • 맑음세종2.9℃
  • 맑음강릉8.3℃
  • 구름조금흑산도12.5℃
  • 맑음추풍령4.8℃
  • 맑음밀양3.1℃
  • 맑음거제6.3℃
  • 구름조금원주0.2℃
  • 흐림동두천2.7℃
  • 맑음영천4.2℃
  • 맑음울진9.5℃
  • 맑음봉화0.8℃
  • 흐림서울2.5℃
  • 맑음산청0.9℃
  • 맑음광주4.1℃
  • 맑음함양군1.4℃
  • 맑음임실3.2℃
  • 맑음전주7.5℃
  • 맑음청송군3.4℃
  • 구름조금양평1.7℃
  • 맑음거창0.9℃
  • 맑음성산11.4℃
  • 흐림파주1.0℃
  • 맑음의령군1.3℃
  • 구름많음보령8.7℃
  • 맑음울산6.3℃
  • 맑음창원5.8℃
  • 맑음고산12.3℃
  • 맑음고창6.9℃
  • 구름많음북춘천0.4℃
  • 맑음제천0.3℃
  • 맑음북강릉8.1℃
  • 구름많음서산6.7℃
  • 맑음영주-0.1℃
  • 맑음충주0.8℃
  • 맑음합천3.6℃
  • 맑음금산3.0℃
  • 흐림수원2.7℃
  • 구름많음홍성5.6℃
  • 맑음보은0.3℃
  • 맑음제주12.4℃
  • 맑음광양시5.4℃
  • 맑음여수5.8℃
  • 구름많음백령도10.1℃
  • 맑음해남8.5℃
  • 구름조금홍천0.4℃
  • 맑음북창원5.6℃
  • 맑음청주3.6℃
  • 맑음남해3.6℃
  • 맑음김해시4.5℃
  • 맑음부여2.8℃
  • 맑음대전4.4℃
  • 맑음영덕5.9℃
  • 맑음서귀포12.7℃
  • 흐림철원1.6℃
  • 맑음양산시4.9℃
  • 구름많음태백1.8℃
  • 맑음진주3.6℃
  • 흐림인제0.4℃
  • 맑음강진군6.4℃
  • 맑음대구4.8℃
  • 맑음군산5.5℃
  • 맑음영월-0.2℃
  • 맑음문경2.0℃
  • 2025.12.06 (토)

인공지능 로봇, 인간의 목소리를 따라한다?

이서하 / 기사승인 : 2021-02-11 15:30:08
  • -
  • +
  • 인쇄

보통 우리가 알고 있는 인공지능(AI) 로봇의 목소리는 인간의 목소리보다 단조롭고 딱딱한 느낌이다. 그러나 최근에는 인간의 목소리의 높낮이, 호흡, 바이브레이션까지 따라 하는 기술이 개발되고 있다.

TTS(Text To Speech)라고 불리는 기술은 말소리의 음파를 기계가 자동으로 만들어 내는 기술이다. 모델로 선정된 한 사람의 말소리를 녹음해, 일정한 음성 단위로 나눈다. 그 다음, 부호를 붙여 합성기에 입력한 뒤, 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. 시리나 구글 어시스턴트와 같은 음성 비서, 차량용 내비게이션 음성 안내 등 다양한 서비스에 TTS 서비스가 적용되었다.

그렇다면, AI가 노래하는 데 필요한 기술은 무엇일까? 가창음성합성(SVS)시스템이라는 연구용 AI가 가사와 음의 높낮이를 입력받고 제공된 가수의 목소리를 합쳐서 학습하면 진짜 가수의 모창 가수가 되어 노래한다.

AI는 유명한 가수뿐만 아니라 일반인의 목소리도 따라 할 수 있다. AI에 목소리 데이터를 제공하면 스스로 딥러닝을 통해 수천 번, 수백만 번 학습하게 된다.

AI는 딥러닝 덕분에 인간 목소리의 톤의 높낮이, 음성의 길이, 그리고 음의 세기 등을 따라 하게 되는 것이다. AI가 노래를 부르게 하고 싶다면 발음 데이터와 멜로디 데이터를 따로 학습한 후에 합쳐서 출력하게끔 프로그래밍하면 된다.

현재, 음성 합성 기술은 AI 스피커, 전화상담, 키오스크, ATM, 안내방송, 그리고 E-Book과 오디오북에서 활용된다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue