CWN(CHANGE WITH NEWS) - 인공지능 로봇, 인간의 목소리를 따라한다?

  • 맑음남해-2.4℃
  • 맑음부여-6.3℃
  • 맑음세종-7.1℃
  • 흐림순창군-5.7℃
  • 맑음포항-2.9℃
  • 맑음철원-10.3℃
  • 구름많음부안-3.9℃
  • 맑음상주-6.6℃
  • 눈목포-2.6℃
  • 맑음합천-2.5℃
  • 맑음거창-5.7℃
  • 맑음의성-5.0℃
  • 맑음장흥-4.5℃
  • 맑음청송군-6.5℃
  • 맑음원주-7.9℃
  • 흐림영광군-3.8℃
  • 맑음서청주-7.4℃
  • 맑음영천-4.7℃
  • 맑음속초-5.2℃
  • 맑음정선군-8.3℃
  • 구름많음울릉도-3.2℃
  • 맑음동두천-10.0℃
  • 눈제주1.1℃
  • 맑음양평-6.8℃
  • 맑음해남-4.1℃
  • 맑음인천-8.3℃
  • 흐림고산1.1℃
  • 맑음순천-6.5℃
  • 맑음함양군-5.3℃
  • 맑음보은-7.6℃
  • 맑음광양시-4.9℃
  • 맑음보성군-4.1℃
  • 흐림진도군-2.6℃
  • 흐림고창군-5.5℃
  • 눈흑산도-2.0℃
  • 맑음서울-8.1℃
  • 맑음통영-1.3℃
  • 맑음충주-8.0℃
  • 맑음여수-4.1℃
  • 맑음울산-3.8℃
  • 맑음태백-11.1℃
  • 맑음밀양-3.0℃
  • 맑음대관령-12.5℃
  • 맑음진주-3.0℃
  • 맑음양산시-1.0℃
  • 맑음영주-7.2℃
  • 맑음인제-8.3℃
  • 흐림고창-4.3℃
  • 맑음강릉-4.7℃
  • 맑음봉화-8.0℃
  • 맑음강진군-4.3℃
  • 맑음안동-6.2℃
  • 맑음고흥-4.7℃
  • 맑음장수-8.1℃
  • 맑음파주-10.6℃
  • 맑음완도-4.0℃
  • 맑음남원-6.2℃
  • 맑음동해-4.0℃
  • 흐림성산-0.3℃
  • 맑음울진-4.0℃
  • 맑음창원-1.7℃
  • 맑음홍성-6.6℃
  • 눈백령도-7.0℃
  • 맑음북부산-2.0℃
  • 맑음홍천-7.6℃
  • 맑음산청-4.9℃
  • 맑음북춘천-9.4℃
  • 맑음대구-3.6℃
  • 맑음제천-8.4℃
  • 맑음수원-7.5℃
  • 맑음서산-6.6℃
  • 구름많음정읍-5.1℃
  • 맑음영덕-4.0℃
  • 맑음의령군-3.7℃
  • 맑음북창원-1.4℃
  • 맑음청주-6.7℃
  • 맑음천안-7.1℃
  • 구름많음보령-6.1℃
  • 구름많음군산-5.7℃
  • 맑음추풍령-7.5℃
  • 맑음이천-7.6℃
  • 맑음영월-7.8℃
  • 맑음부산-1.8℃
  • 맑음춘천-7.6℃
  • 맑음김해시-3.2℃
  • 구름많음광주-4.6℃
  • 맑음구미-5.3℃
  • 맑음금산-6.2℃
  • 맑음문경-7.7℃
  • 맑음경주시-4.0℃
  • 맑음전주-6.3℃
  • 구름조금서귀포0.9℃
  • 맑음강화-9.5℃
  • 맑음임실-6.8℃
  • 맑음대전-6.9℃
  • 맑음북강릉-4.9℃
  • 2026.01.21 (수)

인공지능 로봇, 인간의 목소리를 따라한다?

이서하 / 기사승인 : 2021-02-11 15:30:08
  • -
  • +
  • 인쇄

보통 우리가 알고 있는 인공지능(AI) 로봇의 목소리는 인간의 목소리보다 단조롭고 딱딱한 느낌이다. 그러나 최근에는 인간의 목소리의 높낮이, 호흡, 바이브레이션까지 따라 하는 기술이 개발되고 있다.

TTS(Text To Speech)라고 불리는 기술은 말소리의 음파를 기계가 자동으로 만들어 내는 기술이다. 모델로 선정된 한 사람의 말소리를 녹음해, 일정한 음성 단위로 나눈다. 그 다음, 부호를 붙여 합성기에 입력한 뒤, 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. 시리나 구글 어시스턴트와 같은 음성 비서, 차량용 내비게이션 음성 안내 등 다양한 서비스에 TTS 서비스가 적용되었다.

그렇다면, AI가 노래하는 데 필요한 기술은 무엇일까? 가창음성합성(SVS)시스템이라는 연구용 AI가 가사와 음의 높낮이를 입력받고 제공된 가수의 목소리를 합쳐서 학습하면 진짜 가수의 모창 가수가 되어 노래한다.

AI는 유명한 가수뿐만 아니라 일반인의 목소리도 따라 할 수 있다. AI에 목소리 데이터를 제공하면 스스로 딥러닝을 통해 수천 번, 수백만 번 학습하게 된다.

AI는 딥러닝 덕분에 인간 목소리의 톤의 높낮이, 음성의 길이, 그리고 음의 세기 등을 따라 하게 되는 것이다. AI가 노래를 부르게 하고 싶다면 발음 데이터와 멜로디 데이터를 따로 학습한 후에 합쳐서 출력하게끔 프로그래밍하면 된다.

현재, 음성 합성 기술은 AI 스피커, 전화상담, 키오스크, ATM, 안내방송, 그리고 E-Book과 오디오북에서 활용된다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue