지난달, 스캐터랩에서 정식 출시한 AI 채팅봇 '이루다'가 3주간의 운영 끝에 결국 폐기되었다. '이루다'는 인공지능 채팅봇으로, 20대 여대생이라는 컨셉으로 사람들에게 신선하고 친근하게 다가왔지만, 각종 혐오 발언과 개인정보 유출 의혹 때문에 결국 폐기 처리에 이르렀다.
관련 기사: 인공지능이 불러올 수 있는 어두운 미래를 보여준 AI 채팅봇, '이루다'
이에, 법무법인 태림은 개인정보 유출 피해자 집단 소송 사이트를 열고, 소송 참여 접수를 시작했다. 소송 대리인들은 "스캐터랩은 기존 서비스 어플리케이션인 '연애의 과학', '텍스트앳' 등에서 수집한 대화를 당사자의 동의 없이 사용해, AI 딥러닝을 적용했다. 그 과정에서 개인정보 유출이 발생했다"라고 설명했다.
그런데, 개인정보 유출의 원인이 된 '딥러닝'은 무엇일까?
딥러닝이란, '컴퓨터가 데이터를 이용해 학습할 수 있도록 하는 기술' 이라고 정의할 수 있다. 딥러닝은 사물이나 데이터를 군집화하거나 분류하는데 사용되는 기술이다.
예를 들어, 컴퓨터는 사진만으로 개와 고양이를 구분하지 못하지만 사람은 아주 쉽게 구분할 수 있다. 이를 위해 ‘기계학습(Machine Learning)’이라는 방법이 고안됐다. 많은 데이터를 컴퓨터에 입력하고 비슷한 것끼리 분류하도록 하는 기술이다. 기계의 데이터에 저장된 개 사진과 비슷한 사진이 입력되면, 이를 개 사진이라고 컴퓨터가 분류하도록 한 것이다.
테크 기업은 주로 사진과 동영상, 음성 정보를 분류하는 방향으로 딥러닝을 활용한다. 데이터의 양이 풍부하고, 정확성을 요구하기 때문이다. AI인 이루다도 마찬가지로 이용자들의 대화 내용과 패턴을 딥러닝 기술을 적용시켜 데이터베이스를 구축한 뒤, 대화가 이루어지게 하는 채팅봇이다.
스캐터랩 측에 따르면, 이루다의 데이터베이스는 비식별화 절차를 거쳤기 때문에 개별적이고 독립적인 문장 단위로 이루어져 개인 식별이 가능한 데이터는 포함되어 있지 않다.
또한, 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고, 인공지능은 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다고 주장한다.
그러나 스캐터랩은 이용자들의 불안감을 고려하여 이번 인공지능 '이루다'의 데이터베이스와 딥러닝 대화 모델을 모두 폐기하기로 했다.
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]