4차 산업혁명에 관한 뉴스나 인터넷 기사를 보면 누구나 한 번쯤 '빅데이터'라는 말을 들어봤을 것이다. 빅데이터가 도대체 뭐길래 언급이 되는 것일까?
빅데이터란 디지털 환경에서 생성되는 데이터를 말한다. 빅데이터에 대해 자세히 알아보기 전, 데이터의 종류에 먼저 살펴보자.
(1) 정형 데이터
미리 정해 놓은 형식과 구조에 따라 저장되도록 구성된 데이터이다. 형식과 저장 구조가 정해져있기 때문에 검색이나 선택, 갱신, 삭제 등의 연산을 수행할 수 있다.
(2) 비정형 데이터
정형 데이터와 달리 정의된 구조가 없이 정형화되지 않은 데이터를 비정형 데이터라고 한다. 일반적으로 동영상이나 오디오, 사진, 보고서, 메일 본문 등이 비정형 데이터에 속한다.
(3) 반정형 데이터
정형 데이터, 비정형 데이터가 아닌 모든 데이터를 통틀어 부르는 말이다. 주로 컴퓨터 언어로 쓰인 데이터를 의미하며 인터넷 접속 기록, 웹페이지를 이루는 코딩 파일이 반정형 데이터이다.
빅데이터는 이 3가지의 데이터를 다 포괄하는 개념으로 이해하면 된다.
그렇다면 빅데이터는 왜 쓰는 걸까?
빅데이터는 규모(Volume), 변화 속도(Velocity), 다양성(Variety)이라는 3가지 특징, 즉 3V를 가지고 있는 데이터에서 효과적인 결과물을 보여준다. 1분에 수많은 자료가 쏟아지는 인터넷 세상에서 효과적이기에 4차 산업 혁명에서 필수라고 할 수 있다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]