CWN(CHANGE WITH NEWS) - 빅데이터·데이터 분산 처리, 탄생 배경은?...어떤 방식으로 데이터 저장할까

  • 맑음영천-7.0℃
  • 맑음순창군-7.2℃
  • 흐림군산-4.0℃
  • 맑음해남-7.0℃
  • 맑음진도군-3.5℃
  • 흐림이천-6.0℃
  • 맑음동해1.4℃
  • 맑음북창원-2.2℃
  • 맑음울산-0.8℃
  • 맑음구미-6.3℃
  • 맑음포항0.2℃
  • 맑음장흥-7.9℃
  • 맑음강릉4.0℃
  • 맑음부산0.9℃
  • 맑음보성군-4.7℃
  • 맑음김해시-2.0℃
  • 맑음북강릉1.7℃
  • 맑음합천-7.4℃
  • 흐림홍천-4.5℃
  • 맑음북부산-6.1℃
  • 맑음고창-6.3℃
  • 흐림의성-9.6℃
  • 맑음전주-3.9℃
  • 맑음거제-2.2℃
  • 흐림서산2.8℃
  • 구름많음파주-5.0℃
  • 맑음태백-5.8℃
  • 맑음영주-8.6℃
  • 맑음속초5.9℃
  • 구름많음흑산도4.8℃
  • 맑음서귀포5.6℃
  • 구름많음강화-0.5℃
  • 맑음춘천-5.1℃
  • 구름조금북춘천-6.3℃
  • 맑음충주-7.1℃
  • 흐림홍성0.2℃
  • 맑음울진0.5℃
  • 맑음밀양-6.8℃
  • 맑음대전-5.3℃
  • 구름많음청주-3.5℃
  • 흐림원주-5.0℃
  • 흐림거창-10.2℃
  • 흐림임실-8.1℃
  • 맑음청송군-11.1℃
  • 맑음추풍령-7.9℃
  • 구름많음인천0.8℃
  • 흐림정선군-10.1℃
  • 맑음광양시-2.6℃
  • 맑음강진군-6.0℃
  • 구름많음목포-1.5℃
  • 맑음인제-5.5℃
  • 흐림의령군-9.3℃
  • 맑음영덕0.2℃
  • 흐림대관령-2.4℃
  • 맑음금산-7.9℃
  • 맑음봉화-11.3℃
  • 흐림제천-6.8℃
  • 흐림서청주-6.0℃
  • 구름조금제주5.3℃
  • 맑음정읍-5.3℃
  • 맑음창원-1.3℃
  • 맑음순천-8.5℃
  • 맑음보은-8.1℃
  • 맑음여수-0.2℃
  • 맑음세종-5.2℃
  • 맑음장수-9.5℃
  • 흐림부여-5.0℃
  • 맑음진주-7.3℃
  • 맑음고산6.0℃
  • 맑음광주-3.0℃
  • 구름많음보령3.1℃
  • 흐림양평-3.5℃
  • 맑음문경-6.1℃
  • 맑음대구-4.1℃
  • 구름많음수원-2.8℃
  • 비백령도8.6℃
  • 흐림영월-7.5℃
  • 맑음울릉도4.1℃
  • 흐림남원-7.7℃
  • 맑음안동-8.3℃
  • 흐림동두천-3.3℃
  • 맑음상주-4.0℃
  • 구름많음서울-0.7℃
  • 맑음고흥-7.6℃
  • 맑음양산시-1.0℃
  • 맑음통영-0.4℃
  • 맑음완도-2.1℃
  • 맑음성산4.1℃
  • 맑음영광군-5.5℃
  • 맑음남해-1.4℃
  • 맑음철원-8.0℃
  • 맑음부안-3.5℃
  • 맑음경주시-5.4℃
  • 맑음고창군-5.3℃
  • 흐림함양군-9.1℃
  • 맑음산청-8.2℃
  • 흐림천안-5.9℃
  • 2025.12.06 (토)

빅데이터·데이터 분산 처리, 탄생 배경은?...어떤 방식으로 데이터 저장할까

박우영 / 기사승인 : 2021-03-31 14:10:18
  • -
  • +
  • 인쇄

2021년, 수많은 정보가 쏟아지고 있는 추세이다. 빅데이터는 많은 양의 데이터를 저장할 방법을 고민하면서부터 등장하기 시작했다.

처음에는 정형화된 수치 자료로 저장하고 처리하는 데 많은 시간이 소요되지 않았다. 하지만, 유튜브, SNS, 영상 등 여러 정보가 쏟아져 나오면서 데이터를 저장하는 데 한계가 발생했다. 처리 속도도 크게 줄어들었다. 이 때문에 정보 효율성이 낮아지면서 효율적인 정보 저장 방법의 필요성이 대두되었다.

분산처리
[wedul]

구글에서 사용하는 GFS(Google File System)는 중앙 컴퓨터에 모든 자료를 수집해서 열람 시 들어가서 확인하는 구조가 아닌 클라우드 컴퓨팅이라는 기술을 이용한다. 이때, 여러 대의 컴퓨터가 분산해서 저장하며, 여러 대의 컴퓨터가 연결되어 하나의 컴퓨터처럼 이용한다.

분산 처리 방식은 빅데이터에서 가장 중요한 기술 중 하나로 자리매김하고 있다. 이를 쉽게 설명하자면, 하나의 목표를 가지고 여러 사람이 협업해서 목표를 달성하는 형태와 유사하다고 볼 수 있다.

혼자서 처리하던 일을 분산하다 보니 당연히 처리 속도가 빨라진다.

정보 저장은 시간만 충분하다면, 특정 공간에 계속 저장하면 된다. 그러나 계속 최신화된 데이터가 올라오고 있다. 따라서 이에 따라 발맞춰 발전할 필요가 있다. 그러나 처리 속도가 느려 1년 전에 생성된 데이터만 저장된 채로 활용하게 된다면, 정보를 효율적으로 사용할 수 없다.

따라서 정보 저장 문제에서는 처리 속도에 중점을 둔다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue