CWN(CHANGE WITH NEWS) - 빅데이터·데이터 분산 처리, 탄생 배경은?...어떤 방식으로 데이터 저장할까

  • 맑음남해-1.5℃
  • 맑음여수-0.2℃
  • 맑음봉화-10.8℃
  • 맑음문경-5.4℃
  • 맑음영주-8.0℃
  • 맑음경주시-6.3℃
  • 맑음청송군-10.8℃
  • 맑음보성군-3.6℃
  • 맑음강릉3.7℃
  • 흐림영월-8.6℃
  • 맑음창원-0.6℃
  • 구름많음강화-0.4℃
  • 맑음동해0.9℃
  • 맑음이천-5.9℃
  • 맑음추풍령-6.6℃
  • 흐림인천0.6℃
  • 구름조금대관령-3.7℃
  • 맑음금산-7.8℃
  • 맑음광주-3.1℃
  • 맑음북부산-6.1℃
  • 흐림서울-0.8℃
  • 흐림파주-5.0℃
  • 맑음고창-6.3℃
  • 맑음양산시-1.4℃
  • 맑음부산1.0℃
  • 구름많음진도군-3.5℃
  • 흐림인제-5.1℃
  • 맑음김해시-2.1℃
  • 맑음부안-3.6℃
  • 맑음철원-5.9℃
  • 맑음영덕-1.0℃
  • 맑음거제-2.5℃
  • 구름조금청주-4.3℃
  • 맑음남원-7.3℃
  • 구름조금충주-6.9℃
  • 맑음순천-8.4℃
  • 맑음순창군-7.0℃
  • 맑음진주-6.5℃
  • 맑음해남-7.2℃
  • 맑음장수-9.3℃
  • 맑음합천-7.2℃
  • 맑음강진군-5.7℃
  • 맑음포항0.2℃
  • 흐림홍성-0.2℃
  • 흐림원주-4.6℃
  • 맑음상주-3.8℃
  • 흐림임실-8.0℃
  • 흐림정선군-11.4℃
  • 맑음통영-0.5℃
  • 맑음동두천-3.8℃
  • 맑음목포-1.5℃
  • 맑음대전-5.1℃
  • 흐림부여-6.1℃
  • 흐림거창-10.1℃
  • 맑음고흥-7.6℃
  • 흐림양평-3.5℃
  • 구름많음북춘천-5.1℃
  • 흐림서산1.7℃
  • 맑음대구-4.7℃
  • 비백령도8.1℃
  • 맑음성산3.9℃
  • 맑음보은-7.6℃
  • 맑음광양시-2.6℃
  • 구름많음수원-2.7℃
  • 맑음태백-4.7℃
  • 흐림의성-9.4℃
  • 구름조금속초5.5℃
  • 맑음완도-3.3℃
  • 맑음천안-6.2℃
  • 맑음구미-6.3℃
  • 구름많음제주5.2℃
  • 맑음의령군-9.2℃
  • 구름많음흑산도5.1℃
  • 맑음전주-4.0℃
  • 맑음영천-5.5℃
  • 맑음북강릉1.0℃
  • 맑음영광군-5.1℃
  • 맑음울산-1.7℃
  • 맑음밀양-6.4℃
  • 맑음북창원-2.3℃
  • 흐림춘천-4.3℃
  • 흐림세종-5.2℃
  • 흐림함양군-8.8℃
  • 맑음울진0.8℃
  • 맑음산청-7.5℃
  • 맑음서귀포5.8℃
  • 맑음고산5.7℃
  • 흐림서청주-6.8℃
  • 맑음장흥-7.6℃
  • 맑음안동-9.7℃
  • 흐림보령0.7℃
  • 흐림제천-7.0℃
  • 흐림홍천-4.0℃
  • 맑음군산-4.8℃
  • 맑음울릉도4.3℃
  • 맑음고창군-4.9℃
  • 맑음정읍-5.3℃
  • 2025.12.06 (토)

빅데이터·데이터 분산 처리, 탄생 배경은?...어떤 방식으로 데이터 저장할까

박우영 / 기사승인 : 2021-03-31 14:10:18
  • -
  • +
  • 인쇄

2021년, 수많은 정보가 쏟아지고 있는 추세이다. 빅데이터는 많은 양의 데이터를 저장할 방법을 고민하면서부터 등장하기 시작했다.

처음에는 정형화된 수치 자료로 저장하고 처리하는 데 많은 시간이 소요되지 않았다. 하지만, 유튜브, SNS, 영상 등 여러 정보가 쏟아져 나오면서 데이터를 저장하는 데 한계가 발생했다. 처리 속도도 크게 줄어들었다. 이 때문에 정보 효율성이 낮아지면서 효율적인 정보 저장 방법의 필요성이 대두되었다.

분산처리
[wedul]

구글에서 사용하는 GFS(Google File System)는 중앙 컴퓨터에 모든 자료를 수집해서 열람 시 들어가서 확인하는 구조가 아닌 클라우드 컴퓨팅이라는 기술을 이용한다. 이때, 여러 대의 컴퓨터가 분산해서 저장하며, 여러 대의 컴퓨터가 연결되어 하나의 컴퓨터처럼 이용한다.

분산 처리 방식은 빅데이터에서 가장 중요한 기술 중 하나로 자리매김하고 있다. 이를 쉽게 설명하자면, 하나의 목표를 가지고 여러 사람이 협업해서 목표를 달성하는 형태와 유사하다고 볼 수 있다.

혼자서 처리하던 일을 분산하다 보니 당연히 처리 속도가 빨라진다.

정보 저장은 시간만 충분하다면, 특정 공간에 계속 저장하면 된다. 그러나 계속 최신화된 데이터가 올라오고 있다. 따라서 이에 따라 발맞춰 발전할 필요가 있다. 그러나 처리 속도가 느려 1년 전에 생성된 데이터만 저장된 채로 활용하게 된다면, 정보를 효율적으로 사용할 수 없다.

따라서 정보 저장 문제에서는 처리 속도에 중점을 둔다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue