차례:
빅 데이터의 양은 날마다 증가하고 있습니다. 2012 년 2, 500 엑사 바이트에서 2020 년에는 빅 데이터가 40, 000 엑사 바이트로 증가 할 것으로 예상됩니다. 따라서 데이터 스토리지는 클라우드 인프라 만 처리 할 수 없다는 심각한 문제입니다. 클라우드는 대규모 스토리지 용량과 가입자에게 어떠한 의무도 부과하지 않는 사용 조건으로 인해 널리 사용되는 옵션이되었습니다. 클라우드 스토리지는 미리 정해진 기간 동안 구독 및 서비스 형태로 제공 될 수 있습니다. 그 후에는 고객 측에서 갱신 할 의무가 없습니다.
그러나 클라우드에 빅 데이터를 저장하면 정기적 인 정적 데이터에 채택 된 보안 조치에 직면 할 수없는 새로운 보안 문제가 발생합니다. 빅 데이터는 참신한 개념은 아니지만 최근 몇 년간 수집 및 사용 속도가 빨라졌습니다. 과거에는 빅 데이터 스토리지 및 분석이 데이터 스토리지 및 마이닝에 필요한 인프라를 제공 할 수있는 대기업과 정부에만 국한되었습니다. 이러한 인프라는 독점적이며 일반 네트워크에 노출되지 않았습니다. 그러나 이제 퍼블릭 클라우드 인프라를 통해 모든 유형의 기업에서 빅 데이터를 저렴하게 사용할 수 있습니다. 결과적으로 새롭고 정교한 보안 위협이 발생했으며 계속해서 증가하고 발전하고 있습니다.
분산 프로그래밍 프레임 워크의 보안 문제
분산 프로그래밍 프레임 워크는 병렬 계산 및 저장 기술로 빅 데이터를 처리합니다. 이러한 프레임 워크에서 인증되지 않거나 수정 된 매퍼 (대량 작업을 더 작은 하위 작업으로 분할하여 작업을 집계하여 최종 출력을 생성 할 수 있음)는 데이터를 손상시킬 수 있습니다. 매퍼에서 입력을 받아 작업을 실행하는 결함이 있거나 수정 된 작업자 노드는 매퍼와 다른 작업자 노드 사이의 데이터 통신을 눌러 데이터를 손상시킬 수 있습니다. 불량 작업자 노드는 합법적 인 작업자 노드의 복사본을 만들 수도 있습니다. 이러한 거대한 프레임 워크에서 불량 매퍼 또는 노드를 식별하기가 매우 어렵다는 사실은 데이터 보안을 더욱 어렵게 만듭니다.