차례:
정의-빅 데이터 란 무엇입니까?
빅 데이터는 기존의 데이터 마이닝 및 처리 기술이 기본 데이터의 통찰력과 의미를 찾을 수 없을 때 사용되는 프로세스를 말합니다. 비정형이거나 시간에 민감하거나 단순히 매우 큰 데이터는 관계형 데이터베이스 엔진으로 처리 할 수 없습니다. 이 유형의 데이터에는 빅 데이터라고하는 다른 처리 방식이 필요하며, 이는 즉시 사용 가능한 하드웨어에서 대규모 병렬 처리를 사용합니다.
Techopedia는 빅 데이터를 설명합니다
간단히 말해, 빅 데이터는 우리가 살고있는 변화하는 세상을 반영합니다. 변화가 많을수록 변경 사항이 더 많이 캡처되어 데이터로 기록됩니다. 날씨를 예로 들어 보자. 일기 예보의 경우, 현지 조건에 대해 전 세계에서 수집 된 데이터의 양이 상당합니다. 논리적으로, 지역 환경이 지역적 영향을 지시하고 지역적 영향이 세계적 영향을 지시한다는 것이 합리적이지만, 그 반대의 경우도있을 수 있습니다. 어떤 방식 으로든이 날씨 데이터는 빅 데이터의 특성을 반영합니다.이 데이터는 방대한 양의 데이터에 실시간 처리가 필요하며, 많은 수의 입력이 기계 생성, 개인 관찰 또는 태양 반점과 같은 외부 힘이 될 수 있습니다.
이와 같은 정보를 처리하면 빅 데이터가 중요한 이유가 설명됩니다.
- 현재 수집 된 대부분의 데이터는 구조화되지 않았으며 기존 관계형 데이터베이스에서 발견 된 것보다 다른 스토리지 및 처리가 필요합니다.
- 사용 가능한 계산 성능은 급상승합니다. 즉, 빅 데이터를 처리 할 기회가 더 많습니다.
- 인터넷은 데이터를 민주화하여 꾸준히 사용 가능한 데이터를 늘리는 동시에 점점 더 많은 원시 데이터를 생성합니다.
원시 형식의 데이터는 가치가 없습니다. 가치를 얻으려면 데이터를 처리해야합니다. 그러나 여기에는 빅 데이터의 고유 한 문제가 있습니다. 기본 개체 형식에서 데이터를 처리하는 데 막대한 자본 비용이 드는 유용한 통찰력으로 데이터를 처리합니까? 아니면 빅 데이터 도구로 처리하는 도박을 정당화하기 위해 알 수없는 값을 가진 데이터가 너무 많습니까? 우리 대부분은 날씨를 예측할 수 있다는 것이 가치가있을 것이라는 데 동의 할 것입니다. 문제는 그 값이 모든 실시간 데이터를 계산하는 날씨 보고서로 계산하는 데 드는 비용을 능가 할 수 있는지 여부입니다.
