차례:
- 모든 데이터 섹션을 빅 데이터 이니셔티브에 참여
- 빅 데이터 구현을위한 모든 인프라 모델 평가
- 빅 데이터 계획에서 기존 데이터 소스를 고려하십시오
- 일관된 데이터 집합을 고려하십시오
- 데이터를 배포하십시오
- 단일 빅 데이터 분석 접근 방식에 의존하지 마십시오
- 준비하기 전에 큰 빅 데이터 이니셔티브를 시작하지 마십시오
- 고립 된 데이터를 사용하지 마십시오
- 데이터 보안을 무시하지 마십시오
- 빅 데이터 분석의 성능 부분을 무시하지 마십시오
빅 데이터는 모든 유형의 산업에 많은 가능성을 제공합니다. 이 빅 데이터를 효과적이고 효율적으로 활용하면 의사 결정 및 분석에 큰 영향을 줄 수 있습니다. 그러나 빅 데이터의 이점은 구조적으로 관리되는 경우에만 달성 할 수 있습니다. 빅 데이터의 모범 사례는 점차 확립되고 있지만 구현과 관련하여 이미해야 할 것과하지 말아야 할 것이 이미 있습니다.
다음 지침은 실제 프로젝트에서 수집 한 실제 경험과 지식을 기반으로합니다. 여기에 내 빅 빅 데이터와하지 말아야 할 것이 있습니다.
모든 데이터 섹션을 빅 데이터 이니셔티브에 참여
빅 데이터 이니셔티브는 고립되고 독립적 인 활동이 아니며 모든 사업부의 참여는 진정한 가치와 통찰력을 얻는 데 필수적입니다. 빅 데이터는 조직이 많은 양의 데이터를 활용하고 고객 행동, 이벤트, 동향, 예측 등에 대한 통찰력을 얻는 데 도움이 될 수 있습니다. 이는 빅 데이터로 처리 된 전체 데이터 볼륨의 일부만 캡처하는 데이터 스냅 샷으로는 불가능합니다. 결과적으로 기업은 올바른 패턴을 이해하기 위해 가능한 모든 수단 / 사업 단위에서 오는 모든 유형의 데이터에 더 집중하고 있습니다.빅 데이터 구현을위한 모든 인프라 모델 평가
데이터의 양과 관리는 모든 빅 데이터 이니셔티브의 주요 관심사입니다. 빅 데이터는 페타 바이트 규모의 데이터를 처리하므로 데이터 센터를 사용하는 것이 유일한 관리 솔루션입니다. 동시에, 스토리지 기능을 선택하고 마무리하기 전에 비용 구성 요소를 고려해야합니다. 클라우드 서비스가 최선의 선택이지만 다른 클라우드 환경의 서비스를 평가하여 적절한 서비스를 결정해야합니다. 스토리지는 모든 빅 데이터 구현에서 가장 중요한 구성 요소 중 하나이므로 모든 빅 데이터 이니셔티브에서 매우 신중하게 평가해야하는 요소입니다. (볼륨이 아닌 다양한 종류의 오늘날 빅 데이터 챌린지 스템에서 또 다른 관점을 얻으십시오.)빅 데이터 계획에서 기존 데이터 소스를 고려하십시오
다양한 빅 데이터 소스가 있으며 소스 수도 날마다 증가하고 있습니다. 이 방대한 양의 데이터는 빅 데이터 처리에 대한 입력으로 사용됩니다. 결과적으로 일부 회사는 기존 데이터 소스를 사용하지 않는다고 생각합니다. 이 전통적인 데이터는 모든 빅 데이터 스토리의 성공을위한 중요한 구성 요소이기 때문에 이것은 사실이 아닙니다. 기존 데이터에는 유용한 정보가 포함되어 있으므로 다른 빅 데이터 소스와 함께 사용해야합니다. 빅 데이터의 실제 가치는 모든 데이터 소스 (전통 및 비전통)를 고려한 경우에만 도출 할 수 있습니다. (빅 데이터 가져 오기에서 자세히 알아보십시오. 작은 데이터가 더 큰 펀치를 포장 할 수있는 이유)일관된 데이터 집합을 고려하십시오
빅 데이터 환경에서 데이터는 다양한 소스에서 제공됩니다. 데이터의 형식, 구조 및 유형은 소스마다 다릅니다. 가장 중요한 부분은 빅 데이터 환경에서 데이터가 정리되지 않는다는 것입니다. 따라서 들어오는 데이터를 신뢰하기 전에 반복적 인 관찰 및 분석을 통해 일관성을 확인해야합니다. 데이터의 일관성이 확인되면 일관된 메타 데이터 세트로 취급 할 수 있습니다. 패턴을주의 깊게 관찰하여 일관된 메타 데이터 세트를 찾는 것은 모든 빅 데이터 계획에서 필수적인 운동입니다.데이터를 배포하십시오
데이터 처리량은 처리 환경을 고려할 때 주요 관심사입니다. 빅 데이터가 처리하는 엄청난 양의 데이터로 인해 단일 서버에서 처리 할 수 없습니다. 솔루션은 범용 하드웨어에서 실행되는 분산 컴퓨팅 환경 인 Hadoop 환경입니다. 여러 노드에서 더 빠른 처리 성능을 제공합니다. (하둡에 대해 알아야 할 7 가지 사항에 대해 자세히 알아보십시오.)단일 빅 데이터 분석 접근 방식에 의존하지 마십시오
빅 데이터를 처리하기 위해 시장에는 다양한 기술이 있습니다. 모든 빅 데이터 기술의 기초는 Apache Hadoop 및 MapReduce입니다. 따라서 올바른 목적으로 올바른 기술을 평가하는 것이 중요합니다. 중요한 분석 방법 중 일부는 예측 분석, 규정 분석, 텍스트 분석, 스트림 데이터 분석 등입니다. 원하는 목표를 달성하려면 적절한 방법 / 접근법을 선택하는 것이 중요합니다. 단일 접근 방식에 의존하지 않는 것이 가장 좋지만 다양한 접근 방식을 조사하고 솔루션에 가장 적합한 것을 선택하십시오.준비하기 전에 큰 빅 데이터 이니셔티브를 시작하지 마십시오
빅 데이터 이니셔티브를 위해서는 항상 작은 단계부터 시작하는 것이 좋습니다. 따라서 파일럿 프로젝트부터 시작하여 전문 지식을 얻은 다음 실제 구현을 시작하십시오. 빅 데이터의 잠재력은 매우 인상적이지만 실수를 줄이고 더 많은 전문 지식을 얻은 후에 만 실제 가치를 달성 할 수 있습니다.고립 된 데이터를 사용하지 마십시오
빅 데이터 소스는 우리 주변에 흩어져 있으며 매일 증가하고 있습니다. 정확한 분석 결과를 얻으려면 이러한 모든 데이터를 통합하는 것이 중요합니다. 시장에서 데이터 통합을 위해 다양한 도구를 사용할 수 있지만 사용하기 전에 올바르게 평가해야합니다. 서로 다른 소스의 데이터는 형식이 다르기 때문에 빅 데이터 통합은 복잡한 작업이지만 좋은 분석 결과를 얻는 것이 매우 중요합니다.데이터 보안을 무시하지 마십시오
데이터 보안은 빅 데이터 계획에서 주요 고려 사항입니다. 처음에는 (처리를 수행하기 전에) 데이터가 페타 바이트 단위이므로 보안이 엄격하게 구현되지 않습니다. 그러나 일부 처리 후에는 통찰력을 제공하는 데이터의 하위 집합을 얻게됩니다. 이 시점에서 데이터 보안이 필수적입니다. 데이터가 처리되고 미세 조정 될수록 조직에 더 가치가있는 경우가 많습니다. 이 미세 조정 된 출력 데이터는 지적 재산이므로 보호해야합니다. 데이터 보안은 빅 데이터 수명주기의 일부로 구현되어야합니다.빅 데이터 분석의 성능 부분을 무시하지 마십시오
빅 데이터 분석 결과는 우수한 성능을 제공 할 때만 유용합니다. 빅 데이터는 대량의 데이터를 빠른 속도로 처리하여 더 많은 통찰력을 제공합니다. 따라서 효과적이고 효율적으로 관리해야합니다. 빅 데이터의 성능을 신중하게 관리하지 않으면 문제가 발생하고 전체 노력이 의미가 없게됩니다.
토론에서 우리는 빅 데이터 이니셔티브의해야 할 것과하지 말아야 할 것에 집중했습니다. 빅 데이터는 떠오르는 분야이며, 구현에있어 많은 회사들이 여전히 계획 단계에 있습니다. 위험과 실수를 최소화하려면 빅 데이터 모범 사례를 이해해야합니다. 토론 요점은 실제 프로젝트 경험에서 비롯된 것이므로 빅 데이터 전략을 성공적으로 수행하기위한 지침을 제공합니다.