차례:
Apache Hadoop은 현재 빅 데이터 애플리케이션의 기반이되어 왔으며 모든 빅 데이터 관련 제품의 기본 데이터 플랫폼으로 간주됩니다. 그러나 인 메모리 데이터베이스 및 계산은 성능이 향상되고 결과가 빠르기 때문에 인기를 얻고 있습니다. Apache Spark는 인 메모리 기능을 사용하여 Hadoop보다 거의 100 배 빠른 빠른 처리를 제공하는 새로운 프레임 워크입니다. 따라서 Spark 제품은 빅 데이터 세계에서 점점 더 빠른 처리를 위해 점점 더 많이 사용되고 있습니다.
웹 세미나 : 제안의 힘 : 데이터 카탈로그가 분석가에게 권한을 부여하는 방법 여기에 등록하십시오 |
Apache Spark 란 무엇입니까?
Apache Spark는 빠르고 간단한 대량의 데이터 (빅 데이터)를 처리하기위한 오픈 소스 프레임 워크입니다. 빅 데이터를 기반으로하는 분석 응용 프로그램에 적합합니다. Spark는 독립형 또는 클라우드에서 Hadoop 환경과 함께 사용할 수 있습니다. 캘리포니아 대학에서 개발 된 후 나중에 Apache Software Foundation에 제공되었습니다. 따라서 오픈 소스 커뮤니티에 속하며 매우 비용 효율적이므로 아마추어 개발자가 쉽게 작업 할 수 있습니다. Hadoop의 오픈 소스에 대한 자세한 내용은 Apache Hadoop 에코 시스템에서 오픈 소스의 영향은 무엇입니까?를 참조하십시오.
Spark의 주요 목적은 개발자에게 중앙 집중식 데이터 구조를 중심으로 작동하는 응용 프로그램 프레임 워크를 제공하는 것입니다. Spark는 또한 매우 강력하며 짧은 시간 안에 대량의 데이터를 신속하게 처리 할 수있는 타고난 능력을 가지고있어 매우 우수한 성능을 제공합니다. 가장 가까운 경쟁사 인 하둡보다 훨씬 빠릅니다.