차례:
정의-Apache Kudu는 무엇을 의미합니까?
Apache Kudu는 오픈 소스 Apache Hadoop 에코 시스템의 멤버입니다. 대기 시간이 짧은 랜덤 액세스와 효율적인 분석 액세스 패턴을 지원하는 구조화 된 데이터를위한 오픈 소스 스토리지 엔진입니다. 널리 사용되는 HDFS (Hadoop Distributed File System)와 HBase NoSQL 데이터베이스 간의 격차를 해소하도록 설계 및 구현되었습니다. 이러한 시스템은 여전히 유리할 수 있지만 Apache Kudu는 아키텍처를 크게 단순화 할 수 있으므로 많은 일반 워크로드를 수용 할 수 있습니다.
Techopedia는 Apache Kudu를 설명합니다.
Apache Kudu는 주로 Cloudera에서 프로젝트로 개발되었습니다. 현재까지의 대부분의 기여는 Cloudera에서 고용 한 개발자에 의해 이루어졌습니다. 릴리스 중에는 편의 바이너리 만 Cloudera의 저장소에 포함되었지만 인큐베이터에 참여할 때 Apache Software Foundation (ASF) 소스 릴리스 프로세스를 채택했습니다. 빠른 데이터에 대한 빠른 분석이 필요한 사용 사례를 위해 특별히 설계되었습니다. 차세대 하드웨어 및 인 메모리 프로세싱을 활용하도록 설계되었습니다. Apache Impala 및 Apache Spark의 쿼리 대기 시간이 크게 줄어 듭니다. 컬럼 스토리지 엔진 또는 수평 파티셔닝을 통해 데이터를 분배 한 다음 Raft 컨센서스를 사용하여 각 파티션을 복제하여 평균 복구 시간이 짧고 테일 지연이 적습니다.
Kudu는 Apache Hadoop 에코 시스템의 맥락에서 설계된 제품이지만 ASF 내부 및 외부의 다른 데이터 분석 프로젝트와의 통합도 지원합니다.
Apache Kudu는 단일 스토리지 계층에서 실시간 분석 워크로드를 처리 할 수있어 효율성이 뛰어나므로 건축가는 이국적인 해결 방법없이 광범위한 사용 사례를 처리 할 수있는 유연성을 제공합니다.