오디오 SQL on hadoop은 빅 데이터 분석에 어떤 도움을 줄 수 있습니까?

SQL on hadoop은 빅 데이터 분석에 어떤 도움을 줄 수 있습니까?

차례:

Anonim

SQL on Hadoop은 SQL 스타일 쿼리 및 데이터 처리를 최신 Hadoop 데이터 프레임 워크 요소와 결합하는 분석 응용 프로그램 도구 그룹입니다. Hadoop에서 SQL이 등장하는 것은 빅 데이터 처리를위한 중요한 개발로, 보다 많은 사람들이 Hadoop이 처리하는 방대한 양의 빅 데이터에 대해 SQL 쿼리를 실행하여 Hadoop 데이터 처리 프레임 워크를 성공적으로 사용할 수 있기 때문입니다. 분명히 Hadoop 프레임 워크는 이전에는 특히 쿼리 기능 측면에서 사람들이 액세스 할 수 없었습니다. 개발을 기반으로 품질과 속도로 빅 데이터를 처리하고 분석 할 때 기업의 생산성을 향상시킬 수있는 몇 가지 도구가 개발되었습니다. 또한 SQL에 대한 전통적인 지식과 마찬가지로 도구 학습에 많은 투자를 할 필요가 없습니다.

하둡에서의 SQL 정의

SQL on Hadoop은 Hadoop 데이터 처리 프레임 워크에서 호스팅하는 빅 데이터에 대해 SQL 스타일 쿼리를 실행할 수있는 응용 프로그램 그룹입니다. 분명히 Hadoop에 SQL을 추가하면 데이터 쿼리, 검색 및 분석이 쉬워졌습니다. SQL은 원래 관계형 데이터베이스 용으로 설계되었으므로 MapReduce와 HDFS (Hadoop Distributed File System)를 구성하는 Hadoop 1 모델과 MapReduce와 HDFS가없는 Hadoop 2 모델에 따라 수정해야했습니다.

SQL과 Hadoop을 결합하려는 초기 노력 중 하나는 Hive 데이터웨어 하우스를 HiveQL 소프트웨어와 함께 생성하여 SQL 스타일 쿼리를 MapReduce 작업으로 변환 할 수있었습니다. 그 후 유사한 작업을 수행 할 수있는 여러 응용 프로그램이 개발되었습니다. 이후의 툴들 중에는 Drill, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark) 및 Tez (Tive on Tez)가 있습니다.

SQL on hadoop은 빅 데이터 분석에 어떤 도움을 줄 수 있습니까?