차례:
정의-데이터 마이닝이란 무엇입니까?
데이터 마이닝은 데이터웨어 하우스와 같은 공통 영역에서 효율적인 분석, 데이터 마이닝 알고리즘, 비즈니스 의사 결정 및 기타 정보를 제공하기 위해 수집 및 조립되는 유용한 정보로 분류하기 위해 서로 다른 관점에 따라 숨겨진 데이터 패턴을 분석하는 프로세스입니다. 궁극적으로 비용을 절감하고 수익을 늘리기위한 요구 사항.
데이터 마이닝은 데이터 검색 및 지식 검색이라고도합니다.
Techopedia는 데이터 마이닝을 설명합니다
데이터 마이닝 프로세스와 관련된 주요 단계는 다음과 같습니다.
- 데이터웨어 하우스로 데이터 추출, 변환 및로드
- 다차원 데이터베이스에 데이터 저장 및 관리
- 응용 프로그램 소프트웨어를 사용하여 비즈니스 분석가에게 데이터 액세스 제공
- 그래프와 같이 이해하기 쉬운 형태로 분석 된 데이터 제시
데이터 마이닝의 첫 단계는 비즈니스에 중요한 관련 데이터를 수집하는 것입니다. 회사 데이터는 거래, 비 운영 또는 메타 데이터입니다. 트랜잭션 데이터는 판매, 재고 및 비용 등과 같은 일상적인 작업을 처리합니다. 비 작동 데이터는 일반적으로 예측되는 반면 메타 데이터는 논리적 데이터베이스 디자인과 관련이 있습니다. 데이터 요소 간의 패턴과 관계는 관련 정보를 렌더링하므로 조직의 수익이 증가 할 수 있습니다. 소비자 중심의 강력한 조직은 판매 된 제품, 가격, 경쟁 및 고객 인구 통계에 대한 명확한 그림을 제공하는 데이터 마이닝 기술을 다룹니다.
예를 들어, 소매업 체인 Wal-Mart는 모든 관련 정보를 테라 바이트 단위의 데이터웨어 하우스로 전송합니다. 공급 업체는이 데이터에 쉽게 액세스하여 고객 구매 패턴을 식별 할 수 있습니다. 쇼핑 습관, 가장 많이 구매 한 날, 가장 많이 찾는 제품 및 데이터 마이닝 기술을 사용하는 기타 데이터에 대한 패턴을 생성 할 수 있습니다.
데이터 마이닝의 두 번째 단계는 데이터 마이닝 모델을 생성하는 메커니즘 인 적합한 알고리즘을 선택하는 것입니다. 알고리즘의 일반적인 작업에는 일련의 데이터에서 추세를 식별하고 매개 변수 정의를위한 출력을 사용하는 것이 포함됩니다. 데이터 마이닝에 사용되는 가장 인기있는 알고리즘은 데이터 요소 간의 관계를 식별하는 데 사용되는 분류 알고리즘 및 회귀 알고리즘입니다. Oracle 및 SQL과 같은 주요 데이터베이스 공급 업체는 데이터 마이닝 수요를 충족시키기 위해 클러스터링 및 회귀 트레스와 같은 데이터 마이닝 알고리즘을 통합합니다.