데이터베이스 데이터베이스에서 지식 발견이란 무엇입니까 (kdd)? -techopedia에서 정의

데이터베이스에서 지식 발견이란 무엇입니까 (kdd)? -techopedia에서 정의

차례:

Anonim

정의-데이터베이스의 지식 발견 (KDD)은 무엇을 의미합니까?

데이터베이스의 지식 발견 (KDD)은 데이터 콜렉션에서 유용한 지식을 발견하는 프로세스입니다. 이 널리 사용되는 데이터 마이닝 기술은 데이터 준비 및 선택, 데이터 정리, 데이터 세트에 대한 사전 지식 통합 및 관찰 결과의 정확한 솔루션 해석을 포함하는 프로세스입니다.

주요 KDD 응용 분야에는 마케팅, 사기 탐지, 통신 및 제조가 포함됩니다.

Techopedia는 데이터베이스의 지식 발견 (KDD)을 설명합니다.

전통적으로 데이터 마이닝 및 지식 검색은 수동으로 수행되었습니다. 시간이 지남에 따라 많은 시스템의 데이터 양이 테라 바이트 크기보다 커져 더 이상 수동으로 유지 관리 할 수 ​​없었습니다. 또한 모든 비즈니스가 성공적으로 존재하기 위해서는 데이터의 기본 패턴을 찾는 것이 필수적입니다. 결과적으로, 숨겨진 데이터를 발견하고 가정을하기 위해 인공 지능의 일부를 형성하는 여러 소프트웨어 도구가 개발되었습니다.

KDD 프로세스는 지난 10 년 동안 정점에 도달했습니다. 여기에는 귀납 학습, 베이지안 통계, 의미 론적 쿼리 최적화, 전문가 시스템에 대한 지식 습득 및 정보 이론을 포함한 다양한 발견 접근 방식이 포함되어 있습니다. 궁극적 인 목표는 낮은 수준의 데이터에서 높은 수준의 지식을 추출하는 것입니다.

KDD에는 여러 분야의 활동이 포함됩니다. 여기에는 데이터 저장 및 액세스, 알고리즘을 대규모 데이터 세트로 확장 및 결과 해석이 포함됩니다. 데이터웨어 하우징에 포함 된 데이터 정리 및 데이터 액세스 프로세스는 KDD 프로세스를 용이하게합니다. 인공 지능은 실험과 관찰에서 경험적 법칙을 발견함으로써 KDD를 지원합니다. 데이터에서 인식 된 패턴은 새 데이터에서 유효해야하며 어느 정도 확실해야합니다. 이러한 패턴은 새로운 지식으로 간주됩니다. 전체 KDD 프로세스와 관련된 단계는 다음과 같습니다.

  1. 고객의 관점에서 KDD 프로세스의 목표를 식별하십시오.
  2. 관련된 응용 프로그램 도메인과 필요한 지식 이해
  3. 감지가 수행 될 대상 데이터 세트 또는 데이터 샘플의 서브 세트를 선택하십시오.
  4. 누락 된 필드를 처리하고 요구 사항에 따라 데이터를 변경하는 전략을 결정하여 데이터를 정리하고 전처리합니다.
  5. 원하지 않는 변수를 제거하여 데이터 세트를 단순화하십시오. 그런 다음 목표 또는 작업에 따라 데이터를 나타내는 데 사용할 수있는 유용한 기능을 분석하십시오.
  6. 숨겨진 패턴을 제안하기 위해 KDD 목표를 데이터 마이닝 방법과 일치시킵니다.
  7. 숨겨진 패턴을 발견하려면 데이터 마이닝 알고리즘을 선택하십시오. 이 프로세스에는 전체 KDD 프로세스에 적합한 모델 및 매개 변수 결정이 포함됩니다.
  8. 분류 규칙 또는 트리, 회귀 및 군집을 포함하여 특정 표현 형식에서 관심있는 패턴을 검색하십시오.
  9. 채굴 패턴의 필수 지식을 해석하십시오.
  10. 지식을 사용하고 추가 조치를 위해 다른 시스템에 통합하십시오.
  11. 그것을 문서화하고 이해 당사자를 위해 보고서를 작성하십시오.
데이터베이스에서 지식 발견이란 무엇입니까 (kdd)? -techopedia에서 정의