차례:
정의-데이터베이스의 지식 발견 (KDD)은 무엇을 의미합니까?
데이터베이스의 지식 발견 (KDD)은 데이터 콜렉션에서 유용한 지식을 발견하는 프로세스입니다. 이 널리 사용되는 데이터 마이닝 기술은 데이터 준비 및 선택, 데이터 정리, 데이터 세트에 대한 사전 지식 통합 및 관찰 결과의 정확한 솔루션 해석을 포함하는 프로세스입니다.
주요 KDD 응용 분야에는 마케팅, 사기 탐지, 통신 및 제조가 포함됩니다.
Techopedia는 데이터베이스의 지식 발견 (KDD)을 설명합니다.
전통적으로 데이터 마이닝 및 지식 검색은 수동으로 수행되었습니다. 시간이 지남에 따라 많은 시스템의 데이터 양이 테라 바이트 크기보다 커져 더 이상 수동으로 유지 관리 할 수 없었습니다. 또한 모든 비즈니스가 성공적으로 존재하기 위해서는 데이터의 기본 패턴을 찾는 것이 필수적입니다. 결과적으로, 숨겨진 데이터를 발견하고 가정을하기 위해 인공 지능의 일부를 형성하는 여러 소프트웨어 도구가 개발되었습니다.
KDD 프로세스는 지난 10 년 동안 정점에 도달했습니다. 여기에는 귀납 학습, 베이지안 통계, 의미 론적 쿼리 최적화, 전문가 시스템에 대한 지식 습득 및 정보 이론을 포함한 다양한 발견 접근 방식이 포함되어 있습니다. 궁극적 인 목표는 낮은 수준의 데이터에서 높은 수준의 지식을 추출하는 것입니다.
KDD에는 여러 분야의 활동이 포함됩니다. 여기에는 데이터 저장 및 액세스, 알고리즘을 대규모 데이터 세트로 확장 및 결과 해석이 포함됩니다. 데이터웨어 하우징에 포함 된 데이터 정리 및 데이터 액세스 프로세스는 KDD 프로세스를 용이하게합니다. 인공 지능은 실험과 관찰에서 경험적 법칙을 발견함으로써 KDD를 지원합니다. 데이터에서 인식 된 패턴은 새 데이터에서 유효해야하며 어느 정도 확실해야합니다. 이러한 패턴은 새로운 지식으로 간주됩니다. 전체 KDD 프로세스와 관련된 단계는 다음과 같습니다.
- 고객의 관점에서 KDD 프로세스의 목표를 식별하십시오.
- 관련된 응용 프로그램 도메인과 필요한 지식 이해
- 감지가 수행 될 대상 데이터 세트 또는 데이터 샘플의 서브 세트를 선택하십시오.
- 누락 된 필드를 처리하고 요구 사항에 따라 데이터를 변경하는 전략을 결정하여 데이터를 정리하고 전처리합니다.
- 원하지 않는 변수를 제거하여 데이터 세트를 단순화하십시오. 그런 다음 목표 또는 작업에 따라 데이터를 나타내는 데 사용할 수있는 유용한 기능을 분석하십시오.
- 숨겨진 패턴을 제안하기 위해 KDD 목표를 데이터 마이닝 방법과 일치시킵니다.
- 숨겨진 패턴을 발견하려면 데이터 마이닝 알고리즘을 선택하십시오. 이 프로세스에는 전체 KDD 프로세스에 적합한 모델 및 매개 변수 결정이 포함됩니다.
- 분류 규칙 또는 트리, 회귀 및 군집을 포함하여 특정 표현 형식에서 관심있는 패턴을 검색하십시오.
- 채굴 패턴의 필수 지식을 해석하십시오.
- 지식을 사용하고 추가 조치를 위해 다른 시스템에 통합하십시오.
- 그것을 문서화하고 이해 당사자를 위해 보고서를 작성하십시오.