큐:
머신 러닝과 데이터 마이닝의 차이점은 무엇입니까?
ㅏ:데이터 마이닝과 머신 러닝은 매우 다른 용어입니다. 그러나 이들은 종종 같은 맥락에서 사용되는데, 이는 당사자들이 통찰과 결론을 도출하기 위해 데이터를 세분화하고 정렬 할 수있는 능력입니다. 유사점과 차이점이 결합되어 기술에 정통하지 않은 청중에게 혼란을주는 두 가지 매우 다른 프로세스에 대해 이야기 할 수 있습니다.
데이터 마이닝은 데이터를 집계 한 다음 더 큰 데이터 세트에서 유용한 데이터를 추출하는 프로세스입니다. 우리가 대량의 데이터를 집계 할 수있게 된 이후로 진행된 지식 발견 유형입니다. 상당히 원시적 인 시스템을 사용하여 데이터 마이닝을 수행 할 수 있습니다. 프로그램은 특정 패턴과 데이터 추세를 찾도록 프로그래밍되며 기술 정보는 그 형태에 관계없이 원시 데이터의 대량으로부터 "마이닝"됩니다.
기계 학습은 더 새롭고 정교합니다. 머신 러닝은 데이터 세트를 사용하지만 데이터 마이닝과 달리 머신 러닝은 신경망과 같은 정교한 알고리즘과 설정을 사용하여 실제로 머신이 입력 데이터에서 학습 할 수 있도록합니다. 따라서 머신 러닝은 데이터 마이닝 작업보다 훨씬 심도 깊습니다. 예를 들어, 신경망에서 인공 뉴런은 계층 적으로 작업하여 입력 데이터를 가져오고 출력 데이터를 릴리스하기 위해 많은 "블랙 박스"활동을 수행합니다 ( "블랙 박스"라는 용어는 신경망 또는 알고리즘이 실제로 작업을 수행하는 방법을 이해하기 어려움).
데이터 마이닝과 머신 러닝은 응용 프로그램과 기업마다 상당히 다릅니다. 다시 말하지만 데이터 마이닝은 주어진 ERP 응용 프로그램과 다양한 프로세스에서 진행될 수 있습니다.
반대로 머신 러닝 프로젝트에는 상당한 리소스가 필요합니다. 프로젝트 관리자는 교육 및 테스트 데이터를 조립하고 과적 합 (overfitting)과 같은 문제를 찾고 특징 선택 및 특징 추출 등을 결정해야합니다. 머신 러닝은 다양한 이해 관계자로부터 복잡한 형태의 바이 인을 요구할 수 있지만, 데이터 마이닝 활동은 일반적으로 빠른 사인 오프 만 필요합니다.
이러한 차이점에도 불구하고 데이터 마이닝과 머신 러닝은 모두 데이터 과학 영역에 적용됩니다. 데이터 과학에 대한 자세한 내용을 이해하면 이해 관계자가 이러한 프로세스의 작동 방식과 특정 산업에 적용 할 수있는 방법에 대해 더 많이 배울 수 있습니다.