차례:
정의-K- 평균 군집이란 무엇입니까?
K- 평균 군집화는 군집 문제를 해결하는 데 사용되는 간단한 비지도 학습 알고리즘입니다. 주어진 데이터 세트를 사전에 수정 된 문자 "k"로 정의 된 여러 클러스터로 분류하는 간단한 절차를 따릅니다. 그런 다음 군집을 점으로 배치하고 모든 관측치 또는 데이터 점을 가장 가까운 군집과 연관시키고 계산하고 조정 한 다음 원하는 결과에 도달 할 때까지 새 조정을 사용하여 프로세스를 다시 시작합니다.
K- 평균 군집화는 검색 엔진, 시장 세분화, 통계 및 천문학에서 사용됩니다.
K-Means Clustering을 설명하는 Techopedia
K- 평균 군집화는 특히 데이터 마이닝 및 통계에서 군집 분석에 사용되는 방법입니다. 이는 일련의 관측치를 여러 군집 (k)으로 분할하여 데이터를 Voronoi 셀로 분할하는 것을 목표로합니다. 특정 개체가 실제로 속한 그룹을 찾는 방법으로 간주 할 수 있습니다.
주로 통계에 사용되며 거의 모든 연구 분야에 적용 할 수 있습니다. 예를 들어 마케팅에서는 마케팅 담당자가 다양한 타겟팅 인구 통계를 간단한 그룹으로 그룹화하여 마케팅 담당자가 쉽게 타겟팅 할 수 있습니다. 천문학 자들은이 데이터를 사용하여 엄청난 양의 천문학적 데이터를 조사합니다. 각 개체를 하나씩 분석 할 수 없기 때문에 관찰 및 조사 할 관심 지점을 통계적으로 찾을 수있는 방법이 필요합니다.
알고리즘 :
- K 포인트는 초기 중심 그룹을 나타내는 객체 데이터 공간에 배치됩니다.
- 각 객체 또는 데이터 포인트는 가장 가까운 k에 할당됩니다.
- 모든 객체가 할당 된 후 k 중심의 위치가 다시 계산됩니다.
- 중심 위치가 더 이상 움직이지 않을 때까지 2 단계와 3 단계를 반복합니다.
