K means clustering

Usage

kMeansClustering(
  data,
  maxK = 15,
  nStart = 25,
  iterMax = 10,
  nBoot = 100,
  algorithm = "Hartigan-Wong",
  selectOptimal = "silhouette",
  seedNum = 6471
)

Arguments

data: 전처리가 완료된 데이터
maxK: 클러스터링 수행 시 군집을 2, 3, ..., maxK개로 분할 (default: 15)
iterMax: 반복계산을 수행할 최대 횟수 (default: 10)
nBoot: gap statictic을 사용해 클러스터링을 수행할 때 Monte Carlo (bootstrap) 샘플의 개수 (selectOptimal == "gap_stat" 일 경우에만 지정, default: 100)
algorithm: K means를 수행할 알고리즘 선택 ("Hartigan-Wong" (default), "Lloyd", "Forgy", "MacQueen")
selectOptimal: 최적의 K값을 선정할 때 사용할 method 선택 ("silhouette" (default), "gap_stat")
seedNum: seed값 설정
nstart: 랜덤 샘플에 대해 초기 클러스터링을 nstart번 시행 (default: 25)

Details

The function for K means clustering.

parameters for tuning: maxK, nstart