Skip to contents

K means clustering

Usage

kMeansClustering(
  data,
  maxK = 15,
  nStart = 25,
  iterMax = 10,
  nBoot = 100,
  algorithm = "Hartigan-Wong",
  selectOptimal = "silhouette",
  seedNum = 6471
)

Arguments

data

전처리가 완료된 데이터

maxK

클러스터링 수행 시 군집을 2, 3, ..., maxK개로 분할 (default: 15)

iterMax

반복계산을 수행할 최대 횟수 (default: 10)

nBoot

gap statictic을 사용해 클러스터링을 수행할 때 Monte Carlo (bootstrap) 샘플의 개수 (selectOptimal == "gap_stat" 일 경우에만 지정, default: 100)

algorithm

K means를 수행할 알고리즘 선택 ("Hartigan-Wong" (default), "Lloyd", "Forgy", "MacQueen")

selectOptimal

최적의 K값을 선정할 때 사용할 method 선택 ("silhouette" (default), "gap_stat")

seedNum

seed값 설정

nstart

랜덤 샘플에 대해 초기 클러스터링을 nstart번 시행 (default: 25)

Details

The function for K means clustering.

parameters for tuning: maxK, nstart