K-means聚类-白红宇

K-means聚类

阅读量：6209 次

发布时间：2019-06-21

本文共 366 字，大约阅读时间需要 1 分钟。

给定样本集D={x1,x2,x3,...xm},K-means算法划分所得簇C={c1,c2,c3,...,ck}的最小平方误差，k表示将数据划分为K簇

E=∑_{i=1 to k}∑_x->ci||x-ui||₂

ui为簇中心，ui=∑_x->cix/|ci| 其中|ci|表示该簇中的样本数，直接计算上面的表达式是很困难的，因此，K-means采用贪心策略

算法如下：

1 随机选取k个样本作为簇中心{u1,u2,...,uk}

2 初始化所有的簇均为空

3 计算每个样本与各个簇中心的欧式距离，如果样本xi与簇中心ui的距离最近，那么将该样本划归该簇

4 经过一次迭代后，更新簇中心ui=∑_x->cix/|ci|

5 知道聚类结果不再改变

转载于:https://www.cnblogs.com/semen/p/6815256.html

你可能感兴趣的文章

代码大全

查看>>

DataTable.ImportRow()与DataTable.Rows.Add()的区别

查看>>

程序集、应用程序配置及App.config和YourSoft.exe.config .

查看>>

二叉树的基本操作及应用（三）

查看>>

朱晔和你聊Spring系列S1E3：Spring咖啡罐里的豆子

查看>>

IOS CALayer的属性和使用

查看>>

温故而知新：柯里化与 bind() 的认知

查看>>

Django REST framework

查看>>

CSS 如何让Table的里面TD全有边框而Table的右左边框没有

查看>>

apache 虚拟主机详细配置：http.conf配置详解

查看>>

BABOK - 开篇：业务分析知识体系介绍

正则表达式匹配常用手机号（13、15\17\18开头的十一位手机号）

查看>>

GitLab 11.9 正式发布，自动化工具 ChatOps 已开源

查看>>

android baidupush

查看>>

“陪护机器人”研报：距离真正“陪护”还差那么一点

查看>>

深入框架本源系列 —— Virtual Dom

查看>>

您有一个上云锦囊尚未领取！

查看>>

Java Web的web.xml文件作用及基本配置（转）

查看>>