博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
K-means聚类
阅读量:6209 次
发布时间:2019-06-21

本文共 366 字,大约阅读时间需要 1 分钟。

给定样本集D={x1,x2,x3,...xm},K-means算法划分所得簇C={c1,c2,c3,...,ck}的最小平方误差,k表示将数据划分为K簇

                   E=∑i=1 to kx->ci||x-ui||2

ui为簇中心,ui=∑x->cix/|ci|  其中|ci|表示该簇中的样本数,直接计算上面的表达式是很困难的,因此,K-means采用贪心策略

 

算法如下:

1 随机选取k个样本作为簇中心{u1,u2,...,uk}

2 初始化所有的簇均为空

3 计算每个样本与各个簇中心的欧式距离,如果样本xi与簇中心ui的距离最近,那么将该样本划归该簇

4 经过一次迭代后,更新簇中心ui=∑x->cix/|ci|

5 知道聚类结果不再改变

 

转载于:https://www.cnblogs.com/semen/p/6815256.html

你可能感兴趣的文章
代码大全
查看>>
DataTable.ImportRow()与DataTable.Rows.Add()的区别
查看>>
程序集、应用程序配置及App.config和YourSoft.exe.config .
查看>>
二叉树的基本操作及应用(三)
查看>>
朱晔和你聊Spring系列S1E3:Spring咖啡罐里的豆子
查看>>
IOS CALayer的属性和使用
查看>>
温故而知新:柯里化 与 bind() 的认知
查看>>
Django REST framework
查看>>
CSS 如何让Table的里面TD全有边框 而Table的右左边框没有
查看>>
apache 虚拟主机详细配置:http.conf配置详解
查看>>
BABOK - 开篇:业务分析知识体系介绍
查看>>
Java入门系列-22-IO流
查看>>
垃圾回收算法优缺点对比
查看>>
正则表达式 匹配常用手机号 (13、15\17\18开头的十一位手机号)
查看>>
GitLab 11.9 正式发布,自动化工具 ChatOps 已开源
查看>>
android baidupush
查看>>
“陪护机器人”研报:距离真正“陪护”还差那么一点
查看>>
深入框架本源系列 —— Virtual Dom
查看>>
您有一个上云锦囊尚未领取!
查看>>
Java Web的web.xml文件作用及基本配置(转)
查看>>