专利名称 ---【 一种聚类数据的方法和装置 】

基本信息
申请号
CN201310658676.5
申请日
20131206
公开(公告)号
CN104699707A
公开(公告)日
20150610
申请(专利权)人
深圳先进技术研究院
申请人地址
518055 广东省深圳市南山区西丽大学城学苑大道1068号
发明人
范成林;罗军; 专利类型 发明专利
摘要
本发明适用于数据处理技术领域,提供了一种聚类数据的方法和装置,方法包括:从N条样本数据中选取K个数据作为K个类的聚类中心;计算每个聚类中心与0向量的欧几里得距离,并对剩余的每个样本数据,计算非0的维度值与每个聚类中心中与所述非0的维度值对应的维度下的维度值的欧几里得距离,以得出样本数据与聚类中心的距离,并将剩余的样本数据归到最近的聚类中心所在的类;重新计算并更新已经得的各个类下的聚类中心;判断重新计算后的各个类下的聚类中心与计算前的聚类中心是否一致或差值小于预定阈值,若是,则结束聚类。本发明在计算数据到聚类中心的距离时仅需m+1个基本运算操作,在不影响结果的情况下,提高了聚类的速度。
主权项
一种聚类数据的方法,其特征在于,所述方法包括:从N条样本数据中选取K个数据作为K个类的聚类中心;计算每个聚类中心与0向量的欧几里得距离dj,并对剩余的每个样本数据,计算非0的维度值与每个聚类中心中与所述非0的维度值对应的维度下的维度值的欧几里得距离d'i,j,以得出样本数据与聚类中心的距离为并将剩余的样本数据归到最近的聚类中心所在的类;重新计算并更新已经得的各个类下的聚类中心;判断重新计算后的各个类下的聚类中心与计算前的聚类中心是否一致或差值小于预定阈值,若是,则结束聚类。

 

IPC信息
IPC主分类号
G06F17/30

 

法律状态信息
法律状态公告日
20150708
法律状态
发明专利申请公布后的驳回 法律状态信息
CN201310658676 20150610 公开 公开
法律状态公告日
20200508
法律状态
公开 法律状态信息
CN201310658676 20150708 实质审查的生效 实质审查的生效IPC(主分类):G06F 17/30申请日:20131206
法律状态公告日
20150610
法律状态
实质审查的生效 法律状态信息
CN201310658676 20200508 发明专利申请公布后的驳回 发明专利申请公布后的驳回 IPC(主分类):G06F17/30 申请公布日:20150610

 

代理信息
代理机构名称
深圳中一专利商标事务所 44237
代理人姓名
张全文

 

被引专利信息
引用阶段 被引时间 专利号 申请人 公开时间
SEA null CN101055585A LG ELECTRONICS INC [KR] 20071017
SEA null CN101297318A RICOH KK [JP] 20081029
SEA null CN102663100A UNIV XIDIAN 20120912
SEA null EP2120208A1 IBBT VZW [BE], et al 20091118
SEA null US7043500B2 LEARY JAMES F [US] 20060509
SEA null US8346772B2 BHATTACHARYA INDRAJIT [IN], et al 20130101

 

被引非专利信息
引用阶段 被引时间 被引文档类型 被引文档信息


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器