真心求教:词聚类

来自统计分析、机器学习、模式识别等领域的数据挖掘算法

真心求教:词聚类

帖子duguqiujing » 2010年 1月 19日 14:57

请各位指导一下:毕业论文研究标签(tag)的聚类,由于tag是一个个的单词,有什么好的算法可以处理词聚类吗?标签集合可以通过一些关系生成图状结构。
感激不尽! :D
duguqiujing
 
帖子: 3
注册: 2010年 1月 19日 14:52

Re: 真心求教:词聚类

帖子C6H5NO2 » 2010年 1月 20日 16:30

如果我没理解错的话,我觉得把每个文档看作一个变量,词是否在这个文档里出现用0-1变量表示。
恩,这样数据的维度会很高,楼主自己看看怎么处理吧
头像
C6H5NO2
 
帖子: 291
注册: 2006年 11月 17日 15:30

Re: 真心求教:词聚类

帖子koalaundead » 2010年 2月 3日 18:34

不要用聚类的方法,用关联规则就可以了
koalaundead
 
帖子: 84
注册: 2009年 2月 25日 20:08

Re: 真心求教:词聚类

帖子duguqiujing » 2010年 6月 25日 09:48

koalaundead 写道:不要用聚类的方法,用关联规则就可以了

谢谢你!关联规则可以发现相关标签,但不可以生成一个类簇吧?很希望您可以给点详细的指导~~ :)
duguqiujing
 
帖子: 3
注册: 2010年 1月 19日 14:52

Re: 真心求教:词聚类

帖子koalaundead » 2010年 6月 29日 10:42

见过做tag分类的,这个也大概属于多标签问题,因为tag比较多,你可以参考一下
http://mlkd.csd.auth.gr/publications.asp 这个里面的
Multilabel Text Classification for Automated Tag Suggestion
Clustering Based Multi-Label Classification for Image Annotation and Retrieval
koalaundead
 
帖子: 84
注册: 2009年 2月 25日 20:08


回到 算法讨论

在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客

cron