K-mean与高斯混合模型:K-means算法和EM算法的差别在哪里?
答:CSDN博主JpHu说,K-Means算法对数据点的聚类进行了“硬分配”,即每个数据点只属于唯一的聚类;而GMM的EM解法则基于后验概率分布,对数据点进行“软分配”,即每个单独的高斯模型对数据聚类都有贡献,不过贡献值有大有小。
内容参考自http://www.jeyzhang.com/text-classification-in-action.html
本文的话题老生常谈,文本分类应该是很多NLPer非常常遇到和熟悉的任务之一了,下面总结一下博主在处理这类任务的过程中特征工程方面的经验,希望对各位NLP入门者或者在做此类任务的新手有所帮助。对于其他的文本处理任务,也会有一定的参考意义。
浙江大学, 计算机学院, 硕士研究生
研究方向:自然语言处理与深度学习
Standing on the shoulders of giants
Laws of motion, gravitation, minting coins, disliking Robert Hooke
Cooling, power series, optics, alchemy, planetary motions, apples.
1654-1660
The King’s School, Grantham.
June 1661 - now
Trinity College, Cambridge
1667 - death
Trinity College, Cambridge
2012
President, Royal Society, London, UK
Associate, French Academy of Science, Paris, France
1669
Newton Sir I, De analysi per æquationes numero terminorum infinitas.
1669
Lectiones opticæ.
etc. etc. etc.
2012
Infinitesimal calculus for solutions to physics problems, SMBC patent 001
1600
Royal Mint, London
1600
Lucasian professor of Mathematics, Cambridge University