关键词密度(KeywordDensity)也叫关键词频率(KeywordFrequency),实质上是同一个概念,它是指关键词在网页上出现的总次数与其他文字的比例,一般用百分比表明。相关于页面总字数而言,关键词出现的频率越高,那么关键词密度也就越大。
这个比如仅仅一种理想的简化方式,它没有有用包括HTML代码里面的诸如meta标签中的Title、Keywords、Description,图像元素的Alt文本、注释文本等,这些在核算关键词密度时也都要考虑在内的。同时,也要考虑StopWords(可参考停用词表),这些词往往会在很大程度上下降关键词密度。搜索引擎在算法上要比这杂乱得多,但基本战略与此近似。
中文里的词一般由两个或两个以上的中文字符组成,因而,搜索引擎按照某种算法把页面内容划分为若干个中文词汇。例如网页内容为“如何选购笔记本”,被搜索引擎划分为“如何”、“选购”、“笔记本”,则关键词“笔记本”的密度就是1/3,约33%。
而关于词组,一般通过核算组成词组的单词的密度去衡量该词组的密度是否合理。