网赚论坛

 找回密码
 免费注册
查看: 234|回复: 0
打印 上一主题 下一主题

搜索引擎对页面的分词取决于词库的规模

[复制链接]

21

主题

47

帖子

84

积分

Ⅰ级财主

Rank: 1

积分
84
跳转到指定楼层
楼主
发表于 2017-9-13 18:04:36 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
搜索引擎对页面的分词取决于词库的规模、准确性和分词算法的好坏,而不是取决于页面本身如何,所以SEO人员对于分词所能做的很少。唯一能做的是在页面上用某种形式提示搜索赢取,某几个字应该被当作一个词处理,尤其是可能产生歧义的时候,比如在页面标题、H1标签及黑体中出现关键词。如果页面是“重庆SEO优化”,而我们的关键词是SEO优化,那么就可以把“SEO优化”这几个字特意标为黑体。如果我们的关键词是重庆SEO那么我们就应该把“重庆SEO”这两个词标为黑体。这样搜索引擎对页面进行分析时就知道为黑体的应该是一个词。
无论是英文还是中文,页面内容都会出现一些频率很高,却对内容没有任何影响的词,如“的”“地”“得”之类的助词,“啊”“哈”“呀”之类的感叹词,“从而”“以”“却”之类的副词或介词。这些词被称为停顿词,因为他们对页面的主要意思没什么影响。英文中的常见停顿词有zhe,a,an,to,of等。搜索引擎在搜索页面之前会去掉这类词语,使索引数据主题更为突出,减少无谓的计算量。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

广告合作|Archiver|手机版|小黑屋|财富吧

GMT+8, 2024-11-26 20:46 , Processed in 0.499201 second(s), 36 queries , Gzip On.

Powered by Discuz! X3.1

© 2014-2021 财富吧

快速回复 返回顶部 返回列表