百度搜索引擎优化概念
什么叫做百度搜索引擎优化?
我们要了解两个概念,第一百度搜索引擎,第二优化。
百度搜索引擎:为用户提供检索服务的百度网站,并将检索到的信息展示给用户。
优化:利用百度搜索引擎对网站自身进行优化。
百度搜索引擎工作原理:
百度“派出”蜘蛛(spider)对网络上的网站进行爬行,蜘蛛将爬行到的网站进行抓取,将处理过的页面放到百度数据库(存储),进行预处理,再对页面进行索引,当用户进行百度搜索时,百度根据用户发出的信息(即用户搜索的关键词)对数据库中相关的网站进行匹配,最后将与关键词相关的网站进行排序,展现给用户。
名词解释:
蜘蛛:百度搜索引擎发出的机器人,用来对大量的页面进行抓取。
预处理:蜘蛛将提取到的文字进行中文分词,去重,去停止词,去出噪声。
中文分词:对提取到的文字分成一个个有意义的词语。
去重:去掉与数据库中重复的内容
去停止词:去除啊.额.的.地...这些停止词
去除噪声:去除不相关的内容或者链接
索引:利用的是倒排索引
利用关键词对应文件的形式,将用户搜索的关键词在数据库中进行查找文件,不同的关键词对应多个不同的文件,搜索引擎对文件进行相关度和权重计算,将搜索结果展现给用户。