admin
2015-11-05 09:54:27
47
1、提取文字
由于搜索引擎蜘蛛抓取的是页面的HTML代码,里面包含了大量的HTML标签、js等无法用到排名上的内容,所以搜索引擎索引首先要做的就是那其中的HTML标签、js去掉,保留剩下的页面文字内容。
2、中文分词
中文分词是搜索引擎特有的步骤,英文单词之间会有空格做分隔,而中文词与词之间没有分隔符号,一个句子字与词都是连在一起的。中文搜索引擎必须首先分辨那几个字组成一个词,那些字本身就是一个词。
3、去停止词
在页面内容中会存在很多对内容没有影响的词,比如“的”、“之”、“啊”之类。搜索引擎在索引时会把这些词去掉,让页面内容的主题更突出。
4、去重(为什么伪原创弊大于利)
搜索引擎为了减少搜索结果中出现的重复内容会选取页面内容中出现频率最高的词,通常会选出10个左右关于页面的关键词来计算页面的“指纹”。
5、索引
经过以上步骤之后,搜索引擎就可以提炼出可以代表一个页面内容的一些关键词,同时记录这些词在网页上出现的频率、出现次数、格式、位置等信息。
6、链接关系计算
在页面中存在连接时,搜索引擎会计算这些链接都只想那些页面,每个页面都有哪些导入链接,链接使用了什么文字,这些复杂的链接指向关系形成了网站和页面的链接权重。
7、页面质量判断
在这个阶段,搜索引擎会对页面内容质量、链接质量等作出判断,比如百度的绿萝、石榴算法。
北京网站优化不再是简单的发发外链,更新站内内容就可以的,需要我们深入去研究做网站优化的。网站想要有排名有好的排名是很难做的。北京高端网站建设公司提醒您,做网站优化一定要多方学习参考。做网站优化,一定要了解搜索引擎是如何工作的。
文章出自:北京网站建设公司-前潮网络 http://www.qcw100.com 如需转载请注明,010-57227103.
碳市场全面提速,你的碳资产管理能力还停留在...
全国碳市场扩容、CCER重启、欧盟碳关税落地——碳资产正在从“合规成本”变成“核心资产”。但现实中,大量企...
2026-04-23
从千问打车看AI出行新风口:北京AIAPP开发如...
3月23日,千问上线打车能力,用户通过自然语言输入即可完成选车型、添加途经点、预约时间等操作,该功能甚至支持&...
2026-03-26
北京AI教育APP开发指南:如何选择专业的人工...
在人工智能浪潮席卷各行各业的今天,教育领域的智能化转型已成为不可逆转的趋势。对于身处科技创新中心的北京...
2026-03-25
北京AIAPP开发如何选型?从技术能力到行业经...
北京AIAPP开发公司怎么选?前潮科技用18年经验给你答案要说咱北京的人工智能APP开发公司,那可真是藏龙卧虎,不少...
2026-03-24
