很多新手站长网站上线后,经过一个多月的过渡,在搜索引擎上site网站依旧没几个收录,究竟什么原因呢?
重要原因是你网站不符合爬虫的“胃口”,众所周知,爬虫有助于网站提升排名和收录。通常情况下,站长会根据搜索引擎爬虫的“喜好”优化网站内容。
爬虫的工作流之 —— 爬取
爬虫三步走:爬取-索引-收录。网站内容优化以上3个环节的效率,才能真正提高网站的收录与排行。
蜘蛛爬虫从网站权重高往低爬,再者根据链接爬取,该链接的受众程度及权威会影响蜘蛛对网站的喜爱程度,若外链受众度与权威并存的站,那么爬虫对网站的印象分就越高。
爬虫喜欢静态简短的URL,若两个网站的内容相同,爬虫会根据自己的经验(算法),K掉其中一个网站。因此内容页不宜隐藏太深,否则爬虫无法爬到。
小编与某个新站站长交流时,了解到,他用了大量js动态代码把网站做得非常炫酷,这对新站是一个致命的错误,因此他做站3个月,仍旧收录荒凉。指点之下,他把网站改成静态页面,便于搜索引擎的抓取和索引。还有一个注意点,该站长在首页布置了大量冗长的js代码,导致网站加载速度极慢,不利于蜘蛛的爬取。
原因有两个,一个是爬虫在网页停留的时间有限,若加载时间过长会影响抓取效率。举个例子,蜘蛛爬虫只能在网站停留30s,若加载速度花了20s,则只剩下10s来抓取链接,若加载花去了1s时间,则就有29s抓取更多的链接。另一个原因是爬虫功能还不完善,js、iframe的代码会对爬虫起到一定的阻碍作用,建议把复杂的js代码及css代码外调。
爬虫工作流之 —— 索引
索引是指蜘蛛爬取后把该页面放在索引库中,当网民用搜索引擎搜索关键字时,就会显示相应的页面。
页面能否被收录的条件有两个,一个是页面内容质量,另一个是网站权重。
页面内容质量取决于用户的喜欢程度,如点击率、跳出率、评论等,其次内容上不得与索引库中的内容重复,否则会被判断为重复页面,不再收录,因此原创才能混口饭吃呀。
提升排名的重要因素是页面权重和内容的相关性
爬虫判断页面的相关性是根据该页面的锚文本,爬虫现在可傲娇了,keywords都不关注了,主要侧重title和H1标签上的内容。关键词的密度也是影响页面相关性的重要因素之一,因此在关键词的布置上要合理。
页面权重是搜索引擎给网页的权威值,权重值由网站域名类型、网站架构、网站内容、外链等决定。
站长可以根据网民使用的搜索引擎偏好做收录
有搜索结果才能满足网民的搜索需求,而搜索结果则有搜索引擎决定,每个搜索引擎的算法规则不同,针对性的在大众搜索引擎上花功夫研究想必效果会更好。
还木有评论哦,快来抢沙发吧~