上一篇文章,我们分享了Google 搜索要素 ,文章里讲了Google搜索技术的三大核心要求,这篇文章就展开讲讲这三大核心要求的详情。
Google官方的文档是这么写的:
只要您的网页满足以下最低技术要求,就可以被 Google 搜索编入索引:
Googlebot 未被屏蔽。
网页可正常运行,这意味着 Google 会收到 HTTP 200 (success) 状态代码。
网页包含可编入索引的内容。
详细分解一下这三个要求:
这三个要求,前面两个是网站主手握主动权,但也包含一下几个问题:
在 robots.txt 设置中,允许Google爬虫蜘蛛访问网站;
可以在robots.txt 里设置哪些目录可以被Google爬虫蜘蛛访问,哪些不让访问;
网站长期稳定运行,不能隔三岔五的无法访问。 加入您卖的是一个工业产品,你在自己的网站上介绍产品的特点,产品的使用详情和应用场景。网站在开始的第一年稳定访问,这篇文章因为高质量,能给想购买这款产品的用户提供了完全有用的信息,被Google收录,在产品关键词搜索结果展示页面,排在自然搜索结果展示的第二名,获得了来自Google稳定的流量,但后期随着流量越来越大,网站主机配置捉襟见肘且没有优化维护,网站开始出现不稳定的情况,间断性不能访问的情况越来越频繁。依然有来自Google源源不断的流量,但来自全世界的访客通过Google的搜索结果展示链接点击,经常会无法访问你的链接。这种情况下访客会抱怨Google为什么把这么搞的排名给一个无法访问的网站。这种情况最终会被Google监测到,如果无法访问的情况依然无法改善,Google会对网站做降权处理,这个产品关键词的搜索结果展示排名会越来越靠后,直至消失。
网页包含可编入索引的内容 :这句话最直接的理解就是,你网站上面的文章要能帮助到用户,如果不能帮助用户答疑解惑,也不能给用户提供有效的帮助,那么这篇文章对Google来说就毫无价值,就不会被收录,这句话说的好听点是网站和Google的双向选择,其实主动权完全在Google。
上面的三点核心要素,都是可以量化的,通过Google搜索控制台监控,把所有的设置可视化,所有的指标数据化。
后续贝特威也会分享Google搜索控制台的文章。