SEO实战密码:快速诊断网站
发布人:一全科技 来源:站长之家Chinaz.com 发布于:2010-12-22 23:25:42 浏览:703

 

SEO实战密码 电子工业出版社 2011年1月出版)

作者信息:

昝辉,网名Zac,1992年毕业于北京航空航天大学电子工程系,1995年北京电影学院硕士研究生毕业。1997来到新加坡在后期制作公司担任编辑和项目经理等职务。Zac于2006年开始写中文博客《SEO每天一贴》。几个月内《SEO每天一贴》成为中国SEO领域被引用最多,最受欢迎的行业博客之一,很多文章在网上广为流传。

注明:本文由电子工业出版社授权站长之家连载,未经授权请勿转载。文章内容节选自《SEO实战密码》第三章节。

播报:SEO实战密码作者Zac现在正做客ChinaZ论坛探讨SEO (时间:12月22日 16:00-18:00)

详细诊断网站、提出优化方案是本书要解决的问题,本先简单介绍网站快速诊断方法。SEO服务商在刚刚与客户接触时,尤其需要对目标网站做快速检查,发现重要问题。

快速诊断的第一步是检查上一节提到过的、研究竞争对手网站时同样的指标。唯一要加上的是计算页面收录比例,也就是搜索引擎收录页面数与网站实际总页面数之比。站长一定要清楚自己网站上的实际页面总数,如果收录比例在20%~30%,说明网站结构有很大问题,需要改进。达到60%以上才是合格的。

快速诊断的第二步是查看Google网站管理员工具中给出的信息。

http://www.google.com/intl/zh-CN/webmasters/

Google网管工具控制台如图3-31所示。

 

图3-31 Google网管工具控制台

Google网管工具是一个非常好用、非常强大的工具,而且免费,强烈建议所有站长注册。微软必应、雅虎也都有类似工具,不过提供的数据与Google网管工具相比过于简单。百度目前也在内测网管工具。

首先,如果网站有重大问题,如网站被黑、页面有病毒或者网站因为作弊被删除和严重惩罚,Google会在网管工具给站长留言,站长不必猜测到底出了什么问题。

没有严重问题时,站长可以查看下面这些主要内容。

 robots文件检查

整个网站不能收录或某个目录下所有页面都不能收录,经常是因为robots.txt文件差错引起的。网管工具抓取工具权限部分显示出Google所抓取的robots文件内容,如图3-32所示。

 

图3-32 Google网管工具显示robots文件内容

站长也可以在这里试验不同的robots文件指令,然后输入一个网址,测试网址是否可以被收录,或是被禁止,如图3-33所示。

 

图3-33 在Google网管工具测试页面是否被robots文件禁止爬行

robots文件中的任何一个字母差错都可能造成致命影响。有了这个工具,站长可以确保robots文件中的每一行代码正确,不会错误禁止应该被收录的文件或目录。
 

首选域设置

站长可以设置Google应该收录带www还是不带www的网址版本,称为首选域,如图3-34所示。

当然,在Google网管工具设置的首选域对百度等其他搜索引擎完全不起作用。这只是解决Google网址规范化的辅助手段,不能完全依靠这个设置,正确合理的网站结构才是解决问题的根本方法。站长也可以在这部分设置网站目标地理区域。

 

图3-34 Google网管工具设置首选域

关键词排名

在搜索查询部分,网管工具列出网站获得排名的关键词有哪些,并且列出了搜索结果显示次数、点击次数、点击率和平均排名,如图3-35所示。

 

图3-35 Google网管工具显示的关键词排名

在搜索引擎工作原理章节介绍了搜索结果页面前十名结果的点击率,网管工具则列出了网站真实排名及点击数字。这也为SEO人员提供了搜索结果点击分布的另一组数据,可以用于搜索流量预估。不过,要注意的是,网管工具中列出的点击率,很多时候与网站权重、知名度、页面标题标签的写作有很大关系,并不一定符合其他关键词的点击情况。

比如笔者的博客在搜索“网站关键词优化”时,显示在第一位时为1000次,点击率还不到百分之一,如图3-36所示。

 

图3-36 点击率很低的关键词

这与一般搜索结果点击分布相差甚远,说明得到排名的博客帖子与用户搜索意图有一定距离,也可能是因为标题写得不好,造成点击率如此之低。

另外一个关键词“SEO优化”,排在第二位时点击率是9%,排在第三位时为7%,大致正常,如图3-37所示。

 

图3-37 点击率正常的关键词

而另一个搜索词“Zac”,点击率又走向另一个极端,排在第6~10位时点击率高达23%,远远高出一般搜索点击分布,如图3-38所示。

 

图3-38 点击率很高的关键词

这说明搜索“zac”时,有很大一部分用户确实是在寻找笔者的博客。
 

 外部链接

Google的link:指令非常不准确,基本不能用来查看外部链接。网管工具中列出的外部链接则要准确得多,SEO人员可以一目了然地看到自己网站上哪些页面最受欢迎,吸引到最多的外部链接,如图3-39所示。

 

图3-39 Google网管工具显示的外部链接

Google网管工具还列出了外部链接使用的锚文字,网管工具里称为“定位文字”,如图3-40所示。

 

图3-40 Google网管工具显示的外部链接锚文字

这也使SEO人员可以清楚地看到自己想排名的核心关键词是否有足够的外部链接锚文字支持。

可惜网管工具外部链接不能用于查询其他网站,只能看到站长自己认证过的网站数据。

 网站内容

网管工具关键词部分实际上列出的是Google在网站上抓取的最常见关键词,如图3-41所示。显然这些最常见的关键词就反映了网站的内容主题。

图3-41 Google看到的网站最常见关键词

从抓图中可以看到,笔者的博客主体内容大致合理,但是最常出现的两个词却出人意料,一个是Reply(回复),一个是says(说)。这两个英文词是博客评论模板中出现的,每一个评论都会出现Reply和says各一次。当评论条数比较多时,整个网站主体内容产生了一定的偏移,如图3-42所示。

 

图3-42 博客评论中大量出现的“Reply”和“says”

查看这里列出的关键词,对页面尤其是首页的文案撰写和修改有重要意义。

内部链接

内部链接部分列出所有页面的内部链接数,如图3-43所示。

 

图3-43 Google网管工具显示的内部链接

站长从这里可以大致判断网站内部链接结构是否有重大缺陷。如果全站主导航中出现的分类首页内部链接数非常低,很可能说明导航系统有问题。

内部链接数的另外一个作用是反映出网站收录页面数。Google的site:指令也不太准确,而且现在越来越不准确,经常不能反映出收录数字。网管工具中内部链接部分列出的首页内部链接总数,大致上就相当于Google收录的页面总数,因为网站上每一个页面都应该有到首页的链接。
 

抓取错误及统计

抓取错误部分列出404错误(页面不存在)、被robots文件禁止而不能收录的页面等,如图3-44所示。

 

图3-44 Google网管工具显示的404错误

其中404错误对检查网站上是否存在错误链接很有用。对每个404错误,网管工具都列出了到这个网址的链接,如图3-45所示。

如果到不存在页面的链接是网站内部发出的,说明这些链接页面上的链接地址有错误。如果链接向不存在页面的是其他网站,站长可以尝试联系对方更改错误链接到正确位置。

网管工具也列出抓取统计信息。

如图3-46所示,笔者的博客每天抓取页面数平均为400多页,对于一个只有几百篇帖子的博客来说很正常。如果是几十万上百万页面的大中型网站,平均每天抓取几百个页面就太糟糕了,照这个速度,要把整个网站更新一遍,恐怕得好几年时间。大中型网站每天抓取几万页面是最低标准。如果抓取频率太低,SEO人员必须在外部链接建设及网站结构上多下工夫。

图3-46 Google网管工具显示的抓取统计信息

HTML建议

查看Google的HTML建议是寻找网站上可能出现的复制内容的最简便方法,如图3-47所示。

网管工具列出了重复的元说明(也就是说明标签)及标题标签个数和具体页面。笔者的博客存在的重复标题标签如图3-48所示。

 

图3-47 Google网管工具显示的HTML建议

 

图3-48 Google网管工具显示的重复标题标签

标题标签重复,实际上经常意味着这些页面本身内容重复,往往是网站结构造成的。要注意的是,有时候网管工具中列出的数据并不完整,一般来说博客上标题标签重复的页面绝不止两页。

模拟蜘蛛抓取

站长可以输入自己网站上的任何一个网址,网管工具会发出Google蜘蛛,实时抓取页面内容,并显示出抓取的HTML代码,包括服务器头信息和页面代码,如图3-49、图3-50所示。

 

图3-49 通过Google网管工具发出蜘蛛抓取页面

显然这对站长确认转向设置和检查服务器是否正确返回内容很有帮助。

另外,这个工具也可以用来检查页面是否被黑。有的时候黑客放入的代码会检查浏览器类型,如果是用户使用的普通浏览器访问则返回正常内容,如果是搜索引擎蜘蛛访问,才返回黑客加上去的垃圾内容和垃圾链接。所以站长自己访问网站看不出异样,Google蜘蛛抓到的却不是站长自己看到的内容。这个工具可以帮助站长检查页面是否存在安全漏洞。

 

图3-50 蜘蛛抓取到的HTML代码

网站性能

网站速度现在越来越被重视,不仅可能对排名产生影响,对用户体验也有很大影响。网管工具网站性能部分显示出网页平均载入时间,如图3-51所示。

这个网页打开时间并不是Google蜘蛛抓取文件所要花的时间,而是Google工具条记录的普通用户打开页面要花的时间。所以网站服务器地理位置并不影响网站性能部分列出的数据。Google蜘蛛都是从美国发出的,但网站服务器放在中国不意味着比放在美国载入时间要长,因为Google记录的是普通用户访问网站的快慢。

 

图3-51 Google网管工具显示的网站性能