有一些
网站设计技术对搜索引擎来说很不友好,不利于蜘蛛的爬行和抓取,这些技术被称为蜘蛛陷阱。最常见的应该全力避免的蜘蛛陷阱包括如下几个方面。
1.Flash
在网页的某一小部分使用Flash增强视觉效果是很正常的,比如Flash做成的广告、图标等。这种Flash和图片是一样的,只是HTML代码中很小的一部分,页面上海有其他以文字为主的内容,所以对搜索引擎抓取和收录没有什么影响。
但是有的网站整个首页就是一个大Flash文件,这就构成了蜘蛛陷阱。搜索引擎抓取的HTML代码只有一个链向Flash文件的
链接,没有其他文字内容。搜索引擎无法读取Flash文件中的文字内容和链接的。这种网站整个就是Flash网站,可能视觉效果做的精彩异常,可惜搜索引擎看不到,不能索引出任何文字信息,也就无从判断相关性。
有的网站喜欢在首页放一个Flash动画片头,用户访问网站看完片头后被转向真正的HTML版本的文字网站首页。搜索引擎不能读取Flash,一般也没办法从Flash Intro跟踪到HTML版本页面。
近几年,搜索引擎不停尝试读取Flash文件,尤其是里面的文字内容和链接,也取得了一定的进展,。站长可以使用SWFObject和sIFR等技术使Flash文件更易于被搜索引擎读取,不过我的观点是,与其费尽去研究怎么让搜索引擎读取Flash文件,不如做成普通的HTML版本的网站,如果你的公司除了Flash外不足于展现公司实力,那么你的公司应该是世界500强级别,
SEO就不重要了。
整个网站就是一个大Flash文件,从SEO角度来说是万万不可的。如果Flash效果是必须的,至少也在首页加上一个通往HTML版本的链接。这个链接应该是在Flash文件之外的HTML代码中,搜索引擎跟踪这个链接可以抓取后面的HTML版本页面。
2.Session ID
有些网站使用Session ID(会话ID)跟踪用户访问,每个用户访问网站时都会生成独特唯一的Session ID,加在URL中。搜索引擎蜘蛛的每一次访问也会被当成一个新的用户,URL中会加上一个不同的Session ID,这样搜索引擎蜘蛛每次来访问时所得到的同一个页面的URL将不不一样,后面带着一个不一样的Session ID。这也是常见的蜘蛛陷阱之一。
搜索引擎遇到这种长长的Session ID,会尝试判断字符串是Session ID 还是正常的参数,成功判断出Session ID就可以去掉Session ID,收录正常的URL。但也经常判断不出来,要么不愿意收录,要么收录多个带着不同Session ID的URL,内容却完全一样,形成大量的复制内容,这两种情况对
网站优化都不利。
通常建议跟踪用户访问应该使用cookies而不生成Session ID。或者程序判断访问者是搜索引擎蜘蛛还是普通用户,如果是搜索引擎蜘蛛,则不生成Session ID。跟踪搜索引擎蜘蛛访问是没有什么意义的,蜘蛛不会填表,也不会把商品放入购物车。
3.各种跳转
除了301转向外,搜索引擎对其他形式的跳转都比较敏感,如302跳转、JavaScript跳转、Flash跳转、Meta Refresh跳转。
有些网站用户访问首页时会被自动转向某个目录下的页面。如果是按用户地理位置转向至最适合的目录,那到有情可原,但大部分这样的首页转向看不出任何理由和目的,这样的转向能避免则避免。
如果必须转向,301转向时搜索引擎推荐的、用于网址更改转向,可以把页面权重从旧网址转移到新网址。其他转向方式都对蜘蛛爬行不利。黑帽SEO经常使用转向欺骗搜索引擎和用户。所以除非万步得已,尽量不要使用301转向以外的跳转。
网站栏目:企业网站设计应避免的8条(一)
链接地址:
http://chengdu.cdxwcx.cn/article/eiooid.html