网络蜘蛛虽然不是人,但它同样也有范围,很显然对于如大海般浩瀚的网络世界来说,网络蜘蛛抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎不过是抓取了整个网页数量的40%左右,有很多网页根本无法被收录。因此,要想让网络蜘蛛抓到你,要想让客户能从搜索引擎中找到你的信息,就必须先做好网站收录工作。
笔者一直都认为这个网络蜘蛛很人性化。因此,下面了解一下网络蜘蛛的工作原理。要想网站被百度收录可以从以下八个方面入手。
(1) 向百度提交你的网站,这对新网站而言尤其重要,网络蜘蛛也喜欢认识“新朋友”,像百度提交你的网站就好像你向百度提交你的“名片”一样,让人家记住你。一般情况下,网络蜘蛛会在1~4周的时间对你的网站作出收录回应。提交网站时只要提交网站首页就可以了,没必要提交内容网页,因为只要给网络蜘蛛一个开头,它就会自动爬遍每个“角落”。
百度网站提交网址为:http://ziyuan.baidu.com/linksubmit/url
(2) 适度竞价排名。虽然百度收录只与网页价值有关,与竞价排名等商业因素没多大关系,但如果你的网站还未被百度收录,进行竞价排名不失为一种良策,此时网站犹如在“行贿”一样,提醒百度蜘蛛记住你。
(3) 设置友情链接。这里的友情链接是指有“质量”的友情链接,而不是垃圾链接(垃圾链接太多,反而会让百度蜘蛛生厌,有损网络收录),这个过程犹如从别人的网页上搭“桥”过来。在百度蜘蛛收录别人的同时,顺着“桥”会爬到你的网页中。
(4) 给每个网页加上与正文相关的标题。之所以说百度蜘蛛具有人性,其原因是百度只会收录符合用户搜索体验的网页或网站。给每个网页加上标题,无疑就是为了符合人的阅读习惯,即往往是先看标题是否感兴趣,再决定是否看内容。对于网页标题的设置必须保证标题中的关键词与正文有关,如果是网站首页,那么标题最好是网站的名称或公司的名称,如果是其余页面,标题最好是正文内容的提炼。
(5) 设置最容易提取的网页形态。网络蜘蛛能抓取下来的网页有html、图片、doc、pdf、多媒体、动态网页及其他格式。这些文件抓取下来后,需要把这些文件中的文本信息提取出来,相对而言,doc、pdf等文档比HTML、图片、多媒体等文档更容易提取,静态网页比动态网页更容易提取。
(6) 提高网页的质量。百度蜘蛛更喜欢高质量的网页,因此网页内容最好是原创性文章。如果是复制的文章有可能不会被收录。
(7) 经常保持网站更新。经常更新的网站,网络蜘蛛就会经常光顾,而长期不更新的网站,网络蜘蛛到访会减少。同时,网站的更新时间最好是在工作日的9点到10点,这个时候是网络蜘蛛进行重新梳理的最佳时间,因为百度收录除了机器收录之外,还有人工收录方式。
(8) 如果上述工作都做了,还是没有被百度收录,你也可以发信息到webmaster baidu.com去询问。
本文链接:http://www.wlxin.com/xinwenzhongxin/563.html
官网网址:http://m.wlxin.com
微力互联专注于