首先,我们需要知道是什么导致了新网站的收集?一般来说,百度对新网站的渴望还是很大的。如果一个新网站的网页设计比较新颖,内容也很好,一般不会有大问题,但是这些网站的内容很难深度收录。要了解新网站收录难的真正原因,首先要从百度蜘蛛的工作原理分析入手。
一般来说,当搜索引擎包含网站内容时,它首先通过一个特殊的URL链接访问程序来访问网络,这个程序被称为所谓的蜘蛛,也被称为机器人。蜘蛛的头衔更生动,因为互联网本身就是一个相互连接的蜘蛛网,蜘蛛可以通过蜘蛛网爬行到各个地方,而蜘蛛程序具有这种通过爬行的功能。
如果你的网站能被蜘蛛爬得越多,那么包含它的可能性就会急剧增加。对于百度搜索引擎,百度蜘蛛通常从自己的产品开始,如百度贴吧、空间或百科全书,然后通过相关网站。然后通过互联网上的一些大型门户网站,如网易、新浪、天涯、猫扑等,作为整个互联网的结点。如果你的网站能很快通过,这意味着你的网站重量相对较高,曝光率较高,那么包含它的可能性就越高。
蜘蛛包含内容有两种主要策略,即广度优先和深度优先。所谓的广度优先是抓取一个页面的所有链接,然后找到下一个页面,然后抓取页面的所有链接,这显然可以一次抓取更多的链接,所以速度更快。
深度优先是从网站的主页开始,分析主页的下一个栏目页面,然后分析栏目页面下面的主题页面,分析主题页面下面的内容页面,通过逐步下降的方式,当深度链接完成时,到主页,所以速度相对较低,但可以更全面地了解网站的内容。
由于搜索引擎普遍存在商场网站的差异,决策者将更多的努力应用到品牌建设、推广、规划等方面。商场网站页面量很大,可收录量往往很差。如果内页不能满足基本收录要求,怎么能谈流量呢?除非你能塑造淘宝这样的大品牌,即使网站被设置为禁止百度索引,否则你仍然会坐在电子商务的一兄弟的位置。当然,这是后话。即使是京东商城和拍拍网也会在收录上下大功夫,获得更多的搜索引擎流量。因此,优化商城网站重要的一步就是提高收录率。
在谈到如何提高包容性之前,让我们分析一下影响这类网站包容性的主要原因?搜索引擎对新鲜页面非常感兴趣,这是影响包容性的重要原因。许多基于开源程序的购物中心网站页面重复率太高,很难引起搜索引擎的兴趣。
一、图片太多,图文混排
为了更丰富的字体效果,许多产品详细信息页面介绍文本集成在图片中,所以产品介绍页面是一个接一个的大图片。这种情况对用户影响不大,但对搜索引擎来说很麻烦!搜索引擎无法识别图片,也就是说,无论图片有多漂亮,无论图片中的文本介绍有多详细,它都是一行图片路径链接。
二、忽略了对商品介绍文字的修改
在网站内容优化中,非常注重收集到的内容的伪静态处理。完全相同的单词很难逃脱搜索引擎的眼睛,购物中心网站页面大多是自动生成的,页面数量也很大,许多网站自然忽略了商品内容描述文本的一些变化。
三、模板内容反复调用
购物说明书、退货保证等内容经常放在商场网站的内页,这些都是直接在内页调用的好板块。当搜索引擎关心页面的重复性时,他们比较所有的html代码。产品介绍页面本身不会有太多的文字。如果这些页面的头部和底部占用了太多的字节,搜索引擎将误判为重复页面不包括在内。
Copyright © 2008-2016 渝ICP备13002463号-8
渝公网安备 50010602501109号
版权所有:重庆卓光科技