一个纯采集网站站长的SEO、采集、运维经验总结

此页面是否是列表页或首页?未找到合适正文内容。

一个纯采集网站站长的SEO、采集、运维经验总结

 
企业怎么做品牌推广 七夕来了好推有礼!

  我是一个纯采集网站站长,下面的这些总结,有些是关于SEO,有些是关于采集和运维,都是很基础的个人见解,仅作分享,请自辨好坏是非,实践出真知。

  原创内容好还是采集内容好?

  当然是原创好,因为百度是这么说的,谁叫人家是裁判。

  为什么我原创了很多文章,还是不被收录?收录了没好的排名?

  一个搜索引擎,它的核心价值是要为用户提供他/她最需要的结果。搜索引擎是有统计网民需求的,对于网民需求量小或者几乎没有需求的内容,即使你是原创也可能被搜索引擎忽略,因为它不想浪费资源在无意义的内容上。

  对网民需求量大的内容,收录应该会比较多、比较快,但是,正因为收录多,即使你是原创,也可能很难挤进排名。

  搜索引擎统计网民需求以什么来标识?

  关键词。每一个人搜索一个关键词时,就表明他/她对这个词相关的内容有需求。而且,使用搜索引擎的人,通常是有问答需求、检索查询需求。当然搜索引擎内部肯定有非常庞大的分析系统,对这些需求进行精确的定位,详见百度指数。比如搜索的关键词是“手机”,很有可能是想要买手机或者查某款的价格,也可能只是想要下载漂亮的壁纸。但是,如果是想要壁纸,就会有更精确的关键词“手机壁纸”,以下拉框或者相关搜索的形式呈现出来。

  既然原创内容好,为什么要采集?

  1. 虽然原创好,但只要方法适当,采集的效果并不会比原创差多少,甚至比没掌握到方法的那些原创好很多。

  2. 精力有限,原创很难保证长期大量更新,如果请个编辑,投入产出比可能是负数。

  市面上采集器那么多,应该用哪个好?

  每个采集器都有它的独特之处,所谓存在即合理。请根据自己的需求来选择即可。我的采集器是自己开发的,开发的过程中考虑了以下几方面,使用其他采集器的也可作参考:

  1. 直接提供已分类的海量关键词,这些关键词都是百度已经统计的有网民需求的词(有百度指数),或者是这些词的长尾词,来自百度下拉框或相关搜索。

  2. 直接按关键词采集,智能分析网页正文进行抓取,不需要自己写采集规则。

  3. 抓取到的正文经过规范的标签清理,段落全部以

  标签呈现,乱码一律去除。

  4. 根据采集到的内容自动配图,图片一定是与该内容相关度非常高的。以这种方式代替伪原创,既不影响可读性,又使文章图文并茂,做到比原创所提供的信息更丰富。

  5. 正文内容中的关键词自动加粗,也可自定义要插入的关键词。但没有做句子重排、段落重排等影响可读性的所谓“伪原创”功能。

  6. 可直接使用关键词和其相关词组合作为标题,也可抓取目标网页标题。

  7. 可进行微信文章采集。

  8. 不用触发或者挂机。

  9. 集成百度站长平台主动推送,加快收录。

  不同的网站程序,比如织梦、WordPress、dz、zblog、帝国cms或者其他,对SEO有什么影响?

  理论上没有影响。因为搜索引擎并不知道你是什么程序,或者它可以通过一些规则识别出来,也不可能因为程序本身的不同而影响它的判断。

  那什么会影响SEO呢?答案是模板。因为基本上这些程序都有模板机制,同样程序可以输出不同的页面,不同的程序也可以输出同样的页面,这就是模板。模板确定之后,你的每一个页面就按照这个框架来输出,也就是整个html结构已经确定。而这些html,正是搜索引擎要重点关注的,它得从这些html中得到它想要的信息。因此,一套好的模板非常重要。

  页面模板设计应该注意哪些细节?

  1. 权重结构顺序。整个页面的html中(注意是html,而不是显示出来的版面),越靠前的位置,权重越高。由此引申出来,“title”、keyword、description三个标签,因为最靠前,权重最高。其次通常是导航,也是基本上是最靠上的,权重也非常高。再次就是文章标题和正文。这是根据html的前后来排序的。

  2. 因为搜索引擎首先要遵循W3C标准,所以,W3C定义的一些本来就是用来表示重要信息的标签,权重自然就高,比如,特别是h1,用来表示当前页面最重要的信息,一般每个页面只能有一个,其权重估计与title相当,也通常是用来放当前页面的标题,当然也有为了提高首页权重,用h1来放置logo或首页链接,都是可以的。另外还有em、strong这样的标签,用来表示强调,一般认为strong权重高于标签,同样也是加粗作用,但我们认为从SEO的角度看是没有权重加强的。

作者: 雨林木风

为您推荐

返回顶部