网站内容是一件持续性投入的工作,在人力、技术、财力上都需要较大投入,一些站点急功近利探寻捷径,制作了不少垃圾内容,最后被搜索引擎惩罚,可谓得不偿失。
第1、不负责任的采集。第一需要澄清的是,百度说的拒绝采集,指的是很多复制网络上已有内容,对采集的内容不加整理即全部推至线上的“偷懒”行为。对于将采集来的内容进行再加工高效整理后,产出内容丰富的优质网页,百度没拒绝理由。所以,大家说,百度不喜欢不负责任的偷懒采集行为。
第2、伪原创。上面大家说百度不喜欢不负责任的采集,于是有的人开始动起了伪装原创的脑筋。采集内容后对部分关键字进行批量修改,企图让百度觉得这类都是独特内容,然而内容已经是面目全非,甚至没办法读通——这也是百度不喜欢的,风险非常大。还是刚刚说的看法,百度不排斥站点采集内容,重要是怎么样应用采集的内容和数据,怎么样整理成用户和搜索引擎都需要的内容才是网站应该考虑的内容。
第3、站内很多重复内容。不少网站,特别是商业网站,总是用同一个模板,不同页面的主体内容高度相似或相同,仅一些TITLE等标签进行了改变。譬如一些招投标网站,为了让更多的区域得到投标内容,他们制作了很多页面,标题使用区域+内容的方法,而页面的主体内容都是一模一样的。同样仅标题和图片不同,主体内容相对,对于百度搜索引擎来讲,都是站内很多重复内容。
第4、借助与网站无关的热词导流。有的网站,特别是新闻源站点紧盯百度的时效性热词,与自己网站文章的标题进行整理,其实就是大家常说的标题党,如“李娜退役隐情 体育明星豪宅全曝光”,用户点击后自然看不到关于李娜退役隐情的内容。此种行为一经发现,网站会被取消新闻源资格,即便内容真的是原创,也会因此行为遭受牵连。
第5、制作低质静态搜索结果页或TAG标签页。不少网站都使用了将站内搜索结果页转为静态页面的方法,整理站点资源,以期形成有关性得分高的页面。但实质来看,不少站点通过站内搜索或者tag生成的页面有关性并不好,或者说产生了很多对百度搜索结果导致负面影响的页面。假如整个目录都存在这种现象,那样被惩罚的可能性就很大了。
网页标题有关网站制作内容原创的大忌