在对小说程序优化的修改过程中,我分析了下baidu和google分别收录网页的共同点和区别.
相同的一大特点:对<h*>识别程度很高,在识别了<h*>之后再对网页的内容做抓取.
实列:http://www.biluotian.cn/的showbook.asp页面内容
http://www.biluotian.cn/showbook.asp?bl_id=114967
http://www.biluotian.cn/showbook.asp?bl_id=101600
.....
先识别标题然后抓取大概200个字符串,在www.google.cn上输入:site:biluotian.cn 就可以查询收录了.
同样在baidu上进行搜索一样的效果,在www.baidu.com上输入:site:biluotian.cn 就可以查询收录了.
注意:分析页面 META 信息并给出最佳优化建议。最佳建议:标题 ≦80,关键字 ≦100,描述≦200。
现在有点还不太清楚,description这个识别程度到底有多大还不得知.









最新评论
春节快乐啊^_^兄弟
呵呵,路过,顶一下。
老衲已阅
不错的站,路过看下
来拜访啦,呵呵,留名纪念
闲逛到此,留下印记。顶一下。
路过~~留痕
多少支持一下